에피소드

[과학향기 for Kids] “어떤 일이든 맡겨줘!” 마법 같은 생성형 AI의 비밀은?

<KISTI의 과학향기> 제3062호   2024년 05월 20일
여러분은 챗GPT와 같은 생성형 인공지능(AI)을 사용해 본 적 있나요? 생성형 AI는 마치 선생님처럼 우리가 모르는 걸 불과 몇 초 만에 설명해 줍니다. 또 숙제에 필요한 사진이나 동영상이 없을 때, 생성형 AI로 만들어 낼 수도 있어요. 심지어 생소한 외국어를 번역해 자동으로 영화 자막을 만들어 낼 수도 있고, 여러분과 가벼운 농담도 주고받을 수 있어요. 생성형 AI가 이렇게 다양한 능력을 뽐낼 수 있는 이유는 바로 ‘거대언어모델(LLM, Large Language Model)’ 덕분입니다. 그렇다면 LLM은 어떻게 우리가 원하는 자료를 한 번에 만들어 낼까요? 
 
사진1
그림 1. 거대언어모델은 생성형 인공지능의 핵심 기술이다. ⓒshutterstock
 
동화 속 ‘마법의 거울’이 실존한다?
 
동화 <백설공주>에선 여왕이 마법의 거울에 “이 왕국에서 가장 아름다운 사람은 누구지?”라는 질문을 던지자, 거울이 “백설공주입니다”라고 답합니다. 생성형 AI의 핵심 기술인 LLM도 마치 ‘마법의 거울’처럼 사람들의 질문에 대한 정보를 제공해요.
 
사진2
그림 2. LLM은 마치 <백설공주> 속 마법의 거울처럼 우리에게 필요한 정보를 제공한다. ⓒshutterstock
 
다만 마법의 거울은 ‘마법’을 이용해 가장 아름다운 사람이 누구인지 알아내지만, LLM이 정보를 제공하기 위해선 온라인 웹사이트부터 책, 논문, 신문 기사 등 다양한 자료를 수집해야 합니다. 수집한 자료를 바탕으로, ‘고양이’와 ‘야옹’이 어떤 연관성을 가지는지, ‘배’나 ‘눈’처럼 다양한 뜻을 가진 단어가 상황에 따라 어떤 뜻으로 사용되는지 학습해요. 이렇게 다양한 정보를 학습한 LLM에 질문을 던지면, 마치 마법의 거울처럼 답변할 수 있게 돼요.
 
다만 LLM은 정답만 말하는 마법의 거울과 달리 그럴듯한 거짓말도 지어냅니다. 이를 ‘환각 현상’이라고 불러요. 예를 들어 챗GPT에 ‘울릉도에서 유명한 프랑스 요리 식당 5곳을 소개해달라’고 말하면, 챗GPT는 울릉도에 없는 식당을 가상으로 만들어 소개합니다.
 
사진3
그림 3. 챗GPT에 울릉도의 프랑스 식당을 소개해달라고 요청한 결과, 존재하지 않는 곳을 소개했다. ⓒOpenAI 캡쳐
 
왜 이런 현상이 나타나는 걸까요? LLM은 모든 정보를 알지 못하며 때로는 잘못된 정보를 학습할 수 있기 때문입니다. 예컨대 LLM이 ‘지구는 사실 평평하다’는 글을 읽고, 이 내용을 학습하면 지구가 평평하다고 말할 가능성이 생깁니다. 또한 LLM은 질문의 주제를 파악한 후, 주제와 관련된 단어를 연결하는 방식으로 답을 내놓는데요. 이 과정에서 정확한 정보를 전달하는 것보다 자연스러운 문장을 구사하는 데 더 집중합니다. 그로 인해 엉뚱한 대답을 내뱉는 거예요.
 
그 결과, LLM을 사용하는 생성형 AI는 10번 중 3번은 환각 현상을 일으키고 있습니다. 그러므로 LLM이 잘못된 정보를 생성하지 않도록 만드는 것이 앞으로의 큰 숙제입니다. 환각 현상이 일어나는 가장 큰 이유는 AI가 불완전하고 부정확한 데이터를 학습하기 때문이에요. 즉 정확한 자료를 학습하면 환각 현상을 줄일 수 있죠. 혹은 AI가 질문에 응답하기 전, 검색을 통해 정확한 답변이 맞는지 확인하는 ‘검색증강생성(RAG)’ 기술을 활용하는 것도 해결책 중 하나입니다. 실제로 많은 기업에서 정확한 학습자료와 검색증강생성 기술을 활용해 환각 현상을 줄여나가고 있습니다. 챗GPT의 최신 버전인 ‘GPT-4’의 경우 환각 현상이 많이 줄어들었다고 해요.
 
실제로 많은 기업에서 정확한 학습자료와 검색증강생성 기술을 활용해 환각 현상을 줄여나가고 있습니다. 챗GPT의 최신 버전인 ‘GPT-4’의 경우 환각 현상이 많이 줄어들었다고 해요. 최근 한국과학기술정보연구원(KISTI)이 개발한 ‘KONI(고니) ’도 환각 현상을 크게 줄인 LLM입니다. KONI는 KISTI가 가진 방대한 과학기술정보 데이터를 학습자료로 활용해 과학기술데이터에 특화돼 있다는 것이 특징인데요. 앞으로 KONI의 학습 데이터를 계속해서 늘려, 실제 연구 활동에서도 활용할 수 있도록 확대할 예정입니다.
 
앞으로 LLM을 기반으로 한 생성형 AI는 제조업, 게임, 가전제품부터 재난 대응에 이르기까지 다양한 분야에 이용될 예정입니다. 그만큼 우리의 삶과 LLM은 더욱더 가까워질 거예요. 생성형 AI가 바꿔놓을 미래의 모습을 기대해 봐요!
 
0516인공지능 250x250

 
 
※ 교과서 연계 - 이번 과학향기 에피소드는 어떤 교과 단원과 관련돼 있을까? 

5학년 1학기 도덕 - 밝고 건전한 사이버 생활
6학년 실과 - 소프트웨어와 생활
 
글: 남예진 동아에스앤씨 기자 / 일러스트: 감쵸 작가
 
평가하기
온 세상을
  • 평점   별 4점

입에서 내뱉는 말이 거짓이거나 허위 악의적 선전선동이 전부인 범죄자 정치꾼들의 말ㅇ은 학습 불가하게 만드는 법을만들어 시행해야 겠구만.

2024-05-20

답글 0

추천 콘텐츠
인기 에피소드
쿠키를 지원하지 않는 브라우저이거나 브라우저 설정에서 쿠키를 사용하지 않음으로 설정되어 있는 경우 사이트의 일부 기능(로그인 등)을 이용할 수 없으니 유의해 주시기 바랍니다.
메일링 구독신청하기