- 과학향기 for Kids
- 에피소드
에피소드
[과학향기 for Kids] “어떤 일이든 맡겨줘!” 마법 같은 생성형 AI의 비밀은?
<KISTI의 과학향기> 제3062호 2024년 05월 20일여러분은 챗GPT와 같은 생성형 인공지능(AI)을 사용해 본 적 있나요? 생성형 AI는 마치 선생님처럼 우리가 모르는 걸 불과 몇 초 만에 설명해 줍니다. 또 숙제에 필요한 사진이나 동영상이 없을 때, 생성형 AI로 만들어 낼 수도 있어요. 심지어 생소한 외국어를 번역해 자동으로 영화 자막을 만들어 낼 수도 있고, 여러분과 가벼운 농담도 주고받을 수 있어요. 생성형 AI가 이렇게 다양한 능력을 뽐낼 수 있는 이유는 바로 ‘거대언어모델(LLM, Large Language Model)’ 덕분입니다. 그렇다면 LLM은 어떻게 우리가 원하는 자료를 한 번에 만들어 낼까요?
그림 1. 거대언어모델은 생성형 인공지능의 핵심 기술이다. ⓒshutterstock
동화 속 ‘마법의 거울’이 실존한다?
동화 <백설공주>에선 여왕이 마법의 거울에 “이 왕국에서 가장 아름다운 사람은 누구지?”라는 질문을 던지자, 거울이 “백설공주입니다”라고 답합니다. 생성형 AI의 핵심 기술인 LLM도 마치 ‘마법의 거울’처럼 사람들의 질문에 대한 정보를 제공해요.
그림 2. LLM은 마치 <백설공주> 속 마법의 거울처럼 우리에게 필요한 정보를 제공한다. ⓒshutterstock
다만 마법의 거울은 ‘마법’을 이용해 가장 아름다운 사람이 누구인지 알아내지만, LLM이 정보를 제공하기 위해선 온라인 웹사이트부터 책, 논문, 신문 기사 등 다양한 자료를 수집해야 합니다. 수집한 자료를 바탕으로, ‘고양이’와 ‘야옹’이 어떤 연관성을 가지는지, ‘배’나 ‘눈’처럼 다양한 뜻을 가진 단어가 상황에 따라 어떤 뜻으로 사용되는지 학습해요. 이렇게 다양한 정보를 학습한 LLM에 질문을 던지면, 마치 마법의 거울처럼 답변할 수 있게 돼요.
다만 LLM은 정답만 말하는 마법의 거울과 달리 그럴듯한 거짓말도 지어냅니다. 이를 ‘환각 현상’이라고 불러요. 예를 들어 챗GPT에 ‘울릉도에서 유명한 프랑스 요리 식당 5곳을 소개해달라’고 말하면, 챗GPT는 울릉도에 없는 식당을 가상으로 만들어 소개합니다.
그림 3. 챗GPT에 울릉도의 프랑스 식당을 소개해달라고 요청한 결과, 존재하지 않는 곳을 소개했다. ⓒOpenAI 캡쳐
왜 이런 현상이 나타나는 걸까요? LLM은 모든 정보를 알지 못하며 때로는 잘못된 정보를 학습할 수 있기 때문입니다. 예컨대 LLM이 ‘지구는 사실 평평하다’는 글을 읽고, 이 내용을 학습하면 지구가 평평하다고 말할 가능성이 생깁니다. 또한 LLM은 질문의 주제를 파악한 후, 주제와 관련된 단어를 연결하는 방식으로 답을 내놓는데요. 이 과정에서 정확한 정보를 전달하는 것보다 자연스러운 문장을 구사하는 데 더 집중합니다. 그로 인해 엉뚱한 대답을 내뱉는 거예요.
그 결과, LLM을 사용하는 생성형 AI는 10번 중 3번은 환각 현상을 일으키고 있습니다. 그러므로 LLM이 잘못된 정보를 생성하지 않도록 만드는 것이 앞으로의 큰 숙제입니다. 환각 현상이 일어나는 가장 큰 이유는 AI가 불완전하고 부정확한 데이터를 학습하기 때문이에요. 즉 정확한 자료를 학습하면 환각 현상을 줄일 수 있죠. 혹은 AI가 질문에 응답하기 전, 검색을 통해 정확한 답변이 맞는지 확인하는 ‘검색증강생성(RAG)’ 기술을 활용하는 것도 해결책 중 하나입니다. 실제로 많은 기업에서 정확한 학습자료와 검색증강생성 기술을 활용해 환각 현상을 줄여나가고 있습니다. 챗GPT의 최신 버전인 ‘GPT-4’의 경우 환각 현상이 많이 줄어들었다고 해요.
실제로 많은 기업에서 정확한 학습자료와 검색증강생성 기술을 활용해 환각 현상을 줄여나가고 있습니다. 챗GPT의 최신 버전인 ‘GPT-4’의 경우 환각 현상이 많이 줄어들었다고 해요. 최근 한국과학기술정보연구원(KISTI)이 개발한 ‘KONI(고니) ’도 환각 현상을 크게 줄인 LLM입니다. KONI는 KISTI가 가진 방대한 과학기술정보 데이터를 학습자료로 활용해 과학기술데이터에 특화돼 있다는 것이 특징인데요. 앞으로 KONI의 학습 데이터를 계속해서 늘려, 실제 연구 활동에서도 활용할 수 있도록 확대할 예정입니다.
앞으로 LLM을 기반으로 한 생성형 AI는 제조업, 게임, 가전제품부터 재난 대응에 이르기까지 다양한 분야에 이용될 예정입니다. 그만큼 우리의 삶과 LLM은 더욱더 가까워질 거예요. 생성형 AI가 바꿔놓을 미래의 모습을 기대해 봐요!
※ 교과서 연계 - 이번 과학향기 에피소드는 어떤 교과 단원과 관련돼 있을까?
5학년 1학기 도덕 - 밝고 건전한 사이버 생활
6학년 실과 - 소프트웨어와 생활
5학년 1학기 도덕 - 밝고 건전한 사이버 생활
6학년 실과 - 소프트웨어와 생활
글: 남예진 동아에스앤씨 기자 / 일러스트: 감쵸 작가
추천 콘텐츠
인기 에피소드
-
- [과학향기 for Kids] 왜 양치를 꼼꼼히 해야 할까?
- 아침, 점심, 저녁, 삼시 세끼 밥을 먹고 난 뒤에 꼭 해야 하는 일이 있습니다. 바로 양치질입니다. 너무 귀찮아서 하기 싫을 때도 있지만, 이를 닦지 않으면 이빨이 썩을 수 있어요. 치아를 썩게 만드는 범인이 우리 입안에 있기 때문이죠. 사진 1. 치아를 썩게 만드는 범인은 입안의 세균이다. ⓒshutterstock 충치가 생기는 이유...
-
- [과학향기 for Kids] 지구 밖에도 생명체가 있을까? 유로파 탐사선 출발!
- 여러분은 우주 어딘가에 외계인이 있을 것이라 믿나요? 유명 천문학자인 칼 세이건은 “이 넓은 우주에 다른 생명체가 없다면 공간 낭비”라고 말했습니다. 또 미국 항공우주국(NASA)에선 우리은하에만 최소 1,000억 개 이상의 행성이 있다고 발표했어요. 이에 많은 사람이 지구 밖에도 생명체가 존재할지 모른다고 추측하고 있답니다. 사진 1. 태양계가...
-
- [과학향기 for Kids] 지금은 빅데이터 시대! 빅데이터란 무엇일까?
- 흔히 우리가 살고 있는 현재를 4차 산업혁명의 시대, 또는 빅데이터 시대라고 합니다. 새로운 기술과 사회의 발전에 빅데이터가 큰 역할을 하고 있고, 데이터가 중요하다는 말이 여기저기서 들려오곤 하죠. 그런데 아직도 빅데이터가 무엇인지, 데이터와 빅데이터의 차이는 무엇인지 잘 모르는 사람들이 많습니다. 데이터가 많으면 빅데이터일까요? 빅데이터에 대해 알...
이 주제의 다른 글
- [과학향기 Story] 사이버 안보 위협하는 사이버 공격, 어떻게 대응할까?
- [과학향기 for Kids] 창과 방패의 전쟁, 사이버 공격 VS 사이버보안
- [과학향기 for Kids] 과학기술 발전에 필수! ‘연구데이터’란?
- [과학향기 Story] 딥러닝, 똑똑한 인공지능을 만든 비밀
- [과학향기 Story] 생성형AI를 발전시키는 ‘거대 언어 모델’
- [과학향기 for Kids] 인공지능(AI)이 똑똑해진 비결은? ‘기계학습’
- [과학향기 Story] ‘꿈의 컴퓨터’ 양자컴퓨터, 어디까지 왔을까?
- [과학향기 for Kids] 전 세계 연결망, 해저케이블을 위협하는 범인은?
- [과학향기 Story] 과학기술 발전의 핵심, 연구데이터
- [과학향기 for Kids] 놀라운 힘을 가진 미래 컴퓨터, 양자컴퓨터
ScienceON 관련논문
입에서 내뱉는 말이 거짓이거나 허위 악의적 선전선동이 전부인 범죄자 정치꾼들의 말ㅇ은 학습 불가하게 만드는 법을만들어 시행해야 겠구만.
2024-05-20
답글 0