- 과학향기 Story
- 에피소드
에피소드
24개 언어 이해하는 AI 음성인식 기술 개발
<KISTI의 과학향기> 제3810호 2022년 12월 05일국내 연구진이 한국어와 영어, 중국어, 일본어뿐만 아니라 독일어, 프랑스어, 스페인어, 러시아어 등 세계 주요 24개 언어를 인식할 수 있는 음성인식 기술을 개발했다. 디지털 전환의 시대, 음성인식을 바탕으로 인공지능(AI) 비서, AI 튜터 등 다양한 AI 서비스 확산에 큰 도움이 될 전망이다.
한국전자통신연구원(ETRI)은 세계 주요 24개 언어를 음성으로 인식, 문자로 변환할 수 있는 ‘대화형 인공지능(Conversational AI) 기술’을 개발했다고 밝혔다. ETRI가 개발한 음성인식 기술의 성능은 구글(Google) 등 글로벌 기업과 비교해 한국어에서는 우위, 타 언어에서는 대등한 수준이다.
기존 음성인식 기술을 개발하기 위해서는 대규모 학습데이터가 필요해 다국어 확장과 음성인식 성능 확보가 쉽지 않았다. 연구진은 자기 지도학습, 의사 레이블, 대용량 다국어 사전 학습 모델, 음성 데이터의 오디오 데이터 생성(TTS) 증강 기술 등을 통해 언어 확장의 어려움을 해결했다. 또한, 연구진은 기존에 흔히 활용되던 종단형(End-to-End) 음성인식 기술의 단점을 개선해 활용성을 높였다. 느린 응답속도의 문제는 스트리밍 추론 기술을 개발, 실시간 처리가 가능하도록 개선했다. 아울러, 의료와 법률, 과학기술 등 특정한 도메인에 대한 음성인식 특화가 쉽도록 하이브리드 종단형 인식 기술도 개발해 적용했다.
연구진은 이번 다국어 확대와 응답속도 지연 해결 등 신기술 적용을 통해 음성인식 기술 활용 범위를 확대, 사업화를 추진할 예정이라고 밝혔다. 특히, 올해 안으로 지원 언어를 30여 개로 확대하고, 국내·외 전시 참여와 기업체 설명회를 통해 동남아와 남미, 아랍권 등을 대상으로 사업화를 적극 추진할 예정이다.
김상훈 ETRI 복합지능연구실 책임연구원은 “국내기술로 글로벌 선도업체와 대등한 수준의 음성인식 기술을 개발했다는 데 의의가 있다”며 “본 기술이 우리나라 인공지능 분야의 글로벌 경쟁력을 높이고 기술자주권을 확보하는 데 큰 도움이 되길 바란다”고 말했다.
추천 콘텐츠
인기 에피소드
-
- AI 성능 높이는 방법? 우리 뇌에 있었다!
- 기초과학연구원(IBS) ‘인지 및 사회성 연구단’ 이창준 단장과 ‘수리 및 계산 과학 연구단’ 데이터 사이언스 그룹 차미영 CI(Chief Investigator·KAIST 전산학부 교수) 공동 연구팀이 AI의 효율성을 크게 높이는 방법을 찾았다. 바로 뇌의 해마에서 일어나는 기억 통합의 생물학적 특징을 활용하는 것이다. 인공지능은 2017년 구글...
-
- 망막의 모든 영역을 2.3초 안에 이미징하는 기술
- 2.3초 안에 망막의 모든 영역을 3차원으로 이미징할 수 있는 기술이 나왔다. KAIST 기계공학과/KI헬스사이언스연구소 오왕열 교수 연구팀이 세계 최초로 사람 망막의 넓은 영역에서 초점 위치뿐만이 아니라 초점에서 벗어난 위치에서도 세포 수준 고해상도 이미징이 가능한 기술을 개발했다. 망막은 안구의 렌즈를 통해 이미징해야 하기 때문에 안구 렌즈의 ...
-
- 누에 단백질로 안전하고 친환경적인 인공 심장판막 개발
- 정세용 세브란스병원 소아심장과 교수와 홍진기 연세대 화공생명공학과 교수 공동 연구팀이 누에나방의 유충인 누에가 만들어 내는 천연 단백질로 기존보다 내구성을 높인 심장판막질환용 인공 판막을 만드는 기술을 제시했다. 이는 심장판막질환 환자의 안정성과 편의성을 높이는 동시에 친환경적인 효과도 기대된다. 심장판막 4개는 열리고 닫히면서 혈류의 흐름을 조절...