인생에 뜻을 세우는데 있어 늦은 때라곤 없다

IT정보

AI가 회의록도 정리해준다…네이버, 새 음성인식 기술 공개

projin 2020. 4. 14. 08:56

 

13일 네이버는 길고 복잡한 문장을 인식하고 이를 텍스트로 변환할 수 있는 새로운 음성인식 엔진을 클로바 홈페이지에 공개했다. 이 엔진에는 네스트(NEST, Neural End-to-end Speech Transcriber) 기술이 활용됐다. '심층 신경망 통합 모델링 음성 자동자막 생성 기술'로, 지난 1월부터 네이버 동영상 뉴스 등 일부 서비스에서 도입됐다가 이번에 일반 사용자에게도 무료로 공개됐다.

 

NEST의 가장 큰 특징은 통합 모델링 방식(end-to-end)이다. 기존에는 음성 인식엔진이 음향과 언어 정보를 별도로 학습했지만 NEST는 음향과 언어 정보를 한꺼번에 인식한다. 학습 시간과 학습량은 기존의 10분의 1로 줄었고, 정확도는 기존보다 높아졌다. 네이버는 "NEST는 대량의 정제된 데이터를 사전에 학습하지 않고도, 예상치 못한 새로운 표현이 나와도 정확하게 음성 인식을 할 수 있다"고 설명했다. 

NEST는 지난 1월에는 네이버 동영상 뉴스의 자동자막 서비스에 먼저 도입됐다. 또 AI가 전화로 코로나19 자가격리자 등 능동 감시자의 상태를 확인하는 ‘클로바 케어콜’에 지난달 9일부터 적용됐다. ‘클로바 케어콜’은 인공지능(AI)이 자가격리자에게 하루에 2번(오전 9시, 오후 3시) 자동으로 전화를 걸어 발열·호흡기 증상 등을 확인하는 시스템이다. 

일반 사용자들은 클로바 스피치 홈페이지(https://clova.ai/speech)에서 NEST 기술을 무료로 체험할 수 있다. 기업과 단체도 제휴 제안을 통해 사용이 가능하다. 강의록이나 회의록 같은 장문의 음성을 손쉽게 텍스트로 변환할 수 있어 실생활에도 유용할 것으로 보인다.

LIST