[기자수첩] 멀고 먼 음성인식의 길

기사승인 2018-08-02 01:00:00
- + 인쇄
[기자수첩] 멀고 먼 음성인식의 길

“제가 어디게 지금”

시연과정에서 들은 음성인식 인공지능(AI)의 황당한 답변이다. “내가 지금 어디게?”라는 일반적인 질문을 막 한국어를 배운 외국인처럼 인식했다. 이어서 몇가지 간단한 질문을 했지만 이마저도 못 알아듣거나 우스꽝스러운 대답만 늘어놨다. 

이는 한 회사의 음성인식 AI의 문제가 아니다. 삼성전자부터 LG전자, 이통3사(SK텔레콤·KT·LG유플러스) 등 대기업들이 내놓는 가전부터 스피커까지 탑재된 음성인식 AI 대다수의 저조한 음성인식률에 관한 이야기다.

음성인식률이 생각보다 별로라는 반응은 주변 지인 혹은 관련 기사를 봐도 드러난다. 말로만 하면 ‘척척’이라는 광고에 샀다가 속만 터진다는 이야기부터 음성인식 AI가 바보라는 댓글도 많다.

한국어가 언어적으로 어려운 탓도 있다. 발음 법칙이 복잡하고 예외도 무수하다. 한 색을 두고도 이를 표현하는 수많은 어휘가 있다.

가령 ‘하셨으리라’라는 단어를 말한다면 음성인식 AI가 동사부터 추측까지 모든 의미를 이해하기는 쉽지 않다. 사투리도 많다. 제주도 말은 서울 사람이 들었을 때 무슨 소리인지 알아듣기가 어렵다. 걸음마를 뗀 음성인식 AI가 이해하기는 더욱 난관일 것이다.

언어적 어려움 외에도 음성인식 AI 기술 자체적인 미비점도 크다. 출시된 음성인식 AI들은 불분명하게 말하는 유아동의 말 혹은 시끄러운 장소 등에서 인식률이 급격하게 떨어진다.

출시된 제품 중에서는 가까운 거리 혹은 제한된 거리에서만 말해야 음성인식이 가동되거나 이마저도 또렷하게 말해줄 것을 요구하는 AI도 있다.

문제는 이뿐만이 아니다. 음성인식 서비스의 정확성은 발화 데이터(말)의 양에 달려있다. 누적되는 데이터양에 따라서 정확도가 높아지고 꾸준히 개선된다. 

딜레마(dilemma)는 바로 여기서 발생한다. 음성인식 AI를 개발하는 기업들은 발화 데이터를 더욱 쌓아야만 개선된 서비스를 제공할 수 있지만 사용자들은 ‘시험 모델’을 구매한 것이 아닌데 왜 제대로 제품이 작동이 안 되냐고 불만을 제기한다.

음성인식 AI 발전은 당장 뾰족한 해법이 보이지는 않는다. 다만 해법은 아니지만 방향 정도는 제시할 수 있을 것 같다.

음성인식 서비스는 사람도 듣기 어려운 국어를 듣고 반응을 하고 있다. 인공지능인 만큼 일정 시간 학습할 여유를 주는 것이 필요하다. 이세돌을 꺾은 알파고도 일정 시간 이상의 학습이 필요했듯이 말이다.

예컨대 음성인식 AI 사용자들이 다소 답답해도 음성인식을 자주 이용해줌으로써 음성인식 기술의 기술발전과 진화에 도움을 주는 것이다. 답답함을 참은 보답은 확실할 것으로 예상된다. 4차산업혁명 시대에 음성인식 AI는 대부분의 차세대 기술들에 핵심 중 하나다.

집 안에서 장보기를 비롯한 집안 관리가 가능한 스마트홈부터 차량이 곧 사무실이며 휴식장소가 되는 자율주행자동차에서도 음성인식 AI는 핵심 명령 시스템이다. 다소 번거로움을 참아준다면 국어로 가능한 음성인식 AI는 더 똑똑하고 편리한 기능으로 사용자들의 일상에 도움이 될 것이다.

소비자의 인내와 함께 음성인식 기술을 개발하는 기업들도 음성인식 기술 보완에 심혈을 기울여야 할 것으로 보인다. 인공지능 AI의 흥망이 음성인식률에 달려있기 때문이다. 개선될 음성인식 기술에 기대를 걸어 본다.

임중권 기자 im9181@kukinews.com

기사모아보기