다섯명의 인공지능 남녀성우 목소리/밀리의서재

스콧 피츠제럴드의 소설 ‘위대한 개츠비’를 누군가 읽어준다면? 개츠비는 성공과 사랑의 ‘열정남’. 기왕이면 그 느낌이 잘 묻어나도록 당차면서 달콤한 목소리의 남자였으면 좋겠다.

이제 사람 대신 AI(인공지능)가 듣는 이의 로망을 충족해준다. 최근 전자책 서비스 업체 ‘밀리의 서재’는 AI 음성을 활용한 오디오북 서비스를 업계 처음으로 내놨다. 책의 성격에 따라 5개의 AI 목소리가 있다. 기존 오디오북은 성우나 유명인이 책을 읽었다. 포털 사이트에서 제공하는 뉴스 읽어주기 서비스처럼 딱딱하고 어색한 기계음이 읽으면 거부감이 생길 수 있기 때문이다. 현재 AI는 실제 성우 목소리를 분석해 사람의 음성과 거의 유사한 수준으로 발전했다. 밀리의 서재 관계자는 “오히려 발음이 뚜렷해 듣기 좋다는 고객 평가도 있다”며 “AI 오디오북을 100권 출시했고 이번 달부터 매달 500종씩 추가할 예정”이라고 말했다.

남자 셋, 여자 둘의 AI 목소리가 저마다 다른 인격을 입고 개성을 자랑한다. 남자 목소리 ‘연우’는 부드럽고, ‘성욱’은 똑 부러지며, ‘준상’은 자상하다. 여자 목소리 ‘민지’는 친근하고, ‘수아’는 상냥하다. 책에 따라 어느 성별에 어떤 화자가 적합할지, 어떤 목소리 톤으로 읽어야 어울릴지를 고려해 목소리를 매칭한다. 예를 들어 책 ‘딸에게 보내는 심리학 편지’는 엄마가 딸에게 보내는 편지 형식이기에 성숙한 여성 목소리인 수아를 선택한다. 다른 책 ‘슈퍼 리치들에게 배우는 돈공부’는 경제가 주제인 만큼 신뢰감 있는 성욱 목소리를 사용한다. 특색 있고 튀는 목소리보다 장시간 들었을 때 불편하지 않은 무난한 톤이 공통점이다.

책을 ‘듣는’ 사람들이 늘어나고 있는 반면 콘텐츠 숫자는 이를 따라가지 못하고 있다. 밀리의 서재에 따르면 오디오북을 이용하는 회원은 2년 전에 비해 1.8배 증가했고, 그 비율도 해마다 증가해 올해 전체 회원의 5분의 1 이상(23.6%)이 오디오북을 즐기고 있다. 책 전부를 읽어주는 ‘완독형’ 오디오북은 평균 7시간 분량이지만, 녹음하는 데 20~30시간이 걸린다. 성우는 목소리 상태를 고려해 하루 3~4시간만 녹음하기에 보통 한 편을 제작하는 데 일주일이 걸린다. 이 때문에 전체 10만권의 전자책 콘텐츠 중 1%인 1000권만이 오디오북으로 제작됐다. 반면 AI를 활용하면 문장 수와 관계없이 10초 만에 오디오북이 만들어진다. AI 목소리 서비스 업체 네오사피엔스 관계자는 “성우를 기용해 편당 수백만원을 쓰는 오디오북 제작에 비해 AI는 10분의 1 비용으로 다양한 콘텐츠를 단시간에 대량생산할 수 있다”고 말했다.