오디오 기술 전문 스타트업의 오현오 대표가 서울 강남구 가우디오랩 본사에서 오디오 장비를 시연하고 있다. /남강호 기자

“지금은 챗GPT처럼 글을 쓰는 인공지능(AI)을 주로 쓰지만, 곧 말을 하고 소리를 듣는 AI가 보편화될 것입니다. 1~2년 내에 AI 음향 기술에서 세계 선두가 되는 것이 목표입니다.”

지난 8일 서울 강남구 사무실에서 만난 가우디오랩 오현오(50) 대표는 “인간 대신 그림을 그려주는 AI는 많지만, 아직 다양한 소리를 만들어내는 AI는 시장에 없어 기회가 무궁무진하다”고 했다. 가우디오랩은 음향 기술을 개발하고, 이 기술을 파는 스타트업이다. 올해 세계 최대 IT 박람회 CES에서 혁신상을 2개 받았다. 오 대표는 연세대에서 음향 기술로 박사 학위를 받았고, LG전자에서 TV 음향 기술 개발을 하다 퇴사 후 2015년 가우디오랩을 창업했다.

가우디오랩의 AI 음향 기술이 적용된 대표적인 사례는 올해 초 공개된 드라마 ‘카지노’의 30대 최민식 목소리다. 최민식 배우가 연기한 인물의 30대 시절이 드라마에 등장하는데, 디지털로 녹음된 30대 시절 최민식 배우의 목소리만 별도 녹음된 파일이 없었다. 오 대표는 “‘야망의 세월’에서 ‘꾸숑’을 연기하던 30대 최민식의 목소리를 AI가 뽑아냈다”며 “여러 소음과 다른 인물들의 목소리 속에서 최민식의 목소리만 가려내 이를 기반으로 AI가 학습한 뒤 현재의 대사를 30대처럼 보정했다”고 설명했다.

오 대표는 “공간 음향과 음향 평준화 기술만 8년 동안 개발했다”고 했다. 공간 음향은 마치 실제 소리가 생긴 공간에 있는 것처럼 생생한 느낌을 주는 기술로, 소리의 울림을 비롯해 영상 속 인물의 움직임에 따라 소리가 가까이 혹은 멀리서 들리는 느낌까지 재현한다. 음향 평준화는 다양한 음원의 소리 크기를 보정하는 것으로, 음악 서비스에 주로 쓰인다. 오 대표는 “공간 음향은 네이버를 비롯한 국내 기업의 공연 영상 콘텐츠, 음향 평준화는 벅스 등 국내 음원 서비스 업체와 서비스를 하면서 노하우를 쌓아왔다”며 “이번 CES에선 미국, 중동의 영상·음원 콘텐츠 기업을 비롯해 최근엔 자동차 등 다양한 산업 기업들이 가우디오랩의 음향 기술에 관심을 보이고 있다”고 말했다.