일본에서 ‘로봇의 아버지’라고 하는 모리 마사히로는 1970년 로봇에 대한 사람의 호감도를 실험했다. 로봇 외형과 행동을 사람과 비슷하게 만들수록 호감도가 높아지는데, 어느 정도가 지나면 강한 거부감으로 바뀐다. 이 거부감은 로봇이 사람과 완전히 구별할 수 없으면 다시 호감으로 바뀐다. 이 그래프 모양에서 ‘불쾌한 골짜기’ 이론이 나왔다. 애니메이션이나 기계음에서도 같은 거부감이 나타난다. 사람을 어설프게 닮은 존재에서 느끼는 괴리감과 어색함이 불쾌한 골짜기의 원인이다.

▶캐나다에서 잇따라 신종 보이스 피싱 사건이 발생했다. 유치장에 갇혀 있다며 다급하게 송금을 요구하는 아들과 손자의 전화에 거액을 보냈지만 사기였다. 완벽한 아들과 손자 목소리의 정체는 인공지능(AI)으로 만들어낸 기계음이었다. 글로 쓴 문장을 사람 목소리로 들려주는 기술은 수십 년 전부터 있었지만 발음과 억양이 완벽하지 않았다. 하지만 AI를 결합하자 불쾌한 골짜기를 훌쩍 뛰어넘은 것은 물론 가족까지 속이는 수준이 됐다.

/일러스트=박상훈

▶AI 목소리를 만드는 기술을 ‘오디오 딥페이크(deepfake)’라고 한다. 이미 있는 데이터로 AI를 훈련하는 딥러닝(심층 학습) 기술로 합성한 가짜 소리라는 뜻이다. 2년 전만 해도 한 사람의 AI 목소리를 만드는 데 두 시간 이상짜리 음성 파일과 며칠이라는 시간이 필요했다. 이제는 그 사람 음성 몇 문장만 있으면 몇 초 만에 만들 수 있다. 소셜미디어에 있는 짧은 동영상이나 음성 메시지로도 가능하다. 비밀번호 없이도 모든 것을 빼앗길 수 있는 시대가 됐다.

▶딥페이크는 이미지와 동영상도 감쪽같이 만든다. 연예인 얼굴에 다른 사람 알몸을 합성하거나 다른 사람의 문제 발언을 유명 정치인이 한 것처럼 조작한 사건도 있었다. 챗GPT를 만든 오픈AI의 이미지 생성 AI ‘달리2′는 합성을 넘어 세상에 없는 이미지를 만든다. 미국에서는 AI가 곧 포르노 시장을 장악할 것이라는 전망까지 나온다. 사람들이 생각하는 가장 완벽한 배우를 만들 수 있기 때문이다.

▶딥페이크는 광고에 20대 신인 배우 윤여정을, 드라마 카지노에 30대의 최민식을 등장시켰다. 전원일기의 고(故) 박윤배 배우를 동영상으로 부활시키기도 했다. 오디오 딥페이크도 직접 녹음하는 수고 없이 수많은 음성 콘텐츠를 만들어내는 유용한 수단이다. 하지만 AI에 사람들이 놀라고 신기해하는 사이 누군가는 AI를 악용하기 시작했다. 통제받지 않는 첨단 기술만큼 위협적인 것은 세상에 없다. AI도 마찬가지다.

박건형 논설위원