디지털 휴먼 ‘로지’가 식당에 앉아 있는 모습. 기업들이 디지털 휴먼을 홍보에 적극적으로 활용하는 가운데, 실제 사람에 가까운 디지털 휴먼을 만들기 위한 기술이 개발되고 있다. /로지 인스타그램

불로불사(不老不死). 이렇게 늙지도 않고 죽지도 않는 사람들을 요즘 광고나 인터넷에서 쉽게 볼 수 있다. 바로 ‘디지털 휴먼’이다. 삼성 네온, LG 레아, 네이버 이솔, 넷마블 제나, 스마일게이트 한유아 등 웬만한 IT 관련 대기업이나 게임 관련 업체는 디지털 휴먼을 만들어 광고와 홍보에 적극적으로 활용하고 있다. 국내에서 활동하는 디지털 휴먼이 이미 100명이 넘는다고 하니 이제는 디지털 휴먼 도감(圖鑑)이라도 있어야 얼굴과 이름이라도 외울 수 있을 것 같다.

작년 버추얼 인플루언서로 국내에서 디지털 휴먼 돌풍을 일으킨 싸이더스의 로지가 실제 연예인을 대체할 수 있다는 기대를 모으며 광고 시장에 성공적으로 진입했지만 지금은 예전 같은 관심을 받진 못하고 있다. 머리카락이나 옷의 움직임, 사람의 자연스러운 동작을 모두 CG(컴퓨터그래픽)로 실감나게 재현하기 어렵다 보니 자주 보다 보면 어색함이 눈에 띄기 때문이다.

이런 현상이 나타나는 이유는 그래픽 디자이너가 카메라, 광원, 움직임, 형상, 색상 등 모든 환경 변수를 조절해가며 장면 하나하나를 만들어내기 때문이다. 여전히 많은 수작업과 오랜 시간이 필요하다는 얘기다.

이를 극복하기 위한 기술이 ‘뉴럴 렌더링’이다. 실제 인물의 수많은 사진 영상에서 장면이 생성되는 과정을 심층 신경망으로 자동 학습하는 방식이다. 이를 통해 기존 CG의 환경 변수로는 충분히 표현하기 어려운 실제 환경의 복잡한 조명이나 투명하고 얇은 구조까지도 사실적으로 표현할 수 있게 된다. 문장, 스케치, 사진 한 장으로도 새로운 사람의 영상과 동영상을 생생하게 만들어낼 수 있는 것이다. 수많은 데이터와 오랜 학습 시간이 필요하고 아직까지는 CG 방식에 비해 고해상도 영상을 합성하는 데 한계가 있지만, 사용자가 더 쉽게 원하는 디지털 휴먼을 만들어 낼 수 있다는 점에서 성장 가능성이 큰 연구 분야다.

디지털 휴먼은 실제 사람을 모방하는 경우는 ‘디지털 더블’, 자신만의 정체성을 가지는 경우는 ‘버추얼 휴먼’으로 구분하기도 한다. 예컨대 디지털 더블은 오래전 사망한 옛 배우를 가상 공간으로 재현해 표정, 행동, 말투를 실제와 똑같이 모방한다. 이보다는 실제 사람처럼 말하고 행동하고 감정 표현도 하는 버추얼 휴먼이 디지털 휴먼의 미래가 될 전망이다.

실제 사람과 같은 정체성을 가지기 위해서는 인간과 동일한 수준의 상호작용이 가능해야 한다. 주어진 질문에 앵무새처럼 같은 대답을 하거나 “이해하지 못했습니다”를 연발하는 식이 아니라 같은 질문에도 상황에 따라 다르게 답하는 인공지능이 필수적이다. 예를 들면 뉴질랜드의 AI회사 솔머신(Soul Machines)은 인간의 뇌를 모방한 디지털 브레인으로 상대방 음성을 인식하고 감정도 인식해 반응하는 디지털 휴먼을 개발했다고 한다.

임화섭 KIST 인공지능연구단장

얼마 전 메타(옛 페이스북)에서 발표한 블렌더봇3와 구글의 람다2는 과거 챗봇의 문제점이었던 편향성과 부정확성을 대폭 개선해 인간처럼 ‘지각’이 있다는 주장이 나올 정도로 자연스러운 대화가 가능해졌다. 여기에 덧붙여 인간의 표정과 동작을 이해하고 자연스럽게 반응하는 기술이 융합되면 실제 사람처럼 보이면서 대화도 가능한 디지털 휴먼은 우리 생활에서 쉽게 볼 수 있게 될 것이다.

퇴근 후 집에 돌아와 나만의 디지털 휴먼 집사(執事)에게 그날 있었던 일을 얘기하면서 편하게 쉬면서 대화하는 날이 올 수도 있다. 반려견이 동반자가 되는 것처럼 반려 디지털 휴먼에게 또 다른 차원의 애정이 생길지도 모를 일이다. “오늘은 매우 힘든 하루였어” 한마디에 디지털 휴먼이 조명을 조정해주고 힐링 음악을 들려주는 세상이 기대되는 이유다.