21일(현지 시각) 미 루이지애나주 뉴올리언스 모리얼 컨벤션 센터에서 세계 최고 권위 AI(인공지능) 학회인 ‘CVPR(컴퓨터 비전과 패턴 인식)’이 열렸다. 전 세계 테크 기업들과 대학 연구팀이 최신 AI 연구 결과를 발표하고, 관련 기술을 전시하는 자리다. 구글이나 애플, 테슬라뿐만 아니라 우리나라 LG도 참석해 초거대 멀티모달 AI(다양한 채널로 얻은 정보를 인공지능으로 엮어내는 것)를 선보였다.
◇양방향 가능한 초거대 AI
LG는 LG전자 등 5개 계열사와 AI연구원이 공동으로 전시 부스를 차렸다. 관람객들은 세계 최초로 언어와 시각 정보 간 양방향 소통이 가능한 LG AI연구원의 초거대 AI인 ‘엑사원’와 LG전자가 선보인 운전자의 전방주시 추적 AI 기술을 직접 체험할 수 있었다. 엑사원에 ‘호박 모양의 모자’라는 문장을 제시하면 노란색 바탕에 호박 주름이 그려진 밀짚모자 그림을 보여줬고, 반대로 한 아이가 공원에서 원반을 던지며 노는 사진을 본 뒤엔 ‘한 소년이 푸른 공원에서 녹색 플라스틱 원반을 던지고 있다’며 그림을 문장으로 표현했다. LG의 엑사원은 미국의 오픈AI, 구글 등이 발표한 문장-이미지 자동 전환 AI보다 진화한 것이다. LG 측은 “엑사원은 AI 성능을 보여주는 지표인 파라미터(매개변수)가 국내 최대인 3000억개”라며 “이는 미국 오픈AI의 인공지능인 GPT-3(1750억개)를 넘어선 것”이라고 했다. 김승환 LG AI연구원 비전랩장은 “AI는 시각을 넘어 청각·촉각 등 인간의 오감(五感)을 습득하려는 형태로 진화하고 있다”고 말했다.
LG 측은 엑사원을 활용하면 실생활에서 사진 자동 설명 기능, 문헌 속 그림이나 도표를 자동으로 데이터화하는 기능도 가능할 것이라고 했다. 실제로 엑사원은 다양한 영역에 적용되고 있다. 올 2월 엑사원이 적용된 AI 예술가 ‘틸다’는 박윤희 디자이너와 협업해 뉴욕 패션위크에서 새로운 디자인의 옷을 선보였다. 틸다가 ‘금성에 핀 꽃’이란 주제로 3000장이 넘는 새로운 이미지와 패턴을 만들었고, 박 디자이너는 이를 기반으로 옷을 만들었다. 김승환 비전랩장은 “엑사원은 키워드를 제시하면 7분에 256장의 고해상도의 새로운 이미지를 창작한다”고 했다. 오픈AI의 고성능 AI인 ‘달리’보다 해상도가 높다. LG는 앞으로 음성·영상 인식 기능을 결합해 강화된 멀티모달 AI로 진화시킨다는 전략이다.
◇강아지 얼굴까지 구별하는 기술 선보여
이날 전시장에선 여러 테크 기업이 AI 비전 인식 기술을 선보이며 학회 참석자들의 시선을 끌었다. 전시장 입구 쪽에 자리 잡은 애플은 아이폰으로 주변 공간을 둘러 비추면 자동으로 3차원 공간이 만들어지는 ‘룸 플랜’ 기술을 시연했다. 애플 부스 직원은 “인테리어나 가구 배치 등을 더욱 쉽게 할 수 있다”고 했다. 메타(옛 페이스북)는 노트북에 달린 카메라 1대로 얼굴과 손, 몸 움직임을 추적해 이를 가상현실 공간에 반영하는 ‘아바타 조종 기술’을 공개했다. 아마존은 길거리에 돌아다니는 사람을 실시간 안면 인식하는 기술을 선보였고, 퀄컴은 강아지와 주인의 얼굴을 인식하는 스마트 카메라 감시 서비스를 전시했다. 퀄컴 관계자는 “반려견과 주인을 매칭해 반려견의 실종을 미리 방지할 수 있다”고 했다.
GM의 크루즈, 아마존의 죽스 등은 카메라와 라이다(LiDAR·레이저로 사물의 위치를 가늠하는 장치), 레이더를 기반으로 한 자율주행 시스템을 장착한 자동차를 전시했다. 테슬라는 전기 픽업 트럭인 사이버트럭을 부스 가운데 배치하고 자율주행 오토파일럿을 선보였다.