세계적인 인공지능(AI) 분야 석학인 얀 르쿤 미국 뉴욕대 교수 겸 메타 수석AI과학자가 AI의 기술의 현실을 꼬집으면서 막연한 공포심을 갖기 보다는 더 나은 기술 발전을 위해 전 세계가 협력해야 한다고 강조했다.
르큰 교수는 11일 서울 여의도 페어몬트 앰배서더호텔에서 열린 ‘K-Science&Technology 글로벌 포럼’에 기조강연자로 나서서 “챗GPT, 제미나이 같은 초거대언어모델(LLM)이 나오면서 변호사 시험에 합격하고, 시까지 쓴다는데, 정작 우리 생활에 도움을 주는 로봇은 아직도 없다”며 “지금의 AI는 10살 어린아이도 할 수 있는 간단한 일조차 할 수 없다”고 말했다.
르쿤 교수는 ‘AI 4대 석학’으로 불리는 인물이다. 4대 석학에는 르쿤 교수와 제프리 힌튼 캐나다 토론토대 교수, 앤드류 응 미국 스탠퍼드대 교수, 요슈아 벤지오 캐나다 몬트리올대 교수가 포함된다. 그는 영상 데이터 처리 성능을 크게 끌어 올린 합성곱 신경망(CNN)을 처음 개발한 과학자다. 2018년에는 요수아 벤지오, 제프리 힌턴과 함께 컴퓨터과학 분야의 노벨상으로 불리는 ‘튜링상’을 수상하기도 했다. 조경현 뉴욕대 교수와 함께 한국의 AI 분야 국제협력 사업인 ‘AI 프론티어랩’의 공동 소장을 맡으면서 한국과도 인연을 이어가고 있다.
그는 AI가 실제 사람들의 삶 속에 들어오려면 사람이 정리한 문자 데이터를 학습하는 기존 LLM을 벗어나야 한다고 설명했다. 대신 신생아가 눈으로 세상을 바라보고 배우는 방식처럼 영상을 기반으로 복잡한 정보들을 스스로 학습할 수 있게 해야 한다는 것이다.
르쿤 교수는 “현재 LLM은 2조개의 토큰(단어 데이터)을 학습했지만, 4살짜리 아이가 살면서 학습한 정보는 100조개에 달한다”며 “인간은 사물의 이름을 하나하나 입력할 수고를 할 필요도 없고 더 복잡한 상호 관계를 파악할 수 있다”고 말했다.
르쿤 교수는 이 같은 방식의 ‘목표 지향 AI 아키텍처(objective driven ai architecture)’를 소개했다. 이 방식은 영상 데이터를 학습해 이미지로서의 표현을 예측하는 데 특화돼 있다. 가령 5분짜리 영상을 AI에게 보여줬을 때 다음으로 나올 장면이 무엇인지 예측하는 기능이다.
그는 “LLM에 사용하는 알고리즘으로는 영상 데이터를 예측할 수 없다”며 “우리는 제파(JEPA)라는 모델을 연구하고 있고, 한국과 전 세계의 AI 연구자들이 이 방식에 주목하고 있다”고 말했다.
그는 궁극적으로 목표 지향 AI 아키텍처를 통해 전 세계 모든 사람들이 혜택을 볼 수 있는 모델인 ‘아미(AMI·Advanced Machine Intelligence)를 구현할 수 있다고 기대하고 있다. 아미는 스스로 논리적인 추론과 계획 수립을 할 수 있으면서도 인간이 안전하게 통제할 수 있는 모델을 의미한다. 다만 이를 위해서는 전 세계 연구자들이 함께 힘을 모아야 한다는 단서를 달았다.
르쿤 교수는 “궁극적으로는 인간의 지식과 문화를 모두 축적하고, 보편적인 가치 체계를 통합한 AI를 개발해야 한다”며 “이 모든 일은 오픈소스를 기반으로 한 협력으로만 이뤄낼 수 있다”고 말했다.
이어 “전 세계 정부와 과학자들이 협력해 AI 규제가 오픈소스 플랫폼(기반 기술)의 확산을 막는 일이 일어나지 않도록 해야 한다”며 “컴퓨팅 자원도 효율적으로 분배해서 각 언어와 문화를 반영한 데이터를 쌓도록 협력해야 한다”고 덧붙였다.