K컬처라고 부르는 문화 한류는 우리 국민의 문화적 자부심이 되는 말이다. 그런데 최근 사회, 경제, 문화를 넘어 일상까지 지대한 영향을 미치는 인공지능(AI) 기술이 날로 발전하면서, 문화 한류도 AI 기술 시대를 어떻게 준비하고 있는가를 진단할 시기가 된 것 같다.
문화 한류는 한국적 정서와 문화가 담긴 콘텐츠를 제작해 K컬처라는 문화의 흐름을 만들고, 외국인으로 하여금 스스로 한국 문화를 찾아서 누릴 수 있도록 했다. 그렇다면 AI 한류도 같은 길을 걸으면 되지 않을까. 한국어 데이터의 가치를 높여 한국 언어문화에 특화된 한국형 AI를 구축함으로써, 문화 한류에 관심을 갖는 외국인들이 스스로 한국형 AI를 찾게 하는 것이다.
그러나 우리의 AI 기술 개발 현황은 그리 녹록하지 않다. AI와 대화한 경험을 사용자가 직접 평가하는 챗봇 아레나 리더보드에서 영어권 빅테크 기업의 언어 모델 GPT-4o(오픈AI), 클로드-3.5(안트로픽), 제미니-1.5 프로(구글) 등은 상위를 차지하고 있으나 국내 기업의 언어 모델은 발견되지 않는다. 우리 기술이 아직 세계 수준에는 미치지 못하고 있음을 보여준다.
AI 경쟁력은 데이터와 자본에 있다. 한국의 기업이 글로벌 빅테크 기업 수준의 자본을 동원할 수 없으므로 한국형 AI는 데이터에서 돌파구를 찾아야 한다. 이를 위해서는 한국어와 한국 언어문화를 담은 데이터 구축이 필요하다. 조선왕조실록과 승정원 일기 같은 한국 역사를 비롯한 복식, 음식 문화 등 한국 고유문화 자료를 AI 학습용 데이터로 구축하고 이를 활용할 수 있는 AI 서비스 개발이 필요하다.
문화체육관광부는 일찌감치 한국어 데이터에 관심을 가져왔다. 국립국어원은 2019년부터 신문 기사, 일상 대화 등 한국 고유의 다양한 언어 정보를 말뭉치로 구축해 ‘모두의 말뭉치(kli.korean.go.kr/corpus)’를 통해 공개함으로써 국내 AI 기술 개발을 지원하고 있다. 또한 올해부터 표, 그래프, 사진, 영상 등 다양한 유형의 문화 자원을 한국어로 설명하는 한국 언어문화 말뭉치를 본격적으로 구축함으로써 한국의 문화가 세계로 확산해 나갈 수 있는 기반을 마련할 계획이다.
나아가, 문화체육관광부는 한국어 글쓰기 언어 모델도 개발 중이다. 30여 년간 국립국어원이 축적해 온 국어 지식 정보와 말뭉치로 훈련한 ‘AI 기반 글쓰기 상담·진단·첨삭 시스템(가칭 K로봇)’을 문화체육관광 연구 개발 과제로 추진해 2027년 공개할 예정이다. K로봇은 우리 국민뿐 아니라 전 세계의 한국어 학습자들이 한국어 글쓰기에 관심을 가지고 실력을 향상하고, 한국 언어문화에 대한 궁금증을 푸는 한국형 AI 플랫폼이 될 것이다.
한국 언어문화의 정체성이 드러나는 다양한 매체 자료를 AI가 처리할 수 있는 데이터로 만드는 일이야말로 ‘AI 한류’의 초석이다. 한국 고유 데이터를 통해 한국어와 한국 문화를 지키는 한국형 AI 기술이 빠르게 개발돼 전 세계인이 함께 사용하는 그날을 기대해 본다.