이달 초 북한 선전 매체 ‘조선의 오늘’은 김일성종합대학 정보과학부 인공지능기술연구소가 기계 번역 시스템인 ‘룡마’를 완성했다고 보도했다. 영어·중국어·일본어·러시아어·독일어·프랑스어·스페인어 등 7국 언어를 쌍방향으로 번역할 수 있는 프로그램이다. 이 매체는 “번역 정확도가 거의 전문가 수준”이라고 자평했다. 해외와 교류가 극히 드문 북한에서도 AI(인공지능)를 활용한 번역 서비스가 출시된 것이다.
음성 인식과 AI 기술을 바탕으로 한 번역 서비스가 급속도로 발전하고 있다. 이전에도 구글 번역, 파파고 등 웹 기반 번역 서비스가 있었지만, 최근에는 고도화된 인공지능 신경망을 바탕으로 기존 번역 기능을 능가하는 새로운 서비스가 속속 출시되고 있다. 전문적 법률 용어나 자동차 부품 명칭, 신조어 등도 정확하게 번역해낸다. 외국어 공부를 하지 않아도 되는 시대가 성큼 다가오고 있다
◇딥러닝 AI 등에 업고 펄펄 나는 번역 기술
자동 번역 소프트웨어 기술은 70여 년 전 처음 시작됐다. 냉전 시대에 상대국의 암호 체계를 해독하며 쌓아온 경험을 바탕으로 1951년부터 미국 워싱턴대, 미시간대, UC버클리 등 주요 대학에서 기계를 통해 번역하는 기계 번역 연구에 착수했다. 가장 먼저 등장한 것은 규칙에 기반한 단순 기계 번역이다. 개발자가 정한 단어 배열과 어법에 따라 시스템이 번역하는 방법이다. 쉽게 말해 컴퓨터에 한국어 문법, 영어 문법, 단어와 회화 규칙 등 수많은 언어 규칙을 입력하면 시스템이 이에 따라 번역하는 것이다. 하지만 이 방식은 사람이 모든 언어 규칙을 직접 만들어 입력해야 하기 때문에 수많은 언어를 번역하는 시스템으로 구현하기엔 한계가 있었다.
이후 등장한 것이 통계 기반 기계 번역이다. 많은 문장에서 단어와 단어 연결 빈도를 구하고 이를 프로그램이 통계 정보로 학습한다. 이를 토대로 번역할 때 원문의 단어와 구절에 적합한 번역어를 여럿 고른 뒤 그중 확률이 가장 높은 것을 선택해 번역을 완성하는 식이다. 단순 기계 번역보다 자연스러운 번역이 가능하지만, 단어나 구절 단위로 번역되기 때문에 어색함을 피할 수 없었다.
최근 각광받고 있는 번역 기술은 딥러닝(심층 학습) AI를 기반으로 하는 인공 신경망 기계 번역이다. AI가 원문에서 단어의 의미와 어순, 문장 구조, 문법 등 문맥 이해를 위한 모든 요소를 인공 신경망으로 재구성한다. AI가 스스로 이해할 수 있는 언어로 원문을 바꾼 뒤 학습을 거쳐 적합한 번역을 만들어내는 것이다.
◇법률 용어와 신조어도 번역
인공 신경망 기반 번역 기술이 점차 고도화되면서 일상생활에 적용되는 영역도 확대되고 있다. 시장조사 업체 글로벌마켓인사이츠에 따르면 작년 6억5000만달러(약 7600억원) 규모였던 글로벌 AI 기계 번역 시장은 연평균 25% 성장해 2027년엔 30억달러(약 3조5000억원) 규모가 될 것으로 예상된다.
기술 기업들은 이 시장을 노리고 다양한 번역 시스템을 출시하고 있다. 구글은 지난 9월 말하는 사람의 억양과 목소리를 유지하면서, 다른 언어로 번역해 이를 음성으로 전달하는 ‘트랜슬레이토트론2′를 공개했다. 사용자가 한국어로 말하면 트랜슬레이토트론2가 음성 인식을 통해 사용자의 목소리와 억양, 원문을 파악한 뒤 언어만 영어로 바꿔 그대로 전달해주는 식이다. 마이크로소프트는 이달 초 자사 번역 프로그램에 캐나다와 알래스카 등에서 이글루를 짓고 사는 이누이트족의 언어를 포함한 희귀 언어 10여 가지를 추가했다고 밝혔다. 이를 통해 마이크로소프트는 총 100여 언어에 대한 번역 서비스를 제공하게 됐다.
최근엔 인공 신경망 기술을 활용해 전문 용어를 번역하는 시스템도 등장했다. 현대자동차는 자동차 전문 용어 등 자동차 산업 맞춤형 번역을 제공하는 ‘H-트랜슬레이터’를 개발해 사용 중이고, 한문고전번역원과 한국천문연구원은 지난 4월 한문 고전인 승정원 일기와 천문 고전 원문을 자동 번역해주는 인공지능 번역 서비스를 공개했다. 스타트업 베링랩은 띄어쓰기, 조사 등 언어적 특성을 고려해 외국어 판결문을 한국어로 번역하는 법률·특허 분야 특화 AI 번역 엔진을 개발했다.