구글은 전 세계에서 언론사와 가장 많이 싸우는 기업이다. 지금도 뉴스 사용료 지급 문제로 법적 분쟁을 벌이고 있다. 그런 구글이 최근 미국 최대 뉴스 통신사인 AP통신에 뉴스 사용료를 내기로 했다는 소식이 눈길을 끌었다.
구글은 AP통신으로부터 기사를 제공받아 비서처럼 이것저것 물어볼 수 있는 자사 생성형 AI(인공지능) 서비스 ‘제미나이’를 학습시키려 한다. 전 세계 수억 명의 이용자가 ‘중국 딥시크의 생성형 AI는 왜 뛰어난 거야?’라는 식으로 제미나이에 물어볼 때마다 AP통신 기사를 근거로 정확한 답변을 제공해 사용자 신뢰를 얻겠다는 계산이다. 핵심 사업인 만큼 뉴스 사용료로 연 수십억 원을 줄 것으로 추정된다.
구글이 하루아침에 선해진 것도 아닐 테고 큰 금액을 언론사에 투자한 이유는 무엇일까. 구글은 과거 전 세계 기사를 마구 쓸어와서 미끼 상품처럼 사용자들의 관심을 모으는 데 사용했다. 그렇게 유입된 사람들을 상대로 광고·온라인 쇼핑을 전개해 큰돈을 벌었다. 기사 원문으로 연결되는 아웃링크를 걸어 놓았다는 이유로 기사에 대한 대가를 지불하지 않아도 큰 문제가 되지 않았다.
그런데 생성형 AI 등장으로 상황이 달라졌다. 오픈AI의 챗GPT같은 생성형 AI보다 더 똑똑한 AI를 만들려면 양질의 데이터가 필수다. 블로그·소셜 미디어에 떠도는 거친 말보다 정제된 언어를 학습시켜야 효과가 좋다는 것을 깨달은 것이다. 구글이 AI 개발에 투입한 데이터를 들여다본 결과 가장 데이터를 많이 활용한 사이트 상위 10곳 중 5개(2023년 기준)가 뉴스 사이트였다.
AI 개발 과정에서 기사를 무단 사용했다는 이유로 뉴욕타임스와 저작권 소송을 벌이던 오픈AI도 같은 이유로 최근 언론과 협력을 택하고 있다. 미국 악시오스 등 20개 매체에 기사 사용료를 지급하기로 한 것이다. AI 시대에 역설적으로 뉴스 저작권에 대해 정당한 대가를 지불해야 한다는 공감대가 자리 잡기 시작한 셈이다.
그런데 한국에선 이런 사례가 없다. 챗GPT를 비롯해 한국인들도 다수 사용하는 해외 AI는 우리말로 물어봐도 매끄럽게 답할 정도로 한국어 서비스가 고도화했다. 분명 이들도 한국 뉴스 기사를 학습했을 것이다. 하지만 지금까지 어떤 빅테크도 한국 언론사에 뉴스 사용료를 냈다는 말은 들어보지 못했다.
국내 AI기업도 마찬가지다. 네이버는 국내 매체들과 사용료 지불로 갈등을 빚고 있지만 모르쇠로 일관하고 있다. 지상파 3사가 최근 자사 뉴스·영상을 무단으로 생성형 AI에 활용했다며 네이버를 상대로 손해배상, 학습 금지 청구 소송을 제기했다. 2023년 한국방송협회와 한국신문협회에서, 지난해엔 국회에서 네이버를 상대로 ‘저작권 침해’에 대해 항의했지만 입장을 밝히지 않고 있다. 인류의 미래를 바꿀 AI가 대가 없이 훔친 콘텐츠로 만들어져선 안 될 것이다.