27일 베이징의 한 유저가 휴대폰에 설치된 딥시크 앱을 실행하고 있다. /연합뉴스

오픈AI와 마이크로소프트(MS)가 최근 글로벌 인공지능(AI) 업계를 강타한 중국 AI스타트업 ‘딥시크’가 오픈AI의 데이터를 도용(盜用)했는지 여부에 대해 조사를 시작하기로 했다. 이 회사는 미국 AI 선두주자에 비해 95% 저렴한 557만 6000달러(약 80억원) 가량을 사용해 AI모델 ‘딥시크-V3′를 개발했다고 밝히며 테크계에 충격을 줬다. 하지만 이 같은 저비용의 배경이 오픈AI가 큰 돈을 들여 개발한 데이터를 도용했기에 가능했다는 주장이 나왔기 때문이다.

29일 블룸버그에 따르면 MS와 오픈AI는 데이터 유출 여부에 대한 조사에 착수했다고 밝혔다. MS의 보안 연구원들은 지난해 가을 오픈AI의 API(프로그래밍 인터페이스)에서 대량의 데이터를 빼내는 정황을 발견했고, 이 움직임이 딥시크와 관련이 있을수 있다고 판단했다. 오픈AI는 AI서비스를 개발하는 소프트웨어 개발자들에 API를 판매하고 있는데, 일부 이용자가 제재를 우회하고 정상적으로 사용할 수 있는 데이터의 범위 이상을 빼냈다는 것이다. 여기다 오픈AI는 중국에서의 자사 API 사용을 금지하고 있다. 이 같은 의혹이 사실일 경우 중국 AI스타트업이 계획적으로 해외 사용자로 둔갑해 데이터 탈취를 시도했을 가능성이 제기된다.

이 같은 ‘데이터 도용’ 가능성은 도널드 트럼프 대통령의 ‘인공지능 차르’인 데이비드 삭스도 언급한 바 있다. 그는 지난 28일 “딥시크가 오픈AI의 모델에서 지식을 추출했다는 상당한 증거가 있고, 오픈AI는 이에 기뻐하지 않을 것”이라며 “’증류(distillation)’라고 불리는 기술을 포함해 미국의 첨단 AI모델를 복제했다”고 주장했다. 앞서 딥시크는 모두에게 자료를 개방하는 메타의 라마 같은 오픈소스 시스템을 기반으로 자체 연구를 통해 모델을 제작했다고 밝혔었다.

한편 딥시크가 엔비디아가 중국 수출을 위해 성능을 낮춘 제품 ‘H800′으로 AI를 개발했다는 점에 대해서도 의혹이 번지고 있다. 일론 머스크 테슬라 최고경영자(CEO)는 27일 X에 딥시크가 엔비디아의 고성능 AI칩인 ‘H100′을 대량 보유하고 있을 것이라는 글을 올렸다. 앞서 AI데이터 기업인 ‘스케일 AI’의 알렉산더 왕 CEO는 최근 CNBC와의 인터뷰에서 “딥시크가 약 5만개의 엔비디아 H100을 소유하고 있지만, 미국의 수출 통제 때문에 그렇게 말하지 못한다”고 주장한 것을 공유하며 “물론 그렇지(Obviously)”라고 평한 것이다.