서울 신라호텔에서 만난 아르살란 타바콜리 시라지 데이터브릭스 공동창업자/김지호 기자

인공지능(AI) 반도체 시장을 장악하며 글로벌 AI 산업의 꼭대기를 차지한 엔비디아의 젠슨 황 최고경영자(CEO)가 최근 연례 개발자 행사 ‘GTC 2025’에서 “AI 칩 수요가 폭발적으로 늘 것”이라고 단언했다. 생성형 AI와 달리 학습 데이터 범위를 넘어선 새 답을 내놓을 수 있는 ‘추론형 AI 모델’ 개발 경쟁이 커지면서 연산 처리량이 100배 늘었고, 그에 따른 AI 칩 수요도 늘며 지금의 시장 지위를 유지할 수 있을 것이란 계산이다.

그러나 이와는 정반대 전망을 가진 곳도 있다. 올 초 100억달러(약 14조3000억원)에 달하는 투자금을 유치하며 620억달러(약 89조2000억원)에 달하는 기업 가치를 인정받은 AI 데이터 처리 플랫폼 기업 ‘데이터브릭스’다. 최근 서울 장충동 소재 신라호텔에서 본지와 만나 인터뷰를 가진 아르살란 타바콜리 시라지(42) 데이터브릭스 공동 창업자 겸 필드 엔지니어링 총괄 수석 부사장은 “최상단의 하드웨어 기업(엔비디아)만 돈을 벌고 있는 AI 산업 피라미드 구조는 몇 년 뒤면 완전히 역전될 것”이라며 이미 세계 AI 산업은 큰 변화가 이뤄지고 있다고 말했다. 그는 “지난해 상용화된 AI 모델 수는 전년 대비 11배 늘었고, 상당한 성장세를 보이고 있다”며 “몇 년 뒤면 AI 앱 서비스(소프트웨어)가 가장 많은 돈을 버는 역(逆)피라미드 구조가 될 것”이라고 전망했다.

◇“AI칩보다 AI앱이 더 큰 돈 벌 것”

데이터브릭스는 미국 UC버클리 대학에서 대규모 데이터 분산 처리 기술을 연구하던 AMP연구소 일원이 주축이 돼 2013년 창업한 스타트업이다. 세 살 때 가족과 함께 이란에서 미국으로 이민 온 시라지 수석 부사장 역시 한때는 UC버클리에서 컴퓨터과학 박사 학위를 딴 연구원이었다. 데이터브릭스는 기업을 대상으로 ‘서비스형 소프트웨어(SaaS)’를 판매하는데, 사내에 흩어진 각종 데이터를 통합하고 분석해 여러 사업에 도움이 될 만한 데이터로 뽑아내주는 AI 및 데이터 플랫폼이 핵심 제품이다. 가령, 게임 기업이라면 이 플랫폼을 활용해 이용자의 게임 이용 패턴과 아이템 구매 내역, 게임 내부 시장 거래량 같은 여러 데이터를 종합 분석해 앞으로 출시할 게임 아이템을 기획할 수 있다.

시라지 부사장의 전망을 뒷받침하듯 AI 기반 소프트웨어 사업을 하는 데이터브릭스의 매출은 최근 2년 사이 급격히 불어났다. 작년 매출만 30억달러(약 4조3800억원)로 전년(19억달러) 대비 60% 가까이 늘었다. 고객이 급격히 늘어난 덕분이다. 현재 데이터브릭스의 고객 규모는 포천 500대 기업의 60%를 포함해 글로벌 1만여 곳에 달한다. 한국의 LG전자와 한화, 크래프톤 같은 기업들도 데이터브릭스의 고객이다. 시라지 부사장은 “많은 기업이 업무나 사업에 AI와 데이터 분석 기술을 접목하고 싶지만, 관련 인프라를 갖추고 있지 않고 이를 개발할 인력도 많지 않기에 우리를 찾는다”며 “특히 우리 창업자들은 이미지·비디오·오디오 같은 비정형 데이터와 엑셀 표 같은 정형 데이터를 통합해 분석할 수 있는 기술(아파치 스파크)을 먼저 개발한 이들로 시장 우위를 가지고 있다”고 말했다.

데이터브릭스 창업자들이 AMP연구소 시절 개발해 오픈소스로 공개한 빅데이터 분산 처리 기술 ‘아파치 스파크’는 현재 글로벌 데이터 처리·분석 분야의 표준으로 자리 잡고 있다. 미국 정부와 은행, 통신업체는 물론 애플과 마이크로소프트, 메타, IBM 같은 빅테크들도 이 기술을 활용해 데이터를 처리한다. 아파치 스파크 등장 이전에는 저장 양식이 다른 다양한 형태의 데이터를 통합해 처리하는 것이 어려웠다.

서울 신라호텔에서 만난 아르살란 타바콜리 시라지 데이터브릭스 공동창업자/김지호 기자

◇“다양한 AI 모델 적용이 새 트렌드”

시라지 부사장은 요즘 달라진 AI 앱 개발 트렌드 역시 수익 창출 방식에 큰 변화를 만들고 있다고 했다. 그는 “특정 AI 모델에 집중하기보다 애플리케이션에 다양한 모델을 통합해 사용하는 복잡한 AI 시스템을 구축하는 것이 요즘 주요 트렌드”라고 했다. 특정 AI 모델을 개발해 단독으로 활용하는 것보다 이미 개발된 다양한 모델을 적재적소에 잘 활용하는 것이 수익 창출에 더 큰 도움이 된다는 뜻이다.

실제 요즘 많은 IT 기업들은 AI 관련 서비스를 개발하면서 복수의 AI 모델을 병용하는 방식을 취하고 있다. 소비자 개인 정보나 내부 업무용 자료 등 보안성이 민감한 데이터를 다룰 땐 자체 개발한 AI 모델을 활용하지만, 성능이 중요한 부분에선 고성능 빅테크 모델을 차용하는 하이브리드 방식이다. 예컨대 연내 AI 메신저 앱 ‘카나나’ 출시를 앞둔 카카오도 자체 개발한 코(ko)GPT 모델과 오픈AI의 ‘챗GPT’ 모델을 함께 접목한다는 ‘AI 오케스트레이션’ 전략을 발표했다. 시라지 부사장은 “우리 역시 AI·데이터 플랫폼을 오픈소스 기술로 구축해 특정 기술에 종속되는 락인(lock-in) 현상을 피하고, 다양한 AI 모델을 선택해 적용할 수 있게 만들었다”고 말했다. 데이터브릭스는 최근 여러 AI 에이전트(비서) 모델을 다양한 비즈니스 앱에 적용할 수 있도록 지원하는 개발 도구도 새롭게 선보였다.