주 3회 발행하는 유료 레터 [스타트업]입니다. 가입 https://page.stibee.com/subscriptions/158656 하고 전문보세요. 무료 공개 기간이 끝난 기사의 일부 공개합니다.


실리콘밸리의 개발자가 한국 스타트업으로 적을 옮겼다고 합니다. 블룸버그와 페이스북에서 일한 이재호씨와 아마존의 민창현씨. 국내 한 신문(매일경제신문)이 “미래 가능성 믿고 미국 빅테크서 한국 스타트업行 결정했죠”라는 기사(1월 7일자)에서 전한 내용이다. 기사에서 이재호씨는 “미국 빅테크 연봉이 많지만 우리 회사가 로켓처럼 하늘로 날아오르면 그 고액 연봉은 한없이 적어질 것입니다”라고 말했다. 신문은 ‘인재 리쇼어링’이 현실이 되고 있음을 증명한 사례라고도 했다. 이 스타트업은 업스테이지다. 2020년 10월 당시 네이버에서 인공지능(AI)을 총괄하던 김성훈 홍콩과기대 교수가 사표내고 나와, 설립한 곳이다. 당시 네이버의 비주얼AI와 파파고 번역 개발을 각각 담당했던 이활석, 박은정씨도 사표내고 합류했다. 설립 1년 만에 316억원의 시리즈A 투자를 받았다.

대체 뭐지? 이 회사? 많은 사람들이 한번쯤 갸우뚱했을 법하다. 너무 평탄한 성공 스토리 뒤에선 폄훼하는 목소리도 곧잘 들렸다. “실체도 없이 AI와 스타트업 붐에 올라탄 몇몇 개발자들의 유행 따라잡기” “뭣도 모르는 대기업의 눈먼 돈을 본 것이니 브랜드나 마켓팅전문기업에 가까운 곳”이란 식이다. 누구는 “명성 덕분에 너무 꽃길만 가는 스타트업”이라고도 한다. 개인적인 기억도 있다. 업스테이지 설립 때인 2020년 10월쯤 당시 편집국 IT취재팀장으로 [한국의 AI추격자들]이란 시리즈를 만들었다. 발문을 썼다. 이랬다.

[컴퓨터가 인간과 같이 사고(思考)하는 인공지능(AI·Artificial Intelligence)은 향후 10년간 세계 테크 판도를 송두리째 흔들 것이다. 하지만 연간 수십조원씩 쏟아붓는 미국·중국의 ‘빅테크’ 앞에선 한국은 물론이고 일본·독일·영국도 쩔쩔매고 있다. 송곳 같이 ‘딱 한 곳에서 통하는 인공지능’을 개발하는 것이 생존의 관건이다. 모두가 알지만 선뜻 못 하는, 그런 AI 스타트업을 만든 이들이 바로 한국의 AI 추격자들이다.]

그때 1편이 바로 업스테이지였다. 당시에 취재한 후배에게 “다 좋은데, 이대로 나가도 기사는 충분하긴 한데, 대체 이 스타트업은 뭘 해서 돈을 벌겠다는 거야?”라고 물었다. 후배의 답은 기억나지 않는다. 쫌아는기자들의 2022년 첫 인터뷰는 업스테이지의 김성훈 창업가다.

◇인공지능의 각 기능을 사스처럼 쓴다, 그 새로운 시장의 개척

인공지능의 시대라지만 막상 잘 모르겠어요. 클로바노트가 인공지능이죠? 막상 말귀를 못 알아들을때가 많아요. 1년정도 썼는데 생각보다 정확도 향상 속도가 떨어집니다. (@네이버의 클로바노트는 회의때 음성을 녹음하고 텍스트로 바꿔주는 앱)

“클로바노트가 조용한 환경에선 아마 정확도가 좀 있을 거예요. 굉장히 (정확도 향상 속도가) 가속화할 겁니다. 2~3년 안에 원하는 수준이 될 겁니다. 한번 들어보세요. 스릉흥응.(@김 대표는 입술을 꽉 다문채 ‘사랑해요’라고 웅얼거렸음.) 인간은 이게 무슨 말인지 알잖아요. 사랑해요라는 말을 너무 잘 알기 때문에 뭉개져도 알 수 있죠. 추정하죠. 뭐냐하면 랭기지에 대한 이해거든요. 인공지능은 인간의 발음을 표기하는건, 상당히 잘 해요. 모자란 지점은 언어적인 감각인데 굉장히 빨리 올라오고 있어요. 예를 들어 일반인이 의료학회 발표회에 가서 그대로 받아쓰라고 하면 태반은 틀릴 거예요. 뭔말이야 이럴꺼예요. 클로바노트는 지금 그런 상황일거예요. 발음은 다 들리는데, 뭔말인지 몰라서 그냥 받아쓴 정도요. 하지만 곧 사람보다 완벽하게 받아쓰기 시작할 거예요. 인공지능이 보편화되면, (일반인은 못하는) 의료 부분이나 국방 무기 부분과 같은 분야까지 사람보다 뛰어날 것이라고 봅니다. "

“인공지능이란 마차는 세 마리의 말이 끌고 가요. 데이터와 알고리즘, 인프라예요. 우선 데이터예요. 지금의 딥러닝 웨이브를 탄거는 데이터예요. 또 연구자들이 데이터가 적어도, 또는 인위적으로 생성한 데이터를 가지고도 돌아가는 알고리즘 연구를 하고 있어요. 여기에 인공지능칩같은 하드웨어의 진화요. 데이터도 양만 많다고 좋은게 아니라, 잘 가공된 형태로 만들어져야 해요. 지금까진 쭉쭉 쌓는데만 집중했다면 이젠 어떤 데이터를 어떻게 효과적으로 생성할까에 관심이 많기 때문에 데이터의 퀄리티도 높아지는 거죠. "

업스테이지가 본 페인포인트는 ‘그런 AI시대인데 뒤쳐질지 모르는, 기업의 불안함’ 인거죠?

“긴 비유를 들께요. 중소기업이 회계 직원을 뽑아요. 회계란게 덧셈과 뺄셈이니까, 갓 고등학교 졸업한 직원을 뽑아요. 근데 잘 못해요. 회계란 공부가 필요하죠. 어떻게 할까요. 사수를 두고 몇달을 가르치죠. 더 작은 회사는 회계학원에 보내요. 위탁해 한 두 달 배우면 회사로 데려오죠. 근데 회사마다 좀 독특한 회계 처리가 있어요. 학원에선 못 배워요. 비용도 비용이지만, 난감하죠.”

“업스테이지는 맞춤형 학원이에요. 그냥 일반적인 회계 처리는 물론이고, 그 회사만의 독특한 처리 항목까지도 신입 직원에게 가르쳐주는 학원요. OCR(optical character reader, 광학 문자 판독 장치)에 대입할께요. OCR은 글을 주면 글씨를 읽어내요. 잘해요. 덧셈, 뺄셈은 아주 잘하는 학생인거죠. 근데 OCR한테 우리 회사 영수증을 읽어봐, 영수증도 글씨니까 읽을수 있겠지, 그런 기대하지만 자꾸 틀려요. 이 부분은 돈이고, 이곳은 합계를 뜻하고, 여긴 갯수라고 알아야 읽어내거든요. 예컨대 일반적인 OCR에 그 회사의 특수한 영수증 형태를 가르쳐줘야해요. 우리가 그 회사의 OCR를 학습시켜주는 거죠.”

“네이버나 카카오같은 테크 회사는 그냥 자체적으로 합니다. 개발자 20~ 30명이 영수증 데이터를 가지고 모델 만들고 학습 돌려보고 뭔가 잘 안 되면 데이터 새로 만들고 모델도 새로 만들고요. 20~30명이 두세 달 정도면 만들어요. 근데 이건 굉장히 돈이 많이 들잖아요. 그걸 자동화해주겠다는게 업스테이지의 AI팩입니다.”

“뉴럴서치라는 의미 기반의 검색도 마찬가지입니다. 화장품 회사는 소비자에게 본인이 원하는 제품을 쉽게 보여주고 싶어요. 근데 화이트닝이란 단어를 모르는 소비자가 있어요. 이 분이 ‘얼굴 하얗게 해주는 화장품’이라고 검색하면, 결과값이 어떨까요. 그냥 키워드 검색만 쓰면, 못 찾아 주겠죠. 아까 의료학회 이야기하고 유사한데요, 인공지능이 화이트닝이란 의미를 이해못하면, 얼굴 하얗게 한다는 것과 매핑을 못합니다. 우리가 화장품 데이터를 가지고 한번 학습시켜줍니다. 학습은 지루하고도 굉장히 어려운 과정인데 그걸 자동화하는거죠. 업스테이지 AI팩의 핵심인데, 말하자면 구글에 있는 수십명의 엔지니어가 2~3개월 개발하는 걸, 우리가 대신 만들어 저렴한 가격으로 만들어 제공하겠다는 겁니다. 굉장히 싸게요. 올해 보급형을 내놓을 예정입니다. 데이터에 따라 다르지만 대략 1억 이내입니다. 쓰는 만큼 과금하는 구조로, 처음 설치할 때는 몇천만 원 단위로 써보고 효과가 있다면 그때 과금하는 식입니다.”

▶[전문은 가입후 보세요]◀

주 3회 발행하는 유료 레터 [스타트업]의 콘텐츠입니다. 가입은 https://page.stibee.com/subscriptions/158656 입니다. 뉴스레터 [스타트업]에 가입하면 이 기사의 전문은 물론이고 9개월 이상 축적한 콘텐츠 전부와 매주 신규 콘텐츠를 받아볼 수 있습니다.

아래는 원문에 실린 사진과 그래픽입니다.


이활석님(사진 왼쪽)과 김성훈 대표 /조선일보DB