뉴스레터 [스타트업]에서 발송한 콘텐츠입니다. 매주 화/목/금 레터를 발송하는 유료 멤버십입니다. 스타트업 콘텐츠를 모은, 회원 전용 아카이브 [쫌아는아카이브]도 제공합니다. 가입을 원하면 [클릭] 하세요. 네이버에선 이 링크입니다. https://page.stibee.com/subscriptions/143087

이 기사는 온라인에는 7일간 공개한뒤 유료로 전환합니다.


2016년 겨울 윤석원(49) 대표는 자폐 청년 세 명의 멘토가 됐다. 예상치 못한 일이었다. 한 글로벌 소프트웨어 기업이 발달장애인을 인턴으로 채용해 실무를 가르치는 프로그램이었다.

“난리 났죠. 아이들이 소리 지르고 바닥에 눕고요. 발달장애인을 가르쳐본 적이 없었죠. 20분 수업하고 10분 쉬면서 수업했어요. 하지만 가능성을 봤죠. 집중력이 좋았습니다. 어떤 과목에선 놀랄 정도로 고득점을 땄어요. 반복적이면서 집중력이 요구되는 코딩 작업에서 잠재력이 있었습니다.” 윤 대표는 200시간 가량 자폐 청년들을 가르쳤다. 윤석원 대표가 테스트웍스를 창업한지 1년 남짓 지났을 때였다. 경력 단절 여성을 고용하는 직원 10명 안팎의 소셜임팩트 기업 창업자였다. 창업 전엔 마이크로소프트 엔지니어, 삼성전자 총괄 수석 연구원을 거친 꽤 이름을 날렸던 개발자였다.

교육 과정은 끝났고 피날래는 성과 발표의 날이었다. 글로벌기업의 한국 지사장과 사회공헌팀장, 멘토들이 모였다. 그리고 자폐아와 그들의 부모. 한 어머니가 마이크를 잡았다. “일주일 잠을 못 잤습니다. 아이들이 인턴이 됐을 때...” 그의 목소리가 떨렸다. “우리 아이가 인턴이 됐을때 아 이렇게 정규직까지 될 수 있겠다. 혹시 그럴 수도. 그런데요, 인턴 한번 했다고 우리 아이의 미래가 달라질까요.” 누구를 향한 질문이었을까. 프로그램을 만든 사회공헌팀장이 답했다. 그는 “죄송합니다”라고 했다. “사실은 이 인턴십, 안팎에서 반대 무척 많았습니다. 제가 우겨서 했습니다. 제가 만들고 싶었습니다. 제 다섯살 아들도 자폐입니다. 여기 아이들의 현재 모습이 제 아들의 조금뒤 모습입니다. 그게 여기, 여기, 인턴까지요. 마음이 아픕니다. 아직 우리 사회와 기업은 우리 아이들을 받을 준비가....” 누군가 먼저 울었고 부모가 울었고, 그리고 청년들이 울기 시작했다.

청년의 눈물이 준 울림이라고하면 오버일지 모른다. 윤 대표가 자리에서 일어났다. “저기요, 아이들을 가르쳐보니 그들은 가능성이 있습니다. 제가 작은 회사를 운영하는데, 시간을 주신다면 이 친구들 채용하겠습니다.” 스타트업 테스트웍스는 그때가 피벗의 시작이었다. 이런 것도 피벗이라고 한다면 말이다.

테스트웍스 윤석원 대표. /테스트웍스 제공

◇인공지능 시대, 더티 워크를 하는 스타트업

테스트웍스는 발달장애인, 청각장애인 30여 명을 고용한 인공지능(AI) 스타트업이다. 전체 직원(145명)의 4분의 1이다. 그들은 단순 업무 보조자가 아니다. 자율주행, 스마트물류, 글로벌 해운 관제 시스템 등 첨단 AI 소프트웨어의 데이터를 가공하는 핵심 업무를 맡는다.

내심 계획이 있었으니 발달장애인들을 채용했겠죠?

아뇨, 전혀 없었습니다. 그 일이 벌어진 날 저녁, 때마침 자율주행 기술 스타트업 스트라드비젼 김준환 대표로부터 전화가 왔습니다. 자율주행 비전 데이터를 정교하게 다듬어줄 작업을 의뢰하고 싶다고요. 자율주행차의 카메라를 통해 수집된 데이터는 사람 손을 거칩니다. 아직 자율주행 AI는 도로 위의 사람, 자동차, 표지판 등을 100% 완벽하게 구분 못 합니다. 특히 초기 엔진은 정확도가 더 떨어졌어요. 예컨대 우리 회사 모 이사님이 탈모로 대머리입니다. 엔진이 이분을 사람으로 인식을 못 했습니다. 머리카락이 없어서요. 누군가는 AI에 ‘사람’을 구분해 지정해 학습시켜줘야 했죠. 왠지 그 일을 발달장애인 팀원들이 잘할 수 있을 것 같았습니다. 김 대표에게 전화로 ‘팀원들에게 장애가 있는데, 일을 맡겨도 되겠느냐’고 물었습니다. 김 대표가 “품질만 좋으면 무슨 상관입니까”라고 답했습니다. 그때부터 장애인들이 데이터 가공을 맡게 됐습니다.

AI를 위한 데이터 가공, 그게 뭘까요. ‘비정형 데이터’의 ‘정형화’라던데요.

정형 데이터 엑셀에 쫙 정리가 돼서 담긴 데이터입니다. 룰과 원칙이 있는 데이터요. 비정형 데이터는 아무 룰이 없는 데이터입니다. 스트라드비젼의 카메라로 찍은 도로 사진이 비정형데이터죠.

테스트웍스는 돼지 출산 모니터링 AI에 필요한 데이터를 가공해 납품합니다. 카메라 센서로 돼지우리에서 새끼 돼지만 감별하는 소프트웨어인데, 영상에서 새끼 돼지가 계속 움직이겠죠? 이걸 사람이 영상 속 아기 돼지에 표시를 합니다. ‘좌표 X축과 Y축, 어떤 벡터의 특정 물체가 새끼 돼지다’를 숫자로 AI에 알려주는 셈이죠. AI는 이 데이터를 받아 공부를 하고, 나중엔 혼자 새끼 돼지를 구분할 수 있게 됩니다.

이미지 라벨링, 데이터 라벨링이라고 합니다. 사람이 데이터라는 재료를 요리해서 AI에 밥과 반찬으로 만들어주는 일이요.

AI는 공부도 알아서 하는 것 아닌가요. 구글 알파고는 그냥 기보만 입력하니 알아서 최강자가 되던데요. 사람이 이런 노동까지 해야 하나요.

데이터 라벨링을 업계에선 ‘더티 워크(Dirty Work)’라고 합니다. 반복적이고 노동 집약적인, 근면성이 요구되는 작업이니까요.

한 팀원은 성인물 모자이크를 자동으로 하는 소프트웨어를 학습시킵니다. 오늘 아침 출근했더니 “대표님, 며칠 계속 야동만 봤더니 토할 것 같다”고 하더군요. 다른 팀원은 항구 사진 수백장에서 ‘배’만 누끼(포토샵에서 사물의 모양을 따라 이미지를 떼내는 작업)를 떴습니다. 그런 작업이죠.

그런데 한국은 더티 워크가 정말 필요한 시장입니다. 인공지능 개발 방식은 두가지입니다. 지도 방법과 비(非)지도 방법. 쉽게 말해 인공지능을 가르치느냐, 안 가르치느냐입니다. ‘이건 사람이야, 이건 아기 돼지야’라고 이렇게 데이터의 정답을 태깅해서 알려주는 것이 지도 방법입니다.

비지도 방법은 어마어마한 데이터 양이 필요합니다. AI가 알아서 정답을 찾아가려면, 그만큼 많은 오답을 알아야 하거든요. 구글처럼 손에 꼽는 글로벌 빅테크 기업과 개인정보보호 없이 방대한 데이터를 수집하는 중국만 가능한 방법입니다. 데이터 수집이 제한적인 한국 기업들은 지도 방식을 해야 하고, 그들에겐 더티 워크가 필수적이죠.

테스트웍스가 배를 '누끼' 따는 작업. 인공지능은 이런 바다 사진에서 배와 화물을 100% 완벽하게 구분해내지 못한다. 결국 사람이 배와 화물의 윤곽선을 따라 표시를 해주고, 이런 데이터를 바탕으로 AI가 학습을 한다. /테스트웍스 제공
스타트업/ 테스트웍스 /개요
스타트업/ 테스트웍스 /연도별 직원 수
스타트업/ 테스트웍스 /투자유치

▶[전문은 가입후 보세요]◀

뉴스레터 [스타트업]에 가입하면 이 기사의 전문은 물론이고 6개월 이상 축적한 콘텐츠 전부와 매주 신규 콘텐츠를 받아볼 수 있습니다. 커피 한잔의 가격으로 스타트업 현업의 고민을 공유하세요.

아래는 원문에 실린 사진과 그래픽입니다.