‘클린봇이 부적절한 표현을 감지한 댓글입니다.’
네이버에서 기사에 붙은 댓글을 읽다 보면 이런 안내문을 심심찮게 만난다. 악성 댓글(악플)을 탐지해 숨겨주는 인공지능(AI) 클린봇이 일을 한 흔적이다. 클린봇 설정을 ‘온(on)’에서 ‘오프(off)’로 바꾸면 감춰진 댓글이 모습을 드러낸다. 역시나 악플이다.
지난 6월 태어난 클린봇 2.0이 곧 100일을 맞는다. 과거에는 욕설로 분류할 수 있는 단어가 포함된 댓글만 솎아냈다면, 클린봇 2.0은 욕설이 없더라도 문맥상 모욕적이거나 타인을 비하하는 표현이 있을 경우 악플로 인식한다. 바둑 AI 알파고가 그랬듯이 학습을 지속하며 날마다 능력이 나아지고 있다.
악플도 진화(?)한다. 클린봇 2.0은 그럴수록 더 똑똑하게 더 많은 일을 처리해야 한다. 이 악플 청소 로봇이 모두에게 환영받는 것은 아니다. 해석은 다양할 수 있는데 일괄적으로 단속할 경우 표현의 자유를 위축시킬 수 있기 때문이다. 네이버 이용자피드백플랫폼 이규호 리더와 황태현 미디어운영 매니저는 “클린봇이 살피는 뉴스 댓글에는 한국 사회의 천태만상이 다 담겨 있다”고 했다.
◇악플 탐지 정확도 95%
클린봇은 하루에 악플 수십만 개를 ‘자동 숨김’ 처리하고 있다. 2.0 버전이 나온 뒤 처리량은 2배가량 늘었다. 기사에 따라 편차가 크지만 숨겨지는 댓글은 약 5~10%라고 한다.
지난달 말에는 연예 뉴스에 이어 스포츠 뉴스에 대한 댓글 서비스도 잠정 중단했다. 악플이 더 험악해지고 선수들이 받는 고통이 간과할 수 있는 수준을 넘었다는 판단 때문이다. 이규호 리더는 “댓글이 중단되는 동안 연예·스포츠에서 사용되는 언어, 패턴 등을 분석해 보다 효과적인 대응책을 마련할 것”이라고 했다.
클린봇 2.0은 욕설이나 비속어를 우회적으로 표현하는 댓글까지 노출을 제어하고 있다. ‘저 ㅈㅏㅂ 것들이 뭐라 씨부리냐’나 ‘미친X은 약도 없다’가 그런 경우다. 황태현 매니저는 “비속어 하나에도 약 10만개의 변칙어가 존재한다”며 “직접적인 욕설이 포함돼 있지 않아도 누구나 읽으면 욕설인 것을 알 수 있는 댓글은 걸러낸다”고 했다.
현재 악플 탐지 정확도는 약 95%다. 5%쯤 실수가 발생한다는 뜻이다. 클린봇이 학습하지 않은 신조어나 변칙어, 축약어 등과 마주칠 경우 처리가 어렵다. 댓글만으로는 불분명해서 기사 내용과 함께 읽으면 맥락상 악플로 분류되는 경우도 있다. 또 시간의 흐름에 따라 같은 댓글이 덜 나쁘게 수용되기도 한다.
“예를 들면 ‘존맛탱’ ‘존멋’이 그렇다. ‘존맛탱’(정말 맛있다는 뜻)은 예전에는 비속어였는데 지금은 지상파 방송에서도 보인다. ‘꼰대’도 최근 들어 의미가 변하고 있다. 나이 먹은 사람이나 보수적인 사람을 지칭하는 부정적인 뜻으로만 쓰는 게 아니라 ‘나 꼰대야!’라고 유머러스하게 말하기도 한다. 어느 분야에서 고인 물이지만 그만큼 오래됐고 그만큼 능력이 있다는 뜻으로 바뀐 것이다.”(이규호)
◇건전한 비판과 악플의 차이
올 들어 뉴스 기사에 남긴 댓글 이력을 공개하고 나서 악플은 절반가량 줄었다고 한다. 일부 이용자는 신조어를 사용해 탐지망을 회피하고 있다. 하지만 표현이 생소한 만큼 의도를 전달하기 어려워진다. 이규호 리더는 “의견 제시와 악의적 비난의 경계에서 상징 또는 고의적 오탈자로 의도를 감춘 댓글은 처리하기 어렵다. 일부러 목적어를 생략해 의미를 애매하게 만드는 경우도 많다”고 전했다.
클린봇이 ‘맘충’ ‘짱깨’ ‘꼴페미’ ‘한남’ 같은 혐오 표현도 포착할까. 황태현 매니저는 “잡아내지 못하는 것은 아니지만 맥락상 측정치에 따라 결과는 달라질 수 있다”며 “클린봇 2.0은 누가 봐도 ‘이건 악플이야’ 하는 사례를 학습했기 때문에 그 통계에 따라 움직인다”고 설명했다. 단순히 단어만으로 가늠하는 게 아니라 그 댓글이 소비자에게 어떻게 받아들여질지에 따라 판단한다는 뜻이다.
건전한 비판과 악플을 구별하는 법은 간명하다. 건전한 비판은 그 대상의 마음을 아프게 하고 되돌아보게 하는 것이지, 부모까지 들먹이며 인격적 모멸감을 주는 것은 아니다.
“신문 사설은 어떤 문제를 신랄하게 지적하지만 욕설과 비속어를 동원하지는 않는다. ‘비판도 좋고 표현의 자유도 좋지만 우리 애들이 보는 공간에 왜 이런 민망한 표현까지 보여야 하느냐’는 질문을 받은 적이 있다. 우리가 줄이려고 애쓰는 악플은 그런 부류다. 건전한 비판이라면 적어도 애들한테 거리낌 없이 보일 수 있어야 하지 않나.”(황태현)
전문가들은 악플을 욕설, 비속어, 선정적 표현, 폭력적 표현, 차별적 표현, 조롱적 표현 등으로 구분한다. 악플을 잡다가 표현의 자유를 훼손할 수 있다는 우려에 대해선 어떻게 답할까. 이규호 리더는 “심각한 욕설, 성범죄 옹호, 인신공격, 생명 경시 등은 표현의 자유를 넘어선 폭력”이라며 “이런 사례를 수집해 클린봇이 학습할 데이터를 구성한다”고 했다. 앞으로는 악플러 활동 제한(1일 제한, 30일 제한, 영구 제한 등)에 그치지 않고 선플러 활동을 부각하는 등 인센티브를 부여하는 방안도 검토 중이다.
◇클린봇으로 본 세상
클린봇 2.0으로 본 한국 사회는 어떤 모습일까. 황태현 매니저는 “뉴스는 우리가 사는 세상 전반을 다룬다. 100명이 100가지 의견을 말하는 식이라 다양한 생각이 공존하는 것 같지만 실상은 다르다”고 했다. “한 기사에 붙은 댓글들을 보면 서로 대화는 적고 욕설은 적지 않다. 일방적 의견 표출이 대부분이라 토론이 벌어지진 않는다. 이 천태만상을 어떻게 조율하며 함께 살아가는지 의아할 정도다.”
운영진은 클린봇 2.0을 준비하면서 출근부터 퇴근까지 악플만 모아놓은 엑셀 뭉치를 종일 들여다보곤 했다. 오랜 기간 악플에 집중적으로 노출된 셈이다. 황 매니저는 “클린봇 운영팀에 ‘악플과의 전쟁’은 괴로운 감정노동”이라며 “중간중간 바람을 쐬고 머리를 식힌다. 팀원들에게는 ‘귀가하면 좋은 생각을 하고 마음이 따뜻해지는 책을 보라’고 권한다”고 했다.
네이버 댓글은 17년째 유지되고 있다. 클린봇 개발자와 운영자는 보람과 긍지보다 책임감을 더 느낀다고 했다. “오래 전 기사를 찾아보면 그 시절 사람들의 의견이 댓글 형태로 남아 있다. 아주 커다란 서고(書庫)를 관리하는 기분도 든다. 과거에는 긴 댓글이 많았는데 요즘 댓글은 사용하는 언어 자체가 짧아졌다.”(황태현)
댓글창은 의견을 적는 곳이지만 감정 배설구이기도 한다. 이규호 리더는 “공감과 연민, 위로의 장소일 수도 있다”며 “건설적인 댓글이 많아져서 클린봇이 할 일이 점점 적어졌으면 좋겠다”고 말했다. 탐지 정확도 등을 높인 클린봇 3.0도 설계 중이다. 여섯 살 딸이 아빠가 무슨 일을 하는지 묻는다면 뭐라고 답할까. 그는 ‘좀 더 아름다운 세상을 만들려고 노력하는 플랫폼 개발자’라고 했다. /박돈규 기자