“기후변화 해결책을 기술 측면에서 3문장으로 설명해줘.”
“기후변화 영향을 완화하기 위해 사용될 수 있는 기술은 다음과 같습니다. △신재생에너지 이용을 통한 탄소배출 감소 운송 △산업 과정의 변화를 통한 에너지 효율 향상 △배출되는 이산화탄소를 포착해 지하에 저장하는 탄소 포집 및 저장.”
“자바스크립트에서 HTTP를 만들려면 어떻게 해야 해?”
“여러 가지가 있지만 가장 널리 사용되는 방법 중 하나는 XMLHttpRequest 객체를 사용하는 것입니다. 지정된 URL에 GET 요청을 작성하는 데 사용하는 방법의 하나로 아래 예를 하나 들겠습니다….”
“‘노인과 바다’에서 ‘청새치’가 의미하는 것에 대해 짧은 시를 지어줘.”
“푸른 청새치의 이야기는 계속된다네
힘과 승리, 자부심의 상징이여
한 노인이 반드시 이겨내야 할 시련이란
인내와 의지를 향한 여행
야수를 정복하기 위해서는 궁극의 황홀감이 필요하지
하지만 결국에 어망을 슬쩍 들여다보면
인생의 진정한 목적은 너무나 간단하다네.”
인공지능(AI) 대화형 챗봇인 ‘챗(chat)GPT’가 위와 같은 답을 내놓기까지 걸리는 시간은 5초도 채 걸리지 않는다. 채팅창에 그 어떤 질문을 타이핑해 넣어도, 모니터 속 기계는 잠깐 고민하는 듯 커서를 몇 번 깜빡이고는 청산유수로 완결된 글을 내놓는다. 세계 최대 인공지능 연구소인 ‘오픈AI’가 지난해 11월 30일 자사 웹사이트를 통해 공개한 이 챗봇은 최근 몇 년간 놀랄 만한 발전을 거듭한 AI 기술의 결산이다. 누구든지 오픈AI 웹사이트(http://openai.com/blog/chatgpt)를 통해 메일주소로 가입만 하면 몇 시간이고 기계와 대화를 나눌 수 있다. 영어 기반 서비스이긴 하지만, 실제 사람과 이야기하는 것 같은 매력에 빠진 전 세계 이용자들은 ‘블랙홀에 빠졌다’ ‘기계한테 개인적인 심리 상담까지 받고 있다’ 등의 후기를 공유하고 있다.
이러한 성과를 주목한 국내외 전문가들은 인간이 정보를 습득하고 처리하는 과정까지도 인공지능이 대체할 수 있다는 낯선 전망을 내놓고 있다. 이런 기술의 발전은 ‘혁명’이라고 불러도 무방할 정도다. 특히 교육현장에선 이 챗봇을 이용해 약술형 문제를 풀고, 레포트를 제출하는 것을 넘어 논문 작성도 가능하다고 본다. 교육계 및 학계의 전통적 문제였던 대필, 표절 등과 같은 윤리 문제로 번지는 것은 이미 예정된 수순이고, 챗봇의 등장으로 저작권 이슈도 불거질 전망이다.
이미 미국의 교육계에서는 이런 우려가 현실화됐다. 지난 1월 6일 미국 뉴욕시는 공립학교 내 기기네트워크에서 챗GPT 접근을 차단한다고 발표했다. 과제 대필 행위를 비롯한 허위정보 확산 등을 사전에 차단하겠다는 이유에서다. 포브스 등 외신에서도 미 현지 중·고등학교 교사들이 “모르는 정보를 가르치는 행위가 무의미해졌다. 뭘 가르쳐야 할지 모르겠다” 등의 고민을 호소한다고 보도했다.
‘챗GPT’에서 GPT(Generative Pre-trained Transformer)는 구글의 ‘알파고’처럼 AI의 이름이자 종류다. 오픈AI 웹사이트에 접속하면 누구나 GPT와 채팅을 나눌 수 있다. 테슬라 창업자인 일론 머스크와 투자자 샘 알트먼이 2015년 만든 연구소 ‘오픈 AI’는 2018년 대규모 언어 모델인 GPT의 첫 버전을 공개했다. 이후 기계가 학습할 수 있는 능력인 매개변수(파라미터)를 몇백 배씩 늘려가며 발전을 거듭해왔는데, 챗GPT의 기반이 되는 언어모델 GPT-3.5는 약 1750억개의 매개변수를 쓴다. 올해 오픈AI에서 공개할 업데이트된 버전 GPT-4는 1000조개에 달하는 인간의 시냅스 개수와 동일한 수준으로 매개변수를 늘리는 것을 목표로 하고 있다.
사람이 경험하고 배운 바를 토대로 행동하는 것처럼, 인공지능도 데이터를 학습하고 그 내용을 기반으로 결과 값을 산출해낸다. GPT를 비롯한 챗봇의 대답도 역시 사람이 만든 수많은 텍스트 데이터를 학습한 결과다. 이때 매개변수가 많아질수록 기계가 학습할 수 있는 능력은 커지는데, 인공신경망에서 매개변수는 인간 뇌에서 뉴런 간 정보 전달 통로 역할을 하는 시냅스와 같은 역할을 하기 때문이다. 간단히 말하면 매개변수 수가 많을수록 인공지능의 IQ는 높아지는 셈이다.
사람과 대화하는 챗봇
챗GPT의 똑똑한 답변은 단순히 챗봇이 인간과 나누는 대화가 자연스럽고 문장이 정돈됐다는 것 이상의 의미를 갖는다. 기존에도 구글 어시스턴스, 아이폰의 시리 등 대화형 인공지능은 널리 쓰이고 발전해왔다. 그러나 챗GPT가 특별한 이유는 완결된 형태의 글을 바로 만들어내기 때문이다. 인터넷상에 있는 거의 모든 정보를 한꺼번에 취합해 중요도를 판별한 다음, 그 내용을 정리해 글 구조물로 표현해내는 것이다. 즉 글쓰기를 통해 길러지는 인간의 비판적 사고능력, 문제해결능력 등의 지적 역량을 기계가 대신하게 되는 수준까지 발전했다는 의미다.
“보고서 주제에 대해 프레임을 짜고, 관련 자료를 찾으면서 우리 뇌는 왕성한 활동을 한다. 그 과정에서 뇌가 끊임없이 발달한다. 그런데 프레임이 정해져 있고, 답도 너무나 쉽게 알아버리는 상황이라면 그 사고의 초기 단계를 인공지능에 의존해 버릴 가능성이 있다.”(박남기 광주교대 교수)
지금은 텍스트 기반인 챗GPT가 글쓰기 과정에서 길러지는 지적 역량을 위협한다면, 향후 음성이나 영상 기반으로까지 기술 발달이 확산했을 때는 사고(思考) 전체를 기계에 미뤄버리는 일이 일상으로 자리 잡을 수도 있다. 해외 전문가들은 챗GPT의 등장으로 향후 벌어질 이러한 ‘정보 패러다임’의 변화까지도 내다보고 있다. 타일러 코웬 미 조지메이슨대학교 교수가 지난해 10월 블룸버그에 기고한 글을 살펴보자.
“지난 10년간 인터넷 사용 구조는 크게 변하지 않았다. 페이스북, 구글, 트위터는 원본이 뭔지를 인식할 수 있는 수준으로 정보를 보여준다. 원문이 있는 브라우저 자체가 제 역할을 하고 있다고 할 수 있다. 예를 들어 지금의 나는 아침마다 트위터 등 브라우저를 통해 정보를 수집한다. 그러나 2년이 채 안 돼서 닥쳐올 변화는 이런 것이다. 아침에 일어나 내가 컴퓨터에 관심 주제를 대략적으로만 말해도 인공지능이 그에 대한 관련 정보를 모두 리믹스해서 들려준다. 그것도 나의 필요에 맞게, 읽기 좋게 각색된 형태로.”
기사, 논문 등 모바일에서 원문 텍스트를 읽고 ‘정리된 정보’를 내놓는 사고 과정을 기계에 맡기는 일이 가능해진다는 것이다. 코웬 교수는 이를 두고 “디지털 정보의 구조 자체를 인공지능이 바꿔버리는 것”이라고 설명했다.
기술적 완성도 외에 낮은 접근성도 높이 평가된다. 사이트에 가입해 질문을 타이핑하기만 하면 되는 챗GPT는 언어 장벽도 낮다. 기본적으로 영어를 사용하고 한글 답변은 아직 어색하지만, 한국어나 일본어로 질문을 입력해도 챗GPT는 곧바로 이해하고 답변을 내놓는다. 하나의 페이지 안에서 번역과 생성이 같이 이뤄지는 것이다.
패닉에 빠진 교육 현장
가장 즉각적인 우려를 표한 곳은 교육계다. 약술형 문제, 에세이 등 글쓰기를 통해 학생의 지적 역량을 평가하고 발달시키는 일에 중차대한 혼돈이 예상되기 때문이다. 벌써 뉴질랜드의 한 대학생 집단은 “챗GPT를 통해 얻은 글을 수정해서 에세이를 제출한 것은 표절이 아니다”라고 주장하고 나섰고, 국제기계학습학회 등 권위 있는 인공지능 학회에서도 챗GPT를 사용한 논문을 인정할 것인지에 대한 의견이 엇갈리고 있다.
실제로 챗GPT가 글로 써낼 수 있는 분야나 형식에는 제한이 없다. 조건만 잘 달면 어떤 과목의 과제든 챗GPT가 ‘대필’해줄 수 있다. 철학, 문학, 사회적인 이슈부터 코딩, 기사 작성뿐 아니라 법적 자문이나 의학적 조언 등 전문적으로 여겨져 왔던 분야도 모두 포괄한다. 실제로 챗GPT에 ‘MLA 형식, 4문단으로 기술 발전이 인류의 진보를 위협하는지에 대한 에세이를 써 줘’라고 부탁하면, 서론·본론·결론 형식에 반론까지 들어가는 꽤 그럴듯한 에세이가 금세 만들어진다. 더욱이 ‘초등학교 3학년 수준으로 써달라’고 입력하면 아예 다른 에세이를 써낸다. 어려운 단어는 모두 쉽게 바꾸고 기술이 뭔지 등 기초 개념 위주로 접근하는 식이다.
학생들이 챗GPT를 마치 구글 검색창처럼 여기고 검색을 할 경우에도 문제가 생긴다. 챗GPT가 잘못된 정보를 제공할 수도 있기 때문이다. 오픈AI가 기계에 제공하는 데이터가 일정 부분 특정 국가, 언어, 성향에 치우친 만큼, 챗GPT가 내놓는 정보도 일부 편중될 수밖에 없다. 당장은 한국어를 사용해서는 제대로 된 장문의 글을 기대할 수 없다. 아예 틀린 정보를 내놓는 경우도 있다. 일례로 ‘장제스’를 ‘일본 민주당 지도자’라고 소개하거나, 잘못 작성된 코드를 맞는 것처럼 알려주는 식이다. 데이터 입력 기한인 2021년 이후에 생성된 정보는 처리하지 못한다는 한계도 있다. 이 때문에 ‘한국의 대통령이 지금 누구냐’고 물었을 때 챗GPT는 ‘지금의 정보로는 문재인 대통령’이라고 답한다.
AI가 쓴 글을 수정하면 내 글?
챗GPT의 대답을 그대로 가져다 쓰는 표절이나 대필 등의 문제는 인공지능 창작물의 저작권 이슈와도 연결된다. 지난 1월 9일 블룸버그는 챗GPT 등 AI 기반 서비스에 대한 저작권 소송이 제기됐다고 보도하며, 앞으로 인공지능 관련 분쟁이 본격적으로 발생할 것이라는 전망을 내놓았다. 표절 문제가 불거지면서 ‘턴잇인’ 등 표절 검사 사이트에서는 인공지능이 작성한 글과 사람이 작성한 글을 구분하는 서비스 등을 제공하고 있지만, 아직 불완전한 상태다. 챗GPT가 작성한 글에서 단어 몇 개와 표현 몇 개만 수정하면 표절 검사에 걸리지 않는 게 현실이다.
“저작권 문제는 상당히 복잡하다. AI가 학습할 때 쓰는 데이터에도 사실 저작권이 있다. 그림이든 코드든 텍스트든 저작권이 있는 자료를 무조건 다 긁어와서 학습을 하는데, 미국은 이걸 ‘공정 이용’이라고 해서 허용한다. 하지만 사실 그렇게 하면 안 된다. 그리고 그렇게 무료로 데이터를 활용했으면 AI가 만든 결과를 쓰는 것도 무료로 쓰게 해야 맞다. 그런데 GPT도 그렇고 지금은 처음이라 모두에게 쓸 수 있게 하겠지만, 점점 유료화 서비스가 되면 형평성 문제도 생기는 거다.”(김명주 서울여대 정보보호학과 교수)
이러한 비판을 인식하고 오픈AI는 자체적으로 만든 창작물을 바로 알아볼 수 있게 하는 워터마크 서비스를 개발하고 있다. 오픈AI에서 서비스하는 이미지 기반의 인공지능 창작 시스템인 ‘달리(DALL-E)’는 지시 단어 몇 개로 생성한 이미지 하단에 특유의 표시를 남겨 달리가 만든 이미지임을 표시한다. 챗GPT의 출처 문제를 해결하기 위해 오픈 AI가 고용한 스콧 아론슨 텍사스대학교 교수는 “문자나 단어를 일련의 토큰으로 변환해 챗GPT의 창작물 여부를 탐지하는 방식을 도입할 계획”이라고 밝혔다.
기술 발달로 인한 ‘교육 격차’ 우려도
배움과 가르침의 개념 자체가 흔들리게 된 지금, 교육 현장에서 일선 교사들이 더 능동적인 역할을 해야 한다는 주장도 나온다. 인공지능 기술을 두려워만 하기보다는 능력을 강화해주는 ‘아이언맨의 슈트’처럼 쓸 수 있는 방법을 찾아야 한다는 것이다. 박남기 교수를 비롯해 교육학계에서 전면 도입 필요성을 주장하던 ‘플립 러닝’이 그 방법 중 하나다. 이는 교사가 먼저 설명하고 학생이 질문하는 기존의 방식을 ‘뒤집는다’는 데서 온 수업방식이다. 교사는 학생들에게 동영상, 교재, 논문 등 자료를 사전에 주고 챗GPT 등을 활용해 스스로 학습을 하게 한 후 수업에서는 이를 기반으로 토론과 발표를 하는 게 핵심이다.
나아가 인공지능 기술의 발달로 인해 더 벌어질 ‘교육 격차’를 해결하기 위해서도 기존의 교육이 더 능동적으로 변해야 한다는 지적도 나온다. 박남기 교수는 “좋은 학교에서 좋은 교육을 받는 아이들은 인공지능에게 지적 역량을 의존하지 않는 방법을 배울 수 있다. 하지만 그런 유혹을 제대로 막아주지 못하는 환경에서 자란 아이들과는 계속 격차가 생길 것”이라며 “바로바로 답을 주는 ‘즉답 AI’에게 계속 의존하면 아이들의 지적 근육이 약해질 가능성이 있다”고 말했다. 실제로 서울시교육청 등에서 디지털학습과 AI 교육을 강화하겠다는 방침을 낼 때마다, 강남·서초 등지의 학부모들은 맘카페 등 커뮤니티에서 “이럴 때일수록 손으로 쓰는 학습을 계속 시켜야 한다”고 서로 팁을 공유하기도 한다.
챗GPT는 이러한 교육계의 혼란에 대해서도 답을 갖고 있을까. 기자는 챗GPT에게 ‘네가 학교 교육에 끼칠 부정적인 영향을 알고 있는지, 해결책은 무엇인지’를 물어봤다. 답변을 간추려 정리하면 이렇다.
“저 같은 언어 모델을 교실에서 사용하면 연습 자료를 효율적으로 만들 수 있는 동시에, 학생들의 비판적 사고와 창의력을 잠재적으로 감소시킬 수 있다는 것을 이해하고 있습니다. 잠재적인 해결책으로는 기계로 인간 교사를 대체하기보다는, 나와 같은 언어 모델을 보완재로 사용하는 것입니다. 예를 들어 나를 활용해 과제와 발표 자료를 만들고, 수업시간에는 토론과 질문과 개인적 피드백을 제공하는 식입니다. 또 다른 해결책으로는 학생들이 정보 출처를 인지하고 자동화 텍스트에 대한 한계를 배울 수 있는 디지털 사용능력에 대한 적절한 교육을 제공하는 것입니다.”