오픈AI가 이미지 생성 인공지능(AI) 모델인 ‘챗GPT 4o(포오) 이미지 제너레이션(이하 이미지 젠)’을 24일 공개했다. 기존의 이미지 생성 AI는 사람이 구체적인 장면을 말이나 글로 묘사해서 알려주면 이를 대신 그려주는 수준이다. 새 모델은 특정 과학 원리나 물리적 개념까지 이해하고, 이를 설명하는 개념도를 알아서 그릴 정도로 똑똑해졌다.
오픈AI는 이날 이미지 젠을 공개하며 “텍스트 기반의 지식과 이미지에 대한 지식을 고루 갖춘 AI”라고 설명했다. 실제 이미지 젠에 ‘뉴턴의 프리즘 실험을 디테일하게 설명하는 그림 그려줘’라고 했을 때, 곧바로 교과서에 실릴 만한 개념도를 자세하게 그려냈다. ‘프리즘 실험’은 빛을 굴절시키는 프리즘을 통해 가시광선에 다양한 색이 있다는 것을 증명한 뉴턴의 광학 실험이다. 사람이 구체적으로 지시하지 않아도, AI가 ‘프리즘 광학 원리’를 이해하고 이를 설명하기 위한 이미지를 스스로 만들어낸 것이다. 샌프란시스코는 왜 안개가 자주 끼는지 설명하는 이미지도 대류 현상을 이해해 순식간에 만든다. 그림 안에 텍스트(설명문)를 적재적소 써 넣는 것도 기존 AI 모델은 하지 못하던 것이다. 가브리엘 고 오픈AI 멀티모달 담당은 “2년 전부터 훈련을 시작한 이 모델은 우리가 알고 있는 한 텍스트와 이미지를 통합한 가장 뛰어난 이미지 생성 AI”라고 했다.
오픈AI는 지금까지 챗GPT의 기본 이미지 생성 AI 모델이었던 ‘달리’를 ‘이미지 젠’으로 교체한다고 밝혔다. 챗GPT 웹사이트·앱에 로그인을 한 이용자라면 유료 구독자가 아니더라도 바로 이미지 젠을 쓸 수 있다. 고 담당은 “이미지 AI는 (상상한 그림을 그려주는) 참신함에서 (정확한 그래픽까지 그려내는) 유용함 단계로 넘어가고 있다”고 했다.