[쫌아는기자들] 샘 올트먼과 오픈AI의 ‘무엇이든 물어보세요’

이달초, 미국의 커뮤니티 사이트 레딧에서 오픈AI를 대상으로 한 AMA, Ask Me Anything이 열렸습니다. ‘궁금한 것은 다 물어봐’인 셈인데요. 온라인 커뮤니티에서 챗GPT를 비롯해 인공지능(AI)에 관심이 많은 이용자들이 질문을 하면 오픈AI 구성원들이 답을 하는 형식이죠. 레딧에선 이런 식의 AMA가 열려 화제였지만, 특히 이번 AMA에는 샘 올트먼을 비롯해 오픈AI의 C레벨과 VP(Vice President)들이 모두 등판해 흥미진진했습니다.오픈AI의 답변은 아주 쿨하고 짧습니다. 유머스럽기도 하고요. 그 가운데, 다음 GPT 모델과 앞으로 챗GPT서비스가 진화할 방향. 올트먼과 오픈AI 구성원들이 생각하는 AI의 미래에 대한 힌트가 곳곳에 숨어있습니다. 쫌아는기자들은 그들의 AI인 챗GPT를 이용해 AMA 전문을 번역했고, 덧붙여 AMA에 등장한 어려운 용어나 맥락에 대해 쫌아는기자들의 추가적인 설명을 덧붙였습니다. 일종의 친절한 번역이라고 할까요. 80% 정도의 질답을 담았습니다(일부는 그냥 농담 주고 받기이거나, 동어 반복이라 제외했습니다.) AMA 전체를 볼 수 있는 레딧 주소는 <여기>입니다.

1. 챗GPT에 마스코트가 있다?

질문: Advanced Voice 모드에서 음악적 기능(예: 노래)이 추가될 예정인가요? 이에 대한 일정이 있나요?

Kevin Weil(Chief Product Officer): 작업 중입니다! 저도 ChatGPT가 노래하는 것을 듣고 싶습니다. (Working on it! I want to hear ChatGPT sing too.)

<쫌아는기자들 : 챗GPT로 작곡이 되나요? 네. 됩니다. 음계와 비트도 결국 숫자로 표현할 수 있으니까요. 가사 작성, 코드 진행 생성, 멜로디 아이디어 도출까지도 챗GPT로 가능하고, 아예 전문적인 툴과 연동해 시연하는 유튜브 영상도 있습니다. 단, SUNO처럼 아예 음악 생성을 타깃으로 만든 다른 AI 툴에 비해 챗GPT의 목적이 ‘음악 제작’이 아니다보니 불편한 점이 있는데요. 음악에 대한 전문적인 학습과 사용성을 보강한 기능이 챗GPT에 추가될 가능성이 있는지를 물었고, 실제 준비 중이라고 하네요.>

질문: 사람들이 ChatGPT를 치료 목적으로 사용하는 것에 대한 의견은 무엇인가요?

Sam Altman(CEO): 분명히 ChatGPT는 치료사가 아니지만, 많은 사람들이 그것과 대화하며 문제를 논의하는 데서 가치를 얻고 있습니다. 이 분야에서 더 많은 것을 탐구하는 스타트업들이 많이 나타나고 있으며, 누군가가 훌륭한 것을 만들어내길 바랍니다. (it’s obviously not a therapist, but clearly a lot of people get value out of talking about their problems with it. we have seen a lot of startups really exploring how to do more here; i hope someone builds something great!)

질문: GPT-4o의 토큰 컨텍스트 길이가 언제 증가할 예정인가요? 제 생각에는 32k는 특히 긴 코딩이나 작성 작업에 비해 다른 AI 모델들과 비교했을 때 너무 작습니다.

Kevin Weil(Chief Product Officer): 동의합니다. 현재 작업 중입니다! (Agree. We’re working on it!)

<쫌아는기자들 : 챗GPT의 토큰 길이 한도는 사용하는 모델에 따라 다릅니다. GPT-3.5 모델은 한 번에 최대 4096개의 토큰을 처리할 수 있으며, GPT-4 모델은 최대 3만2768개의 토큰을 처리할 수 있습니다. 이러한 토큰 한도는 입력과 출력의 토큰 수를 합한 값으로 계산됩니다. 쉽게 이야기하면 AI에게 물어볼 수 있는 질문의 길이, 입력할 수 있는 텍스트의 길이가 너무 짧다는 이용자들의 불만이 있고, 오픈AI도 잘 알고 있어서 이 길이를 늘려주겠다는 것입니다>

질문: 일리야는 무엇을 보았나요?

Sam Altman(CEO): 초월적인 미래를 보았습니다. 일리야는 놀라운 비전가로, 누구보다도 미래를 명확하게 내다봅니다. 그의 초기 아이디어, 열정, 비전은 우리가 이룬 많은 것들의 핵심이었으며, 예를 들어 그는 나중에 o1이 된 몇 가지 아이디어의 초기 탐구자이자 지지자 중 한 명이었습니다. 이 분야는 그를 가지게 되어 매우 행운입니다. (the transcendent future. ilya is an incredible visionary and sees the future more clearly than almost anyone else. his early ideas, excitement, and vision were critical to so much of what we have done, for example he was one of the key initial explorers and champions for some of the ideas that eventually became o1. the field is very lucky to have him.)

<쫌아는기자들 : 일리야 수츠케버와 샘 올트먼은 2015년 오픈AI를 공동 설립한 동료로서, 인공지능 연구와 개발에 함께 기여해왔습니다. 그러나 AI 개발 속도와 안전성에 대한 견해 차이로 인해 갈등이 발생했습니다. 2023년 11월, 수츠케버는 올트먼의 해임을 주도했으나, 이후 자신의 결정을 후회하며 올트먼의 복귀를 지지했습니다. 2024년 5월, 수츠케버는 오픈AI를 떠났고, 6월에는 ‘안전한 초지능’ 구축을 목표로 하는 새로운 AI 스타트업 ‘SSI Inc.’를 설립했습니다. 올트먼은 한때 동료이자 배신자이자 복잡한 관계인 수츠케버에 대해 직접 답한 것이죠.>

질문: 비즈니스 논리 관점에서 “사고의 사슬”이나 “다층적 사고 트리”를 실행하기 위해 추론 비용이 얼마나 빠르게 감소할 것으로 예상하십니까? 가능한 한 빠르고 저렴하게 추론 체인을 실행하고자 합니다.

Srinivas Narayanan(VP): 우리는 추론 비용이 계속 감소할 것으로 예상합니다. 지난 1년 동안의 추세를 보면, 약 10배 감소했습니다. (We expect inference costs to keep going down. If you see the trend over the last year, it’s come down like 10x.)

<쫌아는기자들 : ‘사고의 사슬’(Chain of Thought, CoT)은 복잡한 문제를 단계별로 해결하는 사고 과정을 의미합니다. 인공지능 언어 모델에서 CoT는 복잡한 질문에 대한 답변을 단순히 제공하는 대신, 중간 과정을 단계별로 설명하면서 최종 답변에 도달하는 방식을 말합니다.

‘다층적 사고 트리’는 문제를 해결하기 위해 논리적으로 구조화된 트리 형태의 사고 방식을 의미합니다. 이는 주어진 문제를 상위 개념에서 하위 개념으로 분해하여 각 단계에서 고려해야 할 요소들을 체계적으로 분석하는 방법입니다. 이러한 접근 방식은 복잡한 문제를 작은 단위로 나누어 해결하는 데 유용하며, 로직트리(Logic Tree) 기법으로도 알려져 있습니다. 이러한 기법들은 인공지능 모델의 추론 능력을 향상시키는 데 활용되며, 복잡한 문제를 단계별로 접근하여 더 정확한 답변을 도출하는 데 도움을 줍니다.>

질문 : 챗GPT에게 마스코트가 있나요?

Kevin Weil(Chief Product Officer):

/오픈AI

2. 올트먼이 꼽은 최고의 챗GPT 활용사례

질문: 챗GPT의 생일에 특별한 선물이 있나요?

Kevin Weil(Chief Product Officer): GPU입니다! (GPUs!)

질문: 새로운 텍스트-이미지 모델은 언제 제공되나요? DALL·E 3는 다소 구식입니다.

Sam Altman(CEO): 다음 업데이트는 기다릴 가치가 있을 것입니다! 하지만 아직 출시 계획은 없습니다. (the next update will be worth the wait! but we don’t have a release plan yet.)

질문: 지금까지 실제로 본 ChatGPT의 최고의 활용 사례는 무엇인가요? 그리고 향후 몇 년 내에 ChatGPT와 그 후속 버전이 특히 뛰어날 것으로 예상되는 분야는 무엇인가요?

Sam Altman(CEO): 많은 훌륭한 사례들이 있지만, 사람들이 심각한 질병의 원인을 찾아 완치에 이르는 이야기는 정말 감동적입니다. 또한, ChatGPT가 뛰어난 소프트웨어 엔지니어로서의 능력을 발휘하는 것도 여전히 충분히 평가받지 못하고 있습니다. 더 일반적으로는, 과학자들이 새로운 지식을 더 빠르게 발견하도록 돕는 능력이 매우 기대됩니다. (there are a lot of great ones, but the stories of people figuring out the cause of a debilitating disease and then getting fully cured are really awesome to hear. also a lot, but the ability to be a really good software engineer feels deeply under-appreciated even still. more generally, the ability to help scientists discover new knowledge even faster will be so great.)

질문: 앞으로도 o 시리즈 모델을 계속 출시할 계획인가요? 기존 모델(GPT-3, 4, 4o, 5 등)을 개선할 계획도 있나요? 아니면 두 가지를 병행하거나 결합할 계획인가요?

Kevin Weil(Chief Product Officer): 두 가지 모두입니다! 그리고 언젠가는 이들이 하나로 합쳐질 것으로 예상합니다. (Both! And at some point I expect they’ll converge.)

<쫌아는기자들 : o가 붙은 챗GPT 모델과 기존 모델과의 차이는 가장 먼저 추론 능력의 향상입니다. o1 모델은 복잡한 문제를 단계적으로 분석하고 해결하는 능력이 강화되었습니다. 이는 수학, 코딩, 과학 분야에서 특히 두드러지며, 박사 과정 수준의 성과를 보입니다. o1은 질문에 즉각 답변하기보다는 먼저 접근 방식을 분석하고, 문제를 여러 하위 작업으로 나누어 순차적으로 해결합니다. 이러한 메타인지적 접근은 더 정확하고 심도 있는 답변을 제공할 수 있다는 것이 오픈AI의 설명입니다. 아, 그리고 mini 모델. 경량화 모델은 비용이 크게 절감되기도 하고요.>

질문: o1 모델이 이미지 입력을 지원하지 않는 이유는 무엇인가요?

Kevin Weil(Chief Product Officer): 우선 모델을 세상에 선보이는 데 중점을 두었기 때문에 모든 기능을 갖추기 전에 출시했습니다. 이미지 입력은 o1 모델에 추가될 예정이며, 앞으로 몇 달 안에 o 시리즈 모델들은 멀티모달 기능, 도구 사용 등 다양한 기능을 갖추게 될 것입니다. (We focused on getting it out to the world first, vs waiting to make it full featured. Image input is coming in o1, and in general the o-series of models will be getting things like multimodality, tool use, etc in the coming months.)

질문: 왜 모든 이름은 대문자로 표기했는데 ‘sam altman - ceo’만 소문자로 작성하셨나요?

Kevin Weil(Chief Product Officer): 그것이 샘의 스타일입니다. (it’s sam’s vibe)

질문: ChatGPT가 아직 할 수 없지만, 할 수 있기를 바라는 기능은 무엇인가요?

Srinivas Narayanan(VP): 개인 정보를 더 잘 이해하고, 이를 바탕으로 제 대신 행동할 수 있기를 바랍니다. (I’d love for it to understand my personal information better and take actions on my behalf.)

질문: ChatGPT와의 음성 대화를 핸즈프리로 종료할 수 있는 방법을 제공해 주실 수 있나요? 현재 iPhone의 액션 버튼을 사용하고 있지만, 음성 채팅을 종료할 때마다 수동으로 닫아야 합니다.

Kevin Weil(Chief Product Officer): 이 아이디어가 마음에 듭니다. 지금 팀과 공유하겠습니다! (I love this idea. Sharing with the team now!)

질문: 이 질문들에 답변할 때 ChatGPT를 사용하실 건가요?

Sam Altman(CEO): 가끔은 그렇습니다. 알아채실 수 있나요? (sometimes, yes. can you tell?)

3. 올트먼 “현재 하드웨어로도 AGI 가능”

질문: 출판사들이 ChatGPT에서 자신들의 콘텐츠가 어떻게 인용되고 얼마나 자주 언급되는지 확인할 수 있도록 계정을 인증하고 등록하는 통합 기능을 추가할 계획이 있나요?

Sam Altman(CEO): 좋은 아이디어입니다! 논의해보겠습니다. 현재로서는 계획이 없습니다. (this is a good idea! we will talk about it. no current plans, though.)

질문: ChatGPT-5 또는 그에 상응하는 모델의 출시일과 기능은 무엇인가요?

Sam Altman(CEO): 올해 말에 매우 좋은 출시가 예정되어 있습니다! 그러나 GPT-5라고 부를 것은 없습니다. (we have some very good releases coming later this year! nothing that we are going to call gpt-5, though.)

질문: Plus 버전(챗GPT 유료 버전)의 컨텍스트 윈도우를 언제 확장할 예정인가요?

Kevin Weil(Chief Product Officer): 현재 작업 중입니다! 더 긴 컨텍스트를 기대하고 있습니다. (Working on it! I’m excited for longer context.)

질문: ChatGPT를 출시했을 때 놀라운 점이 있었나요?

Sam Altman(CEO): 가장 놀라웠던 것은 사람들이 ChatGPT를 매우 좋아했다는 점입니다. 초기 버전은 매우 미완성된 프로토타입이었고, 정확성도 떨어졌으며, 기능도 많지 않았고, 자주 다운되기도 했습니다. 그럼에도 불구하고, 사용자들은 충분한 가치를 느껴 계속 사용했습니다. (the big one was how much people liked it. the early version of the product was a very, very larval prototype. now it’s pretty good but it sure wasn’t then. it wasn’t very accurate, it didn’t have many features, it went down all the time, etc. and yet people found enough value to stick with it.)

질문: SearchGPT가 인기 있는 검색 엔진과 비교하여 제공하는 가치는 무엇인가요? 일반적인 검색 엔진 사용자가 SearchGPT를 선택할 만한 독특한 장점이나 주요 차별점은 무엇인가요?

Sam Altman(CEO): 많은 검색에서, 저는 SearchGPT가 원하는 정보를 훨씬 빠르고 쉽게 얻을 수 있는 방법이라고 생각합니다. 특히 복잡한 연구가 필요한 검색에서 이러한 점이 두드러질 것입니다. 또한, 검색 쿼리에 따라 동적으로 맞춤형 웹 페이지를 생성하는 미래를 기대하고 있습니다. (for many queries, i find it to be a way faster/easier way to get the information i’m looking for. i think we’ll see this especially for queries that require more complex research. i also look forward to a future where a search query can dynamically render a custom web page in response!)

<쫌아는기자들 : 서치GPT(SearchGPT)는 OpenAI가 개발한 AI 기반 검색 엔진입니다. 챗GPT에 웹검색 기능이 공식적으로 도입됐고, 크롬에서 익스텐션을 통해 아예 기본 검색을 챗GPT를 통한 서치 기능으로도 설정할 수 있게 됐습니다. 기존 AI가 웹검색을 통한 최신 자료 제시가 불가능하다는 한계를 극복한 것인데, 아직 정확도나 출처의 다양성이 부족하다는 한계도 지적됩니다.>

질문: ChatGPT의 카메라 모드는 언제 출시되나요?

Srinivas Narayanan(VP): 현재 작업 중이며, 정확한 날짜는 아직 정해지지 않았습니다. (working on it. don’t have an exact date yet)

질문: 현재의 하드웨어로 AGI를 달성할 수 있나요, 아니면 완전히 새로운 것이 필요할까요?

Sam Altman(CEO): 우리는 현재의 하드웨어로 AGI를 달성할 수 있다고 믿습니다. (we believe it is achievable with current hardware)

<쫌아는기자들 : 이번 AMA의 가장 의미 심장한 올트먼의 답변. AGI는 범용인공지능. 현재 AI 수준을 능가해 인간의 일을 실제로 대신할 수 있는 고차원의 AI를 뜻합니다. 올트먼은 하드웨어의 질과 양의 획기적인 발전 없이도, 소프트웨어만으로도 AI의 진보가 가능하다고 보는 것 같습니다.>

4. AI에게 Strawberry에 r이 몇 개냐고 물으면 2개라고 답하는 이유

질문: ChatGPT의 검색 기능은 여전히 Bing을 백엔드 검색 엔진으로 사용하고 있나요?

Srinivas Narayanan(VP): 우리는 여러 서비스를 사용하며, Bing은 그중 중요한 하나입니다. (we use a set of services and Bing is an important one)

질문: o1의 정식 버전은 언제 출시되나요?

Kevin Weil(Chief Product Officer): 곧 출시될 예정입니다. (SOON)

질문: Sora의 출시가 지연되는 이유는 추론에 필요한 연산량과 시간 때문인가요, 아니면 안전성 때문인가요?

Kevin Weil(Chief Product Officer): 모델을 완성해야 하고, 안전성, 사칭 방지 등 여러 요소를 정확하게 처리해야 하며, 연산 자원을 확장해야 합니다. (Need to perfect the model, need to get safety/impersonation/other things right, and need to scale compute!)

<쫌아는기자들 : 소라는 오픈AI의 영상 생성 모델로, 올해 티저 영상이 공개됐지만 구체적인 출시 시점과 자세한 내용이 공개되지 않았습니다. 다만, 영상의 높은 퀄리티로 기대를 모았습니다>

질문: AGI가 달성되면 가장 먼저 어떤 분야에 적용하고 싶으신가요? 그 순간을 위해 준비된 특정 분야가 있나요?

Srinivas Narayanan(VP): 과학적 발견을 가속화하는 데 활용하고 싶습니다. 개인적으로 건강과 의학 분야에 매우 관심이 있습니다. (i’d love for it to accelerate scientific discovery. i’m personally very interested in health/medicine)

질문: 가장 인상적인 개인 비서 워크플로우는 무엇인가요?

Srinivas Narayanan(VP): 두 가지가 매우 흥미롭습니다:

의료 보고서를 요약하고, 의사에게 적절한 질문을 할 수 있도록 돕는 것.
개인의 지식을 업로드하여 다른 사람들이 활용할 수 있는 맞춤형 GPT를 만드는 것. 예를 들어, 친구나 가족이 강의 노트나 여행 추천 정보를 업로드하는 사례가 있습니다. 이러한 활용 사례는 아직 충분히 평가받지 못하고 있습니다. (Two that are very interesting to me: 1/ using it to summarize medical reports and help you ask the right questions to doctors. 2/ people uploading their knowledge to create custom GPTs that others can use (i have friends and family who have uploaded course notes or travel recommendations) - i think this is still under appreciated and underutilized as a use case.)

질문: 정식 버전의 o1이 o1-preview에 비해 눈에 띄는 개선이 있나요?

Srinivas Narayanan(VP): 네. (yes)

질문: GPT-4o의 이미지 및 3D 모델 생성에 대한 추가 정보를 언제 얻을 수 있을까요?

Mark Chen(VP): 곧입니다! (Soon!) 또한, GPT-4o는 HTML을 프롬프트로 사용하여 텍스트에서 이미지로의 변환을 수행하며, img2img 기능도 매우 뛰어납니다! (Soon! This “render” is pure text-to-image with 4o and the HTML as the prompt - the img2img capabilities are also amazing!)

질문: o1이 대형 언어 모델(LLM)의 확장에 어떤 영향을 미칠까요? 스케일링 법칙에 따라 LLM을 계속 확장할 계획인가요, 아니면 추론 시간 컴퓨팅의 확장으로 인해 더 작지만 빠르고 긴 추론을 가진 모델에 중점을 둘 것인가요?

Kevin Weil(Chief Product Officer): 둘 다 중요합니다—더 나은 기본 모델과 더 많은 ‘strawberry scaling’ 및 추론 시간 컴퓨팅이 필요합니다. (It’s not either or, it’s both—better base models plus more strawberry scaling/inference time compute.)

<쫌아는기자들 : ‘Strawberry’라는 단어에서 ‘R’의 개수를 묻는 질문은 AI 모델의 문자 수준 처리 능력을 평가하기 위한 테스트입니다. 일부 AI 모델은 이러한 간단한 질문에 정확하게 답하지 못하는 경우가 있어, 이는 모델이 단어를 개별 문자로 인식하지 않고 토큰 단위로 처리하기 때문입니다. 예를 들어, GPT-4의 토크나이저는 ‘strawberry’를 [str, aw, berry]로 분할합니다. 이러한 토큰화 방식은 모델이 단어를 개별 문자로 처리하지 않고, 토큰 단위로 인식하게 만들어 문자 수준의 질문에 정확하게 답변하기 어렵게 만듭니다. 그래서 몇몇 AI들이 ‘strawberry’라는 단어에서 ‘R’의 개수를 묻는 질문에 대해, 일부 AI 모델은 실제로 3개가 있음에도 불구하고 2개라고 잘못 답변한 사례가 많았습니다.스케일링을 하겠다는 의미는 AI 모델의 추론 능력을 향상시키겠다는 의미고요.>

질문: ‘strawberry’라는 단어에는 ‘R’이 몇 개 있나요?Mark Chen(수석 부사장): 3개입니다. 하지만 때로는 2개로 인식되기도 합니다. (3, but sometimes 2.)

5. 올트먼이 꼽은 좋아하는 책 2권

질문: 현재 15세라면, 미래에 성공하기 위해 어떤 기술이나 경로에 집중하시겠습니까?

질문: Sora는 비디오 입력을 처리할 수 있나요?

질문: GPT 제품군의 다음 혁신은 무엇이며, 예상 시기는 언제인가요?질문: 성인 사용자가 원할 경우 ‘NSFW’ 콘텐츠를 합리적인 범위 내에서 전환할 수 있는 기능에 대한 장기적인 목표는 무엇인가요?질문: 일반적으로 질문은 없지만, 여러분께 감사의 말씀을 전하고 싶습니다. GPT 덕분에 대학 생활과 직장 업무가 정말로 수월해졌습니다!질문: AI 혁명에 기여하고자 하는 야심 찬 젊은이들에게 조언을 주신다면?

질문: 좋아하는 책은 무엇인가요?질문: Sam Altman에게 묻습니다. 당신이 ‘스트로베리 가이’인가요?

6. AI가 스타트업 창업에 미치는 영향은?

질문: AVM 비전의 출시 일정은 언제인가요? GPT-5는 왜 이렇게 오래 걸리나요? 완전한 o1은 어떻게 되나요?

질문: 많은 핵심 인재들이 OpenAI를 떠나는 상황에서 어떻게 압박을 처리하고 계신가요? 추가적인 부담이 되나요?

질문: Advanced Voice API의 비용을 인하할 계획이 있나요?질문: 의료 분야에서 새로운 모델을 특정 의료 문헌으로 훈련할 계획이 있나요? 현재 모델은 덜 구체적인 데이터로 훈련된 것 같습니다.

질문: 모델의 이름을 더 잘 지을 수 있나요?

질문: 경험 많은 창업자로서, AI가 창업자들의 벤처 개발 과정에서 어떻게 보조할 것으로 보시나요? 또한, 이에 따라 기업가 정신은 어떻게 변화할까요?

질문: EU 사용자들이 더 빠르게 서비스를 이용하고, 기능이 제한되지 않도록 EU와 협상할 계획이 있나요?질문: 2025년에 대한 대담한 예측은 무엇인가요?

질문: 과거에는 비즈니스 소유자, 웹 퍼블리셔, 제휴사 등이 SEO를 통해 사이트의 순위를 높이려 했습니다. ChatGPT의 검색에서 발견되기 위해 이들이 할 수 있는 일은 무엇인가요?

질문: ChatGPT가 자신의 개를 어떻게 부를까요?질문: 최고의 프롬프트는 무엇인가요?

[쫌아는기자들] 샘 올트먼과 오픈AI의 '무엇이든 물어보세요'