EP 100
EP 100. Claude Mythos, Fable 5, 그리고 다음 국면은?
AI 프론티어 100회와 3년의 변화 00:00
노정석 녹화를 하고 있는 오늘은 2026년 6월 14일 일요일 아침입니다. 그런데 제가 지금 샌프란시스코에 나와 있어서 여기는 토요일 오후 4시가 됐습니다. 저희가 이번에 드디어 100회가 됐습니다. 와, 저희끼리 박수라도. 참 승준님이랑 저랑 처음에 공부하는 셈 치고 한번 저희 만담을 해보아요라고 했던 게 시간적으로는 한 3년이 됐고 그리고 횟수로는 100회가 됐네요. 그 사이에 저희 AI 프론티어 팟캐스트 덕분에 정말 만나지 못할 좋은 분들을 굉장히 많이 만났고 또 프론티어에 있는 소식들 제일 빨리 전달받을 수 있는 그런 채널이 됐고요. 승준님, 3년 동안 숨 가쁘게 달려왔습니다.
최승준 3년 정말 빠르게 지나갔고, 또 재미있지만 한편으로 돌이켜 보면 상전벽해 같네요.
노정석 저희가 3년 전만 하더라도 ChatGPT가 나온 지 얼마 안 됐을 때였거든요. 그때가 GPT-4가 막 발표됐을 때고 그다음에 마이크로소프트에서 Sébastien Bubeck이 이게 Sparks of AGI라고 하면서 GPT-4를 분해한 그런 페이퍼들을 보며 거기에 그림 그리는 그런 내용이 있었잖아요. 유니콘 그림 그리는 거에서 지금은 펠리컨이 자전거 타는 이런 걸로 왔는데 한 3년의 기간 동안 불가능할 거라고 얘기했던 그 모든 것들이 다 깨졌죠. 그리고 작년 가을이 넘어서면서 제가 느끼기에는 그렇습니다. 작년 가을이 넘어서면서 이거는 그래프의 기울기가 확실히 달라진다는 느낌이 들었고 올해 겨울이 지나고 봄이 들어가면서부터는 이제는 모두가 심심치 않게 AGI라는 이야기를 막 하기 시작했던 기억이 납니다.
그러고 나서 봄이 됐죠. 4월 Anthropic에서 Mythos라는 모델을 살짝 공개를 했었고 그리고 나서 두 달 정도가 지난 이번 화요일 정도에 갑자기 공개가 됐잖아요. Fable이라는 이름으로 바꿔서 공개를 했었는데 그러고 나서 또 한 번 커뮤니티가 막 vibe check도 하고 이게 무엇이 달라지는지 이런저런 이야기를 하고 있었던 게 불과 3일인데 어제 미국 정부 규제에 의해서 미국 국적자가 아닌 사람들은 Fable에 대한 액세스를 아예 하지 못하는 그런 정책이 발표가 됐죠. 그것 때문에 아마 시끌시끌한 것 같아요.
그리고 Fable이 발표됐을 때도 말이 많았죠. 저도 바이오 관련한 어떤 쿼리들을 좀 물어보면 바로 좀 닫혀버리고, 이건 대답할 수 없습니다라고 하면서 Opus 4.8로 모델이 바뀌어 버리고 그러면서, 뭐 하는 거지? 이런 생각들이 들었는데요.
그리고 저도 여기 샌프란시스코에 와 있으면서 굉장히 많은 스타트업과 데이터셋 만드는 회사 에이전트 빌딩하는 회사 새로운 월드 모델을 개발하겠다는 회사 그야말로 꿈을 꾸는 20대 초반 창업자들도 굉장히 많이 만났고 또 xAI라든지 Thinking Machines라든지 Meta Frontier Lab에 계시는 분들 이야기도 들으면서 안에 있는 자세한 어떤 정말 극비에 해당하는 이야기들을 물어보기도 좀 그렇고 말씀해 주시기도 좀 그렇기는 하지만 대략적으로 프론티어가 어디로 향하는지 지금 가장 큰 쟁점이 어디에 존재하는지에 대해서는 많은 인사이더 이야기들을 들을 수 있어서 좋았던 것 같습니다.
최승준 어디에 존재하나요?
노정석 일단 이 AI 경쟁에 대해서 이건 안 될 거다라고 하는 건 당연히 없을 거고요. 당연히 될 거다라고 하는데, 그 부분이 핵심적인 쟁점은 어디에 있을 것이냐. 당연히 스케일이 증가하는 부분에 있을 것 같아요. 그래서 스케일을 더더욱 증가했을 때 어떤 일들이 일어나는지에 대해서 그런 인프라스트럭처라든지 그것과 관련된 것들은 이건 생각할 필요가 없이 스케일 증가가 우리를 다음 곳으로 데려다 줄 것이다라는 것에 대한 믿음은 확실히 있는 것 같고 그 모델의 크기를 키우고 그에 걸맞은 인프라스트럭처를 가지면서 하다 보면 자연스럽게 데이터셋이 더 필요하게 되는데 pretraining과 관련한 데이터셋은 물론 pretraining 관련해서도 끊임없는 퀄리티 증가가 이루어져야 되니까 그 관련해서 연구를 하시는 Stanford의 대학원생이라든지 Percy Liang 교수님 연구실에 계시는 그런 분들을 통해서 어떻게 빌리언 모델보다 빌리언 사이즈보다 작은 모델을 통해서 pretraining 데이터셋의 품질을 훨씬 높일 수 있는지 그것 때문에 어느 정도 모델의 성능 증가가 있는지 이런 것들은 볼 수 있는데
스케일 증가와 포스트 트레이닝의 중요성 03:45
이건 그야말로 연구나 혹은 프론티어가 아닌 저 뒤에서 리서치 사이드의 이런 일들에서 좀 주제를 잡고 있는 부분인 것 같고 프론티어 사이드는 너무나도 당연하겠지만 post-training이에요. post-training을 하기 위해서 얼마나 많은 데이터셋이 더 필요한지 그 데이터셋을 generate하는 부분들에 대해서도 그걸 공급하는 회사들이 얼마나 호황인지에 대한 그런 이야기들도 있고 그리고 그 pretraining 인프라스트럭처 자체가 이거는 pretraining과는 좀 다르잖아요. 그 과정 하나하나에 사실은 inference를 다 하면서 그 과정의 결과를 매기는 부분이니까 거기에 어마어마한 엔지니어링 챌린지들이 있더라고요. inference도 돌리면서 이 트레이닝 루프도 돌아야 되니까 또 과정들이 다 같이 끝나지도 않고 그럼 끝나지 않은 것들을 배치로 모아서 트레이닝 뭐죠? loss 다시 매기고, 조금 더 나중에 끝나는 거 모아서 loss 매기고, 그거 관련한 인프라가 얼마나 진전하고 있는지 그런 자세한 이야기들을 들었는데
사실은 그런 부분들에 대해서 제가 여기에 누구는 어떻게 한다, 누구는 어떻게 한다라고 말씀을 드릴 수는 없을 것 같아요. 그런데 핵심은 post-training의 엔지니어링 인프라 그다음에 거기에 데이터셋의 공급, 그리고 그 데이터셋 자체가 이런 것 같아요. 예를 들면 파이낸스 쪽에 데이터가 있다고 하더라도 파이낸스도 investment banking을 하는 것부터 세무 처리하는 것부터 그냥 단순한 어떤 저희 개인적인 파이낸스 업무를 하는 것까지 굉장히 다양한 task가 있는데 그 task들도 데이터셋을 하나씩 다 세분화하면서 만들어 가고 있는 것 같아요. 그리고 모델의 스케일이 더 커지다 보면 너무나 자연스럽게 데이터셋의 양이 많아져야 되니까 이야기인즉슨 우리가 진짜 세상에 존재하는 모든 그런 도메인이나 직업 전문가 이런 것들에 대해서 그 case-by-case의 데이터셋을 전부 다 generate하고 걔를 그냥 모델에 학습시켜 나가는 그 과정을 계속 돌고 있다는 생각이 들어요.
프론티어 모델을 만드는 데이터셋 엔지니어링 06:08
그런데 그걸 하면 할수록 사실은 벤치마크들이 증가하니까 그래서 모든 Frontier Lab들이 기계적으로 그런 것들을 막 돌리는 과정에 있고 그리고 Meta나 이런 데서는 아무래도 지금 Anthropic이라든지 OpenAI에 비해서는 살짝 뒤떨어져 있으니까 걔를 건너뛰기 위해서 어떤 추가적인 노력을 하고 있는지 이런 것들이 굉장히 재미있었습니다.
핵심은 post-training에 있다. 스케일 증가와 post-training에 있고 post-training의 인프라와 거기에 상응하는 데이터셋 이 부분에 경쟁의 큰 축이 존재한다는 게 하나고 그리고 나서 이거는 LLM, 저희가 아는 그 large-scale language model에 관련된 이야기들이고 이게 아닌 다른 영역은 저희가 이미 많이 얘기를 했었죠. 다른 도메인들, 그냥 LLM이 아닌 다른 도메인들에 대한 관심사와 거기에 대해서 어떻게 그걸 하면 된다는 거에 대한 일종의 플레이북이 서고 있는 것 같아요. 그래서 바이올로지라든지 저희가 Periodic Labs 얘기도 많이 했는데 그런 material science 이런 부분들, 특히 저는 바이오 사이드에 관심이 많으니까 그런 쪽에서 어떤 일들이 일어나고 뭘 중점으로 보고 있는지 이런 얘기들 많이 들었습니다.
AI가 생물학과 다른 도메인으로 확장되는 방식 07:49
최승준 각성의 시간이 되셨나요? 가신 이유가 있었을 거 아니에요?
노정석 그렇죠. 저는 제가 타겟하고 있는 비즈니스가 있는데 이 비즈니스를 리딩하고 있는 몇 개의 프론티어 스타트업들이 있어요. 그래서 그 프론티어 스타트업들에 계신 분들을 이렇게 인맥 동원해서 이렇게 저렇게 찾아서 만나면서 생각보다 다들 젊어요. 매우매우 젊고, 그리고 그런 것 같아요. 요약을 하면 LLM에서 저희가 한 3, 4년 동안 어떤 일이 일어나는지를 봤잖아요. 그 3, 4년 동안 우리가 해왔던 일들을 Frontier Lab들이 해왔던 일들을 보면 다 안 될 거라고 했었던 것들을 하나씩 하나씩 깨부셨거든요. 이건 하지만 그건 못 해, 이건 하지만 그건 못 해, 이건 하지만 그건 못 해라고 했었던 것들을 reasoning model이 나오고, reasoning model이 나온 다음에도 더 post-training 이런 것들이 나오면서 모델 성능이 계속 증가했잖아요.
그래서 지금은 사실은 AGI에 필적하는 그런 것들이 나오고 있는데 다른 도메인들, 특히 신약 개발이라든지 아니면 longevity 사이드라든지 이런 부분들도 기존에 이쪽 업계에 계시던 분들, 대표적으로는 Genentech라든지 아니면 큰 제약 회사에 계시던 분들 입장에서 보면, 에이 그건 안 돼, 그건 안 돼, 그건 어려워라고 하시던 부분들이 있어요. 그리고 그분들은 여전히 그렇게 생각하고 있다는 것도 재미있는 사실이었고 반면에 그러한 존재하던 산업을 완전 AI 사이드에서 접근하시는 분들은 지금이 GPT- 2 모멘트 정도 되는 것 같다는 생각을 하고 있고 그리고 완전 반대의 관점에서 생각해요.
그걸 왜, 이렇게 비유하면 적절할 것 같은데 저희가 LLM을 가지고 프롬프트를 가지고 Codex, Claude Code 나오기 전에 예전의 머신러닝을 생각하면 단위 문제별로 데이터셋의 폼이 정해져야 됐고 거기에 대해서 모델이 convolutional neural network라든지 그 사이에 CNN도 구조가 거기에 맞춰서 뭔가 바뀌어야 됐고 그다음에 거기에 대한 학습 방법이 존재하고 그래서 그 단위 문제가 풀렸었잖아요. 그런데 사실은 LLM으로 넘어오고, 멀티모달로 넘어가고 그리고 RL environment나 RL 이런 것들이 들어오면서는 그냥 하나의 문제로 풀리고 이거 학습을 통해서 큰 모델이 generalize를 하게 되면 specific한 문제도 다 풀린다는 그런 원칙을 가지고 돌고 있잖아요.
이분들이 똑같이 생각해요. 그래서 DNA 사이드에서 생기는 DNA 관련한 것들, 그런 protein 레벨에서 생기는 것들, protein 레벨을 넘어서서 cell 부분에서 생기는 걸 organ이라고 그러거든요. 그래서 그런 부분에서 생기는 것들, 걔를 마치 그냥 다른 modal로 가정하자. 이거는 소리고, 이건 이미지고, 저건 비디오야라고 다른 modal로 규정하고 사실 그냥 한꺼번에 다 집어넣고 train 하잖아요. 그런 것과 비슷한 관점으로 돌리고 있어요. 그런데 그게 그냥, 저렇게 하는데 되네라는 것들이 보게 된 게 제가 이번에 제일 큰 수확이에요. 이것도 저렇게 하면 그냥 문제 풀릴 수 있겠네.
스타트업의 꿈과 자본이 만나는 속도 12:07
최승준 얼핏 채팅에서 그런 얘기도 하시지 않았어요? 젊은 분들이 꿈의 크기가 일론 머스크급이다, 그런 얘기.
노정석 맞아요. 여기 사실 valuation들이 굉장히 높거든요. 한국은 지금 회사들 차리면 아직까지는 리서치 사이드 회사들이 보다는 서비스하는 회사들이 훨씬 많긴 한데 여기서 지금의 transformer는 문제가 있다. 그래서 새로운 world model이 필요하고 내가 생각하는 world model은 이런 거야라고 하는데 그런 걸 이야기하는 게 한 21살에, 17살에 대학에 들어간 천재나 14살에 대학에 들어간 천재들이 그런 얘기를 하면 자본들이 반응을 쭉쭉쭉 하는 것 같고 반면에 또 다른 자본적 관점은 2년 전에도 그런 얘기하는 애들 굉장히 많았는데 결국 현실의 문제는 하나도 못 풀고 애들 다 도망가버리고 회사는 망하던데.
여기도 공존된 시각이 존재하고 있는 것 같아요. 그러나 아직은 희망이 지배하고 있는 그리고 꼭 회사를 만들면 그 회사가 Frontier Lab에 팔려야 되는 건 아니거든요. Frontier Lab과 비슷한 일들을 하고 싶어 하는 돈 많은 엔터프라이즈는 여기도 굉장히 많이 있기 때문에 아직까지는 자본도 그리고 스타트업들도 꼭 대형 exit이 아니더라도 중간중간에 꽤 돈을 많이 벌 수 있는 exit chance는 많이 있더라고요. acquihire 형태로.
그래서 그런 것들을 기대하면서 valuation들이 기본 한 대여섯 명이서 회사를 만들면, 어느 정도의 track record가 있다는 가정하에 한국 돈으로 무려 한 3천억에서 5천억 정도의 그런 valuation을 부르는 경우가 매우 허다하고 그들이 투자받는 금액도 몇백억 단위, 한국 돈으로. 지금 환율이 1,500원까지 벌어져서 그 차이가 훨씬 크게 느껴지는데 이 부분의 차이가 굉장히 커서 이 부분이 저는 한국의 창업가들이 미국 시장에 다이렉트하게 access를 하거나 그럴 수 있는 어떤 연결 통로 같은 거는 많이 만들어야 되겠다는 생각은 들었어요.
프론티어 네트워크와 정보 공유의 힘 14:27
최승준 민석님이 늘 하시던 말씀이네요.
노정석 그리고 민석님 덕분에 사실은 여기에서 저도 제가 만나지 못할 젊은 사람들, 그리고 한국 네트워크가 아닌 인도 네트워크, 중국 네트워크 그런, 사실 중국 네트워크가 굉장히 강하거든요. 그래서 Frontier Lab에 계신 분들도 중국인들이 많고 그래서 그분들이 또 의외로 알려주시는 것들도 많아서 소개를 할 수는 없지만 현재 프론티어가 어디쯤에 있다, 그다음에 각 회사들의 상황들이 어떻다는 것들에 대해서는 많은 정보를 얻었죠. 그 부분은 제가 승준님 한국에 돌아가면 사석에서 한 번 싹 다 풀어드리겠습니다.
최승준 그러면 이제 슬슬 저희가 2주 만에 하는 거라 입이 좀 풀린 상태에서 한번 뉴스를 돌아볼까요?
노정석 아무래도 Mythos, Fable 얘기를 할 수밖에 없겠죠.
Mythos와 Fable이 던진 보안 질문 15:26
최승준 그래서 아까 정석님이 서두에 풀어주셨듯이 이게 기습적으로 발표가 되고 Opus 4.8이 5월 28일인가 그 정도에 나왔던 것 같은데, 저희가 그 이슈 얘기하고서는 수주에 나올 거다 했는데 이게 2주가 안 된 12일 만에 나왔고 Fable 5가 나왔는데 나온 이유는 우리가 safeguard를 만들었다. 그래서 아까 정석님이 말씀해 주셨던 것처럼 광범위하게 보안에 관련된 거나 생물학에 관련된 걸 기계적으로 앞단에서 차단을 하는 것 같더라고요. 그게 안 넘어가고 그렇기 때문에 Mythos를 Fable로 포장해서 배포를 한다였고 3일을 건너뛰어서 어제의 상황을 보면 그런데 아마도 Amazon 쪽의 어떤 개발자분이 jailbreak를 한 거를 국가에다가 알리고 어떻게, 정확한 스토리는 저도 모르는데 그게 일단은 수출 통제를 하는 쪽으로 결정을 급박하게 내는 거로 이어졌던 것 같습니다. Fable 5가 나왔고, 이런저런 일들을 좀 탐색해 봤는데요. 일단 이름이 재미있어요. Mythos가 신화였잖아요. 그런데 Fable은 우화거든요. 그렇죠. 이게 함의하는 바가 있더라고요. 그래서 이름 체계가 그동안은 Haiku, Sonnet, Opus 해가지고 시의 크기가 늘어가는, 작품화되는 단시에서 작품성 있는 거로 가는 느낌이었다면 시만 아니라 음악에서도 Opus가 작품으로 쓰이기도 하는데 그랬다면 이제 확 바뀌었어요. 구술 문화로, 문자가 아니라 구술 신화, 문자화되기도 했지만 어쨌든 신화를 얘기하던 거를 사람들에게 대중적으로 표현하는 우화 이솝 우화 이런 식으로 배포용으로 한 게 결국에는 Fable이 된 거거든요. Mythos는 아직도 가둬 있고 일부만 액세스할 수 있는
Mythos와 Fable이라는 이름의 의미 16:38
노정석 그건 신계에 있는 어떤 존재로 포장하고 걔를 인간들에게 내려주는 어떤 것들을 Fable로 표현했다고 보면 되겠네요.
최승준 그런데 이게 좀 재미있더라고요. 이름을 파고드니까 이게 작명의, 이것도 물론 모델이 얘기한 거긴 합니다마는 제가 궁금해서 이 이름의 근간이 뭘까 라는 거를 물어봤을 때 이런 부분을 짚어줬는데 공감을 좀 했습니다. 그래서 제한된 원본하고 안전하게 공개된 버전이라는 구도하고도 이름 자체가 맞물려 있다. 그런데 Fable이 닫혀진 이유를 훅 들어가면 jailbreak하면 위험하다고 했었던 보안과 생물학에 관련된 기능을 켤 수 있다는 얘기가 되잖아요. 그러니까 그걸 급박하게 닫은 선제적인 조치였는데 그게 안전만을 위한 게 아니라 굉장히 복합적일 수는 있을 것 같아요. 그래서 타임라인을 한번 훑어볼게요.
다리오 아모데이의 글과 RSI 타임라인 18:08
그래서 제가 이거는 GPT-5.5하고 얘기했었던 건데 질문이 이거예요. Dario Amodei의 블로그 시리즈를 조사하자. Machines of Loving Grace부터 가장 최근 것까지 부탁해. 각각을 깊이 읽고 핵심 부분을 인용하여 하면 너의 허심탄회한 소회와 생각을 말해줘라고 해서 Dario의 블로그를 쭉 한번 살펴봤어요. Machines of Loving Grace가 벌써 2024년 말인가 그랬었거든요. 꽤 시간이 지났는데, 그 사이에 비교적 최근 거가 청소년기에 대한 거고 DeepSeek을 통제해야 된다. 이거 export control 이런 얘기를 또 했던 때가 있었거든요. 그리고서는 비교적 최근 게 청소년기, 기술의 청소년기에 대한 좀 묘하면서도 음미해 볼 만한 글이 있었고 아주 최근이 며칠 전에 이거였어요.
Policy on the AI Exponential, 그래서 그런 것들이 정책에 관련된 거를 Dario가 또 한참 풀었거든요. 근데 이게 이 사건보다는 맨 끝에를 한번 쭉 했을 때 5월 28일이 Opus 4.8 나왔던 때죠. 이때 시리즈 H valuation이 9650억 달러 발표였었거든요. 그리고 6월 1일이, 6월 1일이 아마 RSI 발표한 날이에요. RSI가 Recursive Self-Improvement에서 자기 증강하는 거를 Anthropic에서 그거를, SEC가 증권거래위원회인데 증권거래위원회에 상장하겠다고 처음에 내야 되는 거라서 원이 붙은 건데, S-1 증권신고서라는 거를 제출했는데 보통 이거를 제출하면 경쟁자나 퍼블릭에서 다양한 정보를 알기 때문에 confidential로 일정 기간을 주는 드래프트를 주는 게 있나 보죠. 6월 1일이 그 타이밍이에요.
노정석 처음 들어봤네요.
최승준 RSI 발표한 타이밍하고, 그다음에 6월 9일이 한번 show up하는 거죠. Mythos를 어떻게든 Anthropic은 그걸 배포하고 싶었던 것 같아요. 능력을 보여줘야 되니까. 그런데 안전을 늘 얘기했던 회사고, 자가당착이 되지 않으려면 잘 잡아야 되니까 어떻게든 그거를 배포할 수 있게 깎아냈어야 되는데 그게 3일 만에 정부에 의해서, 미 정부에 의해서 닫힌 그런 상황이 되는 거예요.
그래서 재미 삼아 한번 물어봤습니다. 이게 IPO에 불리할까, 유리할까? 근데 너무도 당연하게도 TAM 그러니까 이게 total addressable market이잖아요.
노정석 total addressable market, 예.
최승준 그래서 TAM이 전체 시장이라고 봤을 때 전체 시장에는 이게 당연히 불리한 거잖아요. 그래서 단기적으로는 이게 시장에 대한 불안정한 신호 언제든 국가 권력이 이걸 다룰 수 있네를 보여준 동시에 그럴 만한 능력이다라는 걸 방증한 셈이 되기 때문에 이게 아마 해프닝으로 다시 회복시키게 된다고 하면 또 지금 아직 OpenAI가 GPT-5.5를 못 내고 있는 상황에서 근데 타이밍상 이 RSI에 해당하는 거의 기시감이 그거잖아요. 작년 10월 말에, 10월 30일에 Jakub Pachocki가 그 얘기를 했었죠. Sam Altman하고 저희 도망자 연합의 계기가 됐던 2026년
노정석 8월 타임라인.
최승준 하여튼 그즈음에 AI 연구자 인턴을 내고 2028년에는 완전 자율 주행하는 AI 연구자 공언을 했었는데 그것도 자기 증강형이었죠. 근데 지금 그런 것들이 맞아 돌아가고 Andrej Karpathy가 한 달 전쯤에 Anthropic에 들어가면서 그게 pretraining 팀에 들어갔거든요. 그래서 미약하긴 할 수 있지만 어쨌든 Autoresearch하던 사람이 거기 들어갔던 얘기가 이게 좀 맞아떨어지는 국면들이 있는데 그런 거가 지금 사람들이 많이 얘기하듯이 이거 다 IPO 맥싱 아니냐. 최대한 valuation을 높이려는 전략 아니냐.
전략 자산이 된 AI와 시장의 반응 22:03
어쨌든 저도 공감하는 부분은 지금은 이게 전략 자산급으로 공인됐다의 느낌이거든요. AGI의 문제가 아니라 AGI라는 말은 가끔 요새 희미해지는데 왜냐하면 들쭉날쭉해서 너무 잘하는 영역들이 있고 여전히 투자를 안 하는 영역들이 있는 것 같긴 해요. 그래서 들쭉날쭉함은 있지만 어떤 부분에서는 굉장히 잘하고 이번에 Fable 3일 써놓고 사람들이 벌써 그리워하는 경우가 있거든요.
두 가지 반응을 읽었는데 수확 체감, 이거 뭐가 더 좋은지 모르겠다. Opus보다라는 말을 하는 분들이 있는가 하면 이거는 돈을 내고 써야 된다. 벌써부터들 이거 의미 있는 것 같다고 얘기하시는 분들이 좀 또 타임라인에 꽤 보이더라고요.
노정석 거기에 수확, 뭐라고 그래야 될까요? 수확 체감이 안 되시는 분들은 Opus 4.8의 바운더리 이상으로는 안 나가도 되는 그런 섹터에 있을 수도 있죠.
최승준 그게 나쁘다는 게 아니라 그 정도에서 하면 행복한 포인트에 있을 수 있는 거죠. 돈도 절감하고.
노정석 네. 사람마다 이거는 다를 수밖에 없는 거라서 누군가의 시각을 그냥 일반화해서 읽을 수는 없는 것 같습니다.
그런데 확실하게 이 모델 자체의 성능이 얼마 좋다 사실 저희가 벤치마크도 거의 의미가 없는 이런 수준이라 지금 시절을 살고 있기 때문에 이게 2배 좋다, 3배 좋다 얘기할 수는 없는데 뭔가 Frontier 연구를 하고 있었던 특히 cyber security라든지 아니면 biology라든지 이런 쪽에 최선의 연구를 하고 있었던 분들 입장에서는 확 어떤 체감적으로 좋다고 느끼던 부분들이 있었거든요. 못 하던 일들을 해냈고
최승준 그래서 하여튼 그게 일단 시사 포인트고요. 그래서 저도 Fable 5의 모델 시스템 카드를 자세히 보진 않았습니다. 또 몇백 장짜리고 그래서
노정석 그것도 사람이 쓰지도 않았을 거고 저희가 또 일일이 다 볼 수는 없죠.
루프 엔지니어링이라는 새로운 언어 24:19
최승준 그래서 바이브 체크 정도를 하는 정도였어요. 그리고 다음에 할 거 생각한 게 이게 요새 세일즈 마케팅 용어가 또 하나 나왔어요. 루프 엔지니어링.
노정석 네, 하네스 엔지니어링 그 뒤에 나온 루프 엔지니어링인데 그건 또 뭔가요? 저도 여기저기서 이야기를 듣고 있긴 합니다만
최승준 그냥 트위터에서 보기에는 Boris가 그 얘기를 했고 Boris Cherny가 Claude Code 만드는 분이잖아요. Boris가 그 얘기했고 그다음에 Peter Steinberger가 OpenClaw 만들어서 OpenAI에 있는 분 둘이 비슷한 시기에 그 루프에 대한 트윗을 했었어요. 우리는 루프를 짜고 그걸 맡겨서 도는 쪽으로 생각의 전환을 해야 된다. 그런데 이게 Ralph loop가 나온 지는 벌써 1년이 넘었는데 Ralph loop랑 뭐가 다른가 정도가 캐치 포인트인 것 같아요. Ralph loop는 굉장히 단순했는데 지금 말하는 루프 엔지니어링은 조금 더 복잡한 그런 것들하고 제가 맞물려서 생각하게 되는 게 최근에 Claude, 그러니까 Anthropic 쪽에서 발표한 Dynamic Workflows라든가 ultracode 이런 키워드들이 오케스트레이션을 강하게 거는 그런 구조잖아요. 그래서 그런데 그걸 OpenAI나 Anthropic만 하는 게 아니라 OpenAI도 당연히 하고 있고 그래서 그 메인이 되는 모델들이 펼치고 접고 펼치고 접고 하는 것들을 하는 게 어떻게 보면 정식화되어 있는 상태인데, 그랬을 때 토큰 비용은 엄청나게 늘어날 수 있을 때 Fable은 얼마나 비싼가, 이 루프 엔지니어링이라는 개념이 마케팅 수사라고 봤을 때 그걸 그냥 위임하는 방식으로 섣부르게 돌리면 어떻게 될까를 한번 측정해 봤습니다.
Fable 5 가격과 테스트 타임 컴퓨트 25:55
일단 Opus보다 Fable이 기본적으로는 2배 비싸거든요. 그래서 지금 입력, 출력 1M 토큰에 대해서 가격이 출력이 50달러예요. 그래서 저희 왜 입력이 싸고 출력이 비싼가 같은 것은 저희가 prefill 표현하면서 좀 살펴봤었잖아요. 리마인드하면 뭐였죠? 그게 왜, 왜 출력이 더 비싼 거죠? decode 때문에.
노정석 그렇죠. decode는 한 스텝 한 스텝 돌아야 되는데 입력 같은 경우에는 prefill을 한 번에 배치를 빵 때려버릴 수 있으니 사실은 저 1 대 5 가격 차이가 나는 것보다 훨씬 이론상은 많이 나야 되는데 그냥 퉁을 친 것 같고 서로서로 이렇게 카피를 하면서 가격 체계를 만들고 있는 것 같아요.
최승준 그리고 그 가격이 거꾸로 역산하는 근거가 된다는 게 Dwarkesh 편에서의 인사이트였었잖아요. 그래서 지금 5에서 25, 그냥 단순 생각하면 4.8보다도 2배인가. 4.8이 5T급 모델이라고 했을 때는 그러면 10T급이라는 걸 그냥 막연하게 생각해 볼 수는 있겠죠.
노정석 이거는 잘은 모르겠어요. 4.8이 몇 T고 Mythos가 몇 T인지에 대해서는 전혀 모르죠. 저희는 밖에서 오픈 소스 모델, 저희가 그냥 현실적으로 스타트업 입장에서 트레이닝을 한다고 하면 3에서 50B 정도가 맥스일 것 같고 사실은 100B만 넘어서도 이거는 굉장히 단위가 뛰거든요. 500B는 훨씬 뛰죠. 그런데 프론티어 랩들이 쓰던 Opus나 Pro 이런 급들이 1T, 2T급이라고들은 얘기는 해요. 다들 컨펌을 안 해주지만 그냥 대략 이 정도라고 그렇게 얘기하죠.
최승준 GPT-4 때부터가 2T 정도가 나왔었잖아요.
노정석 그렇죠. 그런데 이제 Mythos는 10T냐고 하니까 사실은 5배 정도의 차이가 나는 건데, 그 5배 차이인데 가격 차이는 저 정도 나는 거면 여러 가지 의미가 있겠죠. 저도 제가 팩트를 알고 있는 건 아니어서 저걸 가정을 깔고 해석하는 게
최승준 무의미하고요. Dwarkesh의 그 해석에 따르면 원가 근처라는 거죠. 왜냐하면 지금 경쟁의 상황이다 보니까 여기서 크게 마진을 남기는 것은 아닐 것이다가 Dwarkesh 추측이긴 했었는데, 어쨌든 가격 분포를 보면 4.8이 입력 100만 토큰 대비 5달러, 출력 25달러. 그런데 2배, 10달러, 50달러. 지금 최고 비싸긴 하거든요.
노정석 그렇죠. Anthropic이 제일 비싸죠.
최승준 지금 거의 3.5 Flash도 가격이 꽤 올라오긴 했는데 어쨌든 입력만 봤을 때는 거의 5배, 출력도 5배. 그럼 5배 정도 가격이네요. Flash하고 3.5 Flash하고 그렇죠. 그래서 이걸 가지고서는 생각해 볼 수 있는, 저희가 누누이 말씀을 드리긴 하지만 왜 굳이 이런 걸 알아야 되는가. 왜 알아야 되나요?
노정석 그렇죠. Anthropic이 이런 무리수를 두고 있는 것도 참 대단한 일이긴 해요. 사실은 Google은 TPU나 NVIDIA 정도로 딱 통일돼 있고 아마 OpenAI 진영 역시 그 NVIDIA GPU 계열로 인프라가 다 통일돼 있을 텐데, Anthropic 같은 경우에는 진짜 Google TPU도 쓰고 저기 Amazon 가서 Trainium도 쓰고 그다음에 NVIDIA도 쓰고 그런데 이런 것들이 전선이 넓혀져 있는 게 좋지만은 않거든요.
inference만 별도로 보면 그래, 그럴 수 있지라고 하지만 트레이닝 과정에서 보면 이게 그 트레이닝 과정에 아까도 말씀드렸듯이 대부분의 병목이나 큰 어떤 차별화 포인트가 다 post-training에 존재하는데 얘가 그냥 플랫폼이 하나로 확 통일돼 있는 것에 강점이 분명히 있거든요.
OpenAI는 상대적으로 컴퓨테이션에 대한 선투자를 많이 해왔기 때문에 그냥 여기서 들리는 소문으로는 여전히 우위가 있다고 얘기하고 있고 Anthropic이 정말 쥐어짜면서 뒤따라가고 있는 것 같은데 그걸 보상하기 위해서 Mythos나 이런 것들을 끊임없이 먼저 시장에 선빵을 때려야 되는 그 아픔도 갖고 있는 게 아닌가라는 생각이 듭니다.
Fable API 비용과 루프 엔지니어링의 상업성 30:06
최승준 저도 공감하는 부분이 있고 그다음에 이런 숫자들을 그래도 좀 체화하려고, 저도 숫자가 편하지는 않은데 하려고 하는 것은 겁먹지를 좀 않게 되는 것 같아요. 대충 추산을 하면 이게 뭔가 이유가 있구나. 막연히 뭐가 거대한 모델이 나와서 나를 압도하고 우리를 압도하고가 아니라, 이게 뭔가 다 근거가 있는 것이 가격 근처나 이런 모델의 숫자와 관련된 근처에 좀 해석의 여지가 있어서 살펴보게 되는 거예요.
그래서 아까 같은 루프 엔지니어링을 했을 때 일단은 6월 22일까지 Fable을 한시적으로 열기로 했었잖아요. 이것도 계속이 아니었어요. 6월 22일까지 하고서는 이걸 구독 모델에 포함할지 계속 종량제로 갈지를 간을 보려고 했었던 건데 정부의 어떤 제재를 받은 거잖아요. 그랬을 때 그래도 API를 가지고 쓴다고 하면 얼마가 나올까를 대강 계산해 봤는데 그냥 좀 쉬운 단권 시나리오로 봤을 때 Dynamic Workflows 단권으로는 최대가 1,000 에이전트 돌릴 수 있고 그러면 1,500 Sonnet 4.6으로 했을 때 400달러 근처인 것을 1,500달러 들여서 해야 되는데 이걸 그냥 보통 요새 Fable 나오고도 지금은 flex할 수 있으니까 사람들이 시도했던 게 Fable에 goal 주고서는 밤새 돌려보고, 이렇게들 쓰셨거든요. 그거가 얼마만큼의 가격인가 API로 해서 장난 아닌 거죠. 예전 거에 비하면.
노정석 그러네요. 그래도 여기서도 보면 2배네요. Opus 4.8에.
최승준 그렇죠. 그런데 어쨌든 loop engineering이 그런 거를 넣지 않는다는 거죠. 사용을 많이 쓰게 하는 거, 그래서 그런 흐름들이 있다.
노정석 이거는 계속될 트렌드 아닐까요?
최승준 계속되겠죠. 왜냐하면 아니면 티키타카 하면서 계속 꼼꼼하게 붙들고 있어야지 성능이 올라가긴 하거든요. 원하는 걸 해낼 수 있고. 그래서 Mitchell Hashimoto가 비판을 했어요. 사실 훨씬 더 적은 가격에 사람이 노력을 해서 하면 제대로 일을 더 빨리 할 수도 있는데, 더 비싼 돈을 들여서 모델이 긴 시간 일을 하게 한다는 쪽으로 비판을 했습니다.
노정석 그런데 얼마 전에 정형원 박사님 뵀을 때도 아직 test-time compute에서 더 꺼낼 수 있는 과실이 많이 남아 있다는 얘기를 하시더라고요.
최승준 정형원 박사님 만나셨구나.
노정석 그래서 더 큰, 결국은 스케일인데, 더 큰 스케일을 내게 되면 얘가 훨씬 할 수 있는 일이 많아질 거다. 아직은 untapped 영역이 많이 남아 있다.
최승준 그거는 저도 동의를 하면서, 비싸다. 당분간은. 그래서 일단 그런 거를 찾아봤습니다.
노정석 상업적으로는 사실 가격과 성능의 trade-off는 모두가 각자 계산을 할 거니까요. 어떤 사람들은 얘가 비싸더라도 더 짧은 토큰 안에 일 처리를 하는 것 때문에 훨씬 얻는 게 많아질 거고 그러지 않게 또 반대로 test-time compute를 작은 모델로 더 많이 돌리는 게 더 이익인 그런 섹터도 있을 거고. trade-off의 문제일 것 같습니다.
최승준 그리고 아까 말씀드렸듯이 이 포스팅이었어요. 그런데 그림이 재미있더라고요. 처음에 나오는 거가 여기 Claude죠. Claude가 혼자 일을 하다가 여럿이 일을 해요. Claude를 만들었네요. Claude가 Claude를 만들었죠. 그걸 재귀적으로 반복하고 있습니다. 그래서 이거가 이미 내용을 다 설명했다고 보거든요.
노정석 그런데 저희 이거는 또 우리가 항상 너무 잘 알고 있는 거고 완벽한 동형이지 않습니까? 그냥 우리 생명의 세포의 분열과 완전히 똑같은 거라서 지금 프랙털을 보여주고 있잖아요. 그냥 하나에서 출발해서 다 봤는데 여전히 큰 섹터에서 봐도 여전히 자기 자신과 똑같은.
RSI와 Anthropic의 자기개선 궤도 34:09
최승준 저희가 몇 번 말씀드리기도 했고 모두가 기대하고 있듯이 RSI의 문턱으로 가고 있다. 그래서 여기서도 아직은 우리가 그 궤도에 정확하게 있다고는 얘기를 하진 않지만, RSI의 궤도로 가고 있다는 걸 선언했고, 이거를 얘기한 게 6월 초인데 6월 초에 S-1 document를 제출했다. 그래서 지금 Anthropic이 물론 첨병에서 잘하고 있지만 의도 있게 하는 거잖아요. 다 이게 비즈니스니까. 그래서 이런 거를 살펴봤습니다. 그래서 결국에는 이런 쪽으로 가고 있는 방향인 건데 이게 느낌상으로는 plateau가 전혀 아니고 계속 기울기가 높아가는 궤도에 있는 거죠.
노정석 그러니까요. 이게 점점 더 저희가 성현님이랑 이야기하면서 그런 얘기 많이 하잖아요. 저희가 정말 중요한 거는 데이터셋과 스케일과 관련한 부분인데, 그 부분은 밖으로 잘 보이지도 않고 저희가 접근하지도 못하는 정보들이 많기 때문에 바깥으로 나오는 그런 알고리즘이나 모델의 아키텍처 변화나 이런 것들을 보면서 약간은 호들갑을 떠는 그런 것들이 밖에 있는 민초들의 삶이라면 사실 프론티어에서 제일 관심 있게 보는 거는 algorithmic한 그런 발전은, 이거는 이제는 더 이상 큰 어떤 차별화 요소는 아닌 것 같고 걔는 그냥 자잘자잘하게 나온 거 있고 좋은 거 있으면 그냥 안에다가 끼워 넣으면 되는 거고 더 중요한 거는 데이터셋의 스케일, 얼마나 더 양이 많아지고 더 커질 수 있느냐, 그리고 그 데이터셋의 shape은 어떻게 되어야 되느냐라는 그런 부분들과 그리고 컴퓨팅 스케일.
컴퓨팅 스케일과 주권 AI 경쟁 35:49
지금 Mythos가 사실은 10T 모델인데, 그 10T 모델을 학습하는 계산도 안 됩니다. Chinchilla optimal이나 데이터셋의 크기나 이런 것들만 봐도 저희 예전만 하더라도, 3년 전만 하더라도 어떤 프론티어 모델이 3T, 5T에서 학습을 했다는 그런 얘기를 많이 들었는데 지금은 기본 30T거든요. 토큰 숫자로 계속 늘어날 거거든요.
최승준 그렇죠. 지금 Chinchilla optimal보다 100배 정도 overtrain됐다는 게 Dwarkesh 편에서 했던 얘기죠.
노정석 그런데 스케일을 늘리고 더 overtraining을 하면 거기서 끊임없이 꺼낼 수 있는 추가적인 이득, gain이 있다는 게 지금 우리가 보고 있는 거니까,
최승준 보고 있는 거죠.
노정석 그렇죠. 이제 프론티어 랩들은 그 방향으로 계속 달려 나가서 어떤 AGI 상황에 도달할 거고, 이게 마치 누가 먼저 원자폭탄을 개발하냐, 개발해서 뒤에 따라오는 사람의 사다리를 걷어찰 수 있느냐의 그런 게임이거든요.
최승준 그런데 한편으로는 Dario가 Machines of Loving Grace 글에서 이미 수학 체감 한계 효용을 얘기했었거든요. 특정 영역에서는 한계 효용을 얘기할 것이다. 그게 2024년 말쯤 이미 전망했었던 건데 벌어지고 있는 것 같아요. 이 정도 선에서 충분한 일들이 있는 거죠.
노정석 그렇죠. 그런데 그때만 하더라도 Sam Altman이나 Dario Amodei가 밖에 나와서 얘기하고 하면 저희가 그것들을 해석하면서 나름의 gradient를 해석해 보곤 했는데 지금은 그분들도 모르는 그런 미지의 영역으로 쭉 끌려 올라가는 그런 느낌이고 무언가 그분들도 정리해서 발표할 틈새가 없을 것 같아요.
그냥 막 부어 넣고 있는 중이고 그거에 대해서 수혜를 받는 건 여전히 반도체와 전력과 데이터센터가 계속 커져야 되는 거니까 NVIDIA 계속 좋고요.
최승준 그렇죠. 그러면 이런 아슬아슬하게 지금 달려가고 있는 빅테크들이 그럼에도 불구하고 collapse하지 않는 이유는 시장 전체가 떠받들고 있기 때문인가요?
노정석 아직까지는 그 기대가 계속 증가하고 있잖아요. 증가하고 있고, 증가하는 기대만큼의 어떤 결과물, outcome을 계속 내고 있으니까. 얘도 지금 저희가 이렇지 않습니까? 예를 들어서 우리가 어떤 투입을 10배 늘리면 그냥 체감상 그거에 대한 어떤 gain은 한 두 배 올라오는 상황이거든요. 그런데 지금 1T에서 10T로 올라가는데, 예를 들어 Mythos가 성능이 2배 좋아졌다고 칩시다. 그런데 여기서 만약에 여기서 또 2배를 가기 위해서는 사실은 저희가 익숙한 불과 6개월 전에 어떤 숫자들, 6개월 전에 우리가 익숙하던 스케일에서 100배를 더 올려야 된다는 얘기인데 달라지죠. 그렇죠. 100배의 스케일이 된다는 얘기는 지금 현존하는 지구상의 컴퓨테이션이 그냥 어떤 한 모델의 training에 다 들어가야 된다는 수준이거든요. 현실적으로 어렵긴 하죠.
현실적으로 어렵긴 한데 다시 이야기가 들어오면 10T 정도의 모델이 좋은 데이터셋과 좋은 어떤 training recipe에 의해서 만들어진 결과가 이미 지금 막 통제해야 될 정도의 핵무기 수준의 전략자산화됐는데, 그럼 10T 정도에서 어떤 상업적인 기대는 멈출 수도 있는 거죠. 한참 동안.
그리고 그다음은 사실은 뭔가 NVIDIA GPU가 아니라 퀀텀 컴퓨팅 정도로 패러다임이 바뀌어야 우리가 sustain할 수 있는 그런 수준일 수도 있는 거고 거기에 대해서는 공상과학 영화 수준으로 들어가는 거지. 저희가 계산을 해서 예전에 Aschenbrenner가 보여줬던 그 수준의 어떤 숫자를 제시하기는 좀 어려워 보여요.
최승준 그거 situational awareness죠.
노정석 10T 모델 가지고 지금 이거 미국 정부가 벌써 이렇게 하고 있잖아요. 그래서 sovereign AI에 대해서도 확 증가하고 있고
최승준 맞습니다. 미국만 할까요? 배웠으니까 중국도 할 수 있는 거 아니에요?
노정석 중국도 하겠죠. 일단 목적물이 보이면 그거는 이제 컴퓨테이션과 시간의 함수다라는 거는 이미 모두가 확인을 했으니,
최승준 제 얘기는 수출 통제를 중국도 할 수 있지 않느냐는 거죠.
노정석 그럴 수 있겠죠.
최승준 그러고 보니까 Kimi 2.7이 나왔어요. 코드가.
노정석 Kimi 2.7이 조용히 나왔는데 Kimi 2.7이 코드 쪽으로 또 뭐 하나 냈더라고요.
최승준 그렇죠. 이제 코드가 나왔어요. 근데 좀 묻혔죠. 지금 상대적으로.
노정석 근데 미국과 중국은 나름의 또 치킨 게임이고 약간의 죄수의 딜레마가 동작하고 있기 때문에 미국이 저렇게 전략 자산화하고 통제하면 중국은 그것들을 풀면서 미국이 아닌 다른 나라를 다 또 껴안을 수 있는 그런 거고 미국과 중국이 둘 다 막는다라고 하면 사실은 한국에도 기회가 있는 거고
최승준 기회가 오는 거죠.
노정석 그렇죠. 모두가 달나라에 로켓을 보내야 되는 그야말로 진짜 온 나라가 그냥 꿈을 향해 달리는 그런 미친 장사가 펼쳐질 수도 있는 거죠. 나쁘냐? 나쁘지 않죠. 좋죠.
한국의 독자 파운데이션 모델 기회 41:35
최승준 지금 독자 파운데이션 모델 쪽에서는 그냥 짐작하건대 좋은 이슈일 수 있을 것 같아요. 8월 초가 아마 2차 심사였던 거.
노정석 그렇죠. 거기에 대해서도 저희가 또 한번 들여다볼 시기가 당연히 올 텐데 Upstage가 100B 모델 내놨었고 SK텔레콤이 500B 모델 내놨었고 그리고 이제 장세가 이렇게 돌아가고 국가적인 차원에서도 또 자원들을 떨어뜨릴 준비를 하고 있으니 텔레콤 입장이나 아니면 Upstage 입장이나 혹은 다른 스타트업 입장에서나 크고 작은 프론티어 모델들을 향해 달릴 인센티브는 사실은 충분한 거죠. 지금 돈보다 돈보다 기회와 어떤 그런 미래에 대한 준비, future readiness라고 그래야 되나요? future readiness가 지금 돈보다 더 소중한 자산이 되어 있거든요. 돈이 오히려 더 흔한 시기죠.
그래서 하여튼 이런 걸 좀 살펴보고 제가 역사에서 인간의 인간적 활용이라고 Norbert Wiener가 1950년에 쓰고 그다음에 계속 개정판을 낸 유명한 책이 있어요. 번역서도 있는데 지금 절판 상태이긴 합니다만 이거가 떠오르는 국면들이 있습니다. 이게 자동화 사회에서 인간의 인간적 활용은 무엇이 되어야 될까 같은 것들을 좀 얘기하는 명저인데 지금 자세히 말씀드리기보다는 그게 하나 떠올랐고요. 그걸 말씀드리는 이유는 Fable 5 vibe check를 저도 나름 해보긴 했거든요. 며칠, 몇 번 못 써봤지만 그랬을 때 그냥 감상 같은 거를 좀 공유드리고 싶은데 제가 그동안 몇 번 읽어왔고 내용이 좋아서 옮겨 적어놓은 글들이 몇 개 있어요.
Fable 5 바이브 체크와 인간적 성찰 43:06
근데 그거를 좀 입력을 하고, 교육에 관련된 글인데 그거를 Fable하고 좀 얘기를 나눠봤습니다. 그리고서는 이게 재미있는 거가 두 개의 세션인데 하나는 이야기 나누는 세션이고 하나는 그 이야기 나눈 거를 다시 돌아보는 세션이었어요. 그런데 그 이야기 나누면서 모델이 저를 치켜세우는 부분이 있다고 개인적으로 느꼈거든요. 근데 그 부분을 다른 세션에서 잘 짚었어요. 그러니까 아첨과 성찰 능력 자체를 조망하는 거를 Claude 계열이 원래 그거를 좀 잘했는데 잘하더라고요. Fable이. 그래서 그게 인상에 좀 남아서 글을 좀 정리해 놓은 게 있고.
근데 그러면서 제가 이제 Dwarkesh 편을 하면서 느꼈던 거가 저번 세션에도 소개해 드렸지만 이게 생성형 인지 저하가 된다. 그래서 플래시 카드도 만들어보고 내가 어떻게든 좀 캐치해내려고 하는 것들을 만들기 위해서 더 읽어볼 거리들을 찾았거든요. 그래서 모델이 추천해 준 책이 있었어요. 근데 여러 개를 추천했지만 그중에 그걸 다 다룰 수는 없으니까 제가 딱 마음에 드는 한 권을 사서 그 프롤로그를, 책의 프롤로그를 Fable 5와 읽었는데 그 경험이 상당히 흥미로웠습니다. 이게 자세히 공유드리지 못한 이유는 이게 현재 일어나고 있는 아마 트렌드일 것 같은데 너무 좁은 영역에 대해서 얘기를 하다 보니까 생경한 용어들이 점철돼 있고 해서 이거를 다른 분들한테 공유하기가 갈수록 어려워지는 느낌이죠.
공부를 좀 하려고 하다 보면 좁은 영역을 파고들지 않습니까? 그러다 보니까 이게 이제 막 공유하기는 좀 애매한 그런 내용들이긴 한데 이게 결국에는 이거가 모델이 또 알려준 재미있는 개념인데 The purpose of a system is what it does라는 거를 사이버네틱스에서 통용되는 용어인데 저는 이걸 모르고 있었어요. 근데 이번에 그 대화를 하면서 알게 된 용어인데 참 맞다고 느끼거든요. 이게 제가 하는 모델과 나눈 대화 자체가 제가 하는 일이었더라고요. 내가 뭘 하고 싶어 하느냐와는 별도로 내 의도나 이런 goal과는 별도로 실제로 하고 있는 일이 모델과 나의 관계를 드러낸다. 그래서 저는 이 Fable 5와 대화를 나누면서 든 생각은 나는 생산적인 어떤 실용적인 거를 코드를 생산하는 것도 하긴 하지만 이렇게 좀 뭔가 꽂힌 거를 파고드는 그거를 즐기는 사람이구나를 재인하게 되는 계기였거든요. 그래서 이게 되게 맞구나.
그래서 그걸 거꾸로 이제 전이시켜 보면 모델과의 대화를 한번 돌아보는 거예요. 뭘 그동안 내가 모델들과 대화를 나누는 그게 그 사람이 모델을 쓰는 당연하게도 방향성이거든요. 그래서 어떤 사람은 굉장히 실용적인 거, 코드를 생산하고 자신의 어떤 일에 쓰는 데 몰입을 하고 실용적인 측면이 있고 어떤 사람은 좀 호기심을 탐구하는 성향이 있을 수도 있고 한데 그게 그 모델과의 자신과의 관계를 통해서 드러난다. 그거를 좀 알아차려 보는 계기가 Fable 5와 대화를 나누면서 좀 그리고 탁월한 부분이 있었어요. 어떤 부분에서는.
노정석 맞아요. 저는 사실 출장 중이고 하도 사이사이 미팅이 많아서 이번에 이 Fable 5가 발표된 이후에 앉아서 각 잡고 써볼 시간이 없었거든요. 그래서 전혀 감이 없는데 이제 써볼 수 없게 됐네요.
최승준 근데 저는 해프닝에 불과할 거라고는 막연히 생각하고 있긴 한데요. 근데 Fable 5가 다 좋은 건 아니고 Opus 4.6 시절에 글쓰기를 잘했던 그 프롬프트를 돌렸을 때는 아마 그 프롬프트의 문제일 수도 있는데 좀 밋밋했거든요. 그 수확 체감이 있었어요. 근데 다른 모드에서는 이거는 좀 놀라운 부분이 있었다라는 인상인데 인상에 불과하긴 하지만 결국에는 알아보려면 다각도로 실험해 보는 수밖에는 없더라고요.
나에게 맞는.
그리고 타임라인에서는 압도적으로 3D에 관련된 것들, 게임에 관련된 것들이 쏟아져 나왔어요.
노정석 그렇군요.
최승준 그런 것들을 잘 해내는 것 같더라고요.
노정석 저희가 참 이 시기를 나중에 뒤돌아보면 어떻게 기억하게 될까요?
최승준 글쎄요. 내년 이맘때쯤에 4주년 즈음에 또 생각을 해봐야 되지 않을까. 미래를 알기는 어려워요.
노정석 정신없이 달리고 있고 아마 후세가 보면 그때가 무슨 AI 혁명의 어떤 결정적인 시기였다 라고 기록할지도 모르겠어요. 모르죠. 이따 2, 3년 있다가는 더 말도 안 되는 그런 변화들이 생기면서 그때가 또 진짜일지. 맞아요.
최승준 작년 6월 14일 오늘, 그러니까 어제 발생한 일을 그때 가서 거꾸로 돌아와서 얘기해 준다면 믿었으려나요? 수출 통제가 됐다.
노정석 작년 7월에 뭘 하고 있었는지 전혀 기억이 안 납니다.
Claude Code 이후 엔지니어링의 변화 48:31
최승준 5월이 Claude Code 이슈였어요. 2월에 Claude Code 나오고 5월이 Claude Code 가지고 이렇게 쓰는 거구나를 커뮤니티가 알아갈 타이밍이라서 6월도 그 연장선이었거든요. 지금 그 사이가 어마어마해요.
노정석 뭐라고 말을 할 수가 없네요. 진짜 맞아요. 제가 작년 3, 4월 기억하는 게 3.7 Sonnet, 3.7 뭐 막 이런 거 나올 때였고 Claude Code가 2월에 나왔으니까요. 5월, 6월이 커뮤니티가 Claude Code란 무엇인가 이런 걸 쓰는 게 이제 막 유튜브에 조금씩 나올 때였고 그랬죠.
그러고 나서 1년이 흘렀는데 어이구, 격세지감이네요. 그 사이에 Sora 뭐 이런 것도 나왔었고 Codex가 헛발질하다가 Anthropic이 작년 가을부터 Claude Code의 어떤 버프를 받아서 쭉 회사 가치를 올렸고
최승준 6월 초면 Google I/O 끝난 뒤 한 달 뒤라서 2.5가 아직 핫했을 때예요. Gemini 2.5 가지고 많은 걸 할 수 있다. 근데 저 그냥 사소한 거지만 최근에 Minecraft 에이전트 개발하면서 Rust를 쓰기 시작했거든요. 제가 쓰는 게 아니지만
노정석 에이전트가 씁니까?
최승준 너무 잘 되더라고요. 깜짝 놀랐어요.
노정석 그렇죠. 엔지니어링의 개념이 사실은 바뀐 거니까 지금 아무도 이젠 코딩을 하고 있진 않지만 그럼에도 불구하고 저희가 무언가 쓸 만한 시스템을 만들려면 엔지니어링이 필요하거든요. 그게 예전과 같이 라인 바이 라인으로 코딩을 하는 게 아니라는 것만 달라진 거지 에이전트와 함께 여전히 우리는 한 층 위에 올라가서 엔지니어링 문제를 풀고 아키텍처링을 하고 있는 거죠.
최승준 그렇죠. 그런데 몇천 라인 수준에서는 아무 문제가 없던 거가 몇만 라인, 제가 한 3일 만에 저도 갑자기 6만 라인 정도로 뻥 튀게 됐었는데 그렇게 되면 리팩토링해야 되는 중복들이 많이 생기고 그거를 리팩토링하기 위해서 시맨틱한 정도의 중복들을 잡는 도구 같은 것들을 좀 방향성을 가지고 있게 되는데 Corca의 강규영 CTO님이 또 재미난 거를 Nose라는 거를 코드의 냄새 맡는 도구를 만들어서 그런 것들을 순식간에 또 만드셨더라고요.
근데 하여튼 그런 것들을 잘하기 위한 엔지니어링은 계속 필요하구나. 근데 엔지니어링에 도움이 되는 도구 자체를 만드는 그런 부트스트래핑이 또 일어나고 있는 것 같아요.
AI 프론티어 커뮤니티의 역할 51:02
노정석 그래서 참 결정적인 시기인데 저희가 참 AI 프론티어가 승준님과 제가 그리고 이제 저희를 넘어서서 사실은 AI 프론티어를 둘러싸고 저희 굉장히 많은 분들이 저희에게 어떤 정보를 주시고 커뮤니티화돼 있잖아요. 그래서 조금 더 저희가 공헌할 수 있는 부분들도 찾아야 되겠다는 생각이 들고 이것도 저희가 단순히 일주일 단위로 콘텐츠를 요약하고 뭘 하고 그런 것들에 대한 얘기를 하기에 너무 빨리 변하는 시기가 돼서 이게 뭔가 바뀌어야 된다는 생각이 들어요. 저희도 이제 사람의 속도로 따라가는 게 불가능한 그런 느낌도 들고 그리고 주변에 있는 커뮤니티 분들끼리도 서로 연결하면 굉장히 좋은 기회들이 많이 탄생할 것들이 눈에 보이는데 저 역시 사람의 시간을 살고 있기 때문에 못하는 부분들이 있어서 얘를 좀 시스템화해야 되겠다는 생각도 들고 있고 그리고 더 나아가서 여기 실리콘밸리에 굉장히 많은 기회들이 있고 제가 보기에는 한국에 계신 분들의 수준이 전혀 떨어지지는 않거든요. 그러면 여기와 서울 사이에도 많은 분들이 똑같은 생각을 하시지만 더 강력하게 연결을 해야 된다는 생각도 들고 한국에서 일어나는 일들을 거꾸로 여기에 더 많이 알리긴 해야 되겠다. 그리고 홍보해야 되겠다는 생각도 들었습니다. 이게 그냥 무언가 나라 단위로 뭘 하기에는 좀 다른 진짜 지구 단위의 스케일의 일들이 일어나고 있는 것 같아서 저희도 뭐 할 일들을 꾸준히 찾아봐야 될 것 같습니다. 그러면서 또 저는 바이올로지 쪽 사이드에 너무 재미난 것들이 많아서 걔들을 쳐다보다 보면 하루하루 시간이 너무 잘 가고
최승준 다 할 순 없지 않을까요? 인간의 시간을 살아야 돼서
노정석 다 할 순 없어요. 그래서 그걸 다 할 수는 없어서 저도 가장 영양가 있는 일 가장 임팩트가 큰 일 하나를 저도 잡아야 되는 타이밍이긴 해서 또 시스템을 생각해 봐야죠.
100회 이후의 계획과 새로운 도전 53:10
최승준 그런 것들이 고민이 있었던 100회였다.
노정석 뭔가 이제 다음 페이스로 한번 나가보시죠. 그래서 여기서 재미있는 친구들을 많이 만나서 이런 몇 가지 세션을 해보려고 그래요. Palantir 엔지니어 진짜 FDE로 활동했던 엔지니어들이 있거든요. 그래서 그 엔지니어들 모시고 와서 아예 그럼 어떤 일을 했습니까? Palantir는 AI 회사입니까 해서 Palantir에 대해서도 깊게 알아보는 그런 세션도 한번 해볼 수 있을 것 같고 물론 Frontier Lab에서 일어나는 일들을 물어보는 거는 조금은 실례예요.
근데 Palantir FDE들을 워낙 또 거기 출신들이 창업을 많이 했기 때문에 거기 분들에게 한번 물어보는 거 그리고 요새 FDE라는 말 자체가 대유행이잖아요. 한번 거기를 좀 태핑을 해봐야 되겠다는 생각은 하고 있습니다.
최승준 소소하게 저희 그냥 자축하는 정도로
노정석 한번 저 한국 돌아가시면 또 저희 AI 프론티어 시스템도 좀 바꿔보고 또 스케일을 더 늘려볼 수 있는 그런 거 고민을 한번 해보는 걸로 하시죠.
최승준 알겠습니다.
노정석 자, 그럼 승준님 오늘은 이 정도에서 마무리하겠습니다.
최승준 수고하셨습니다.