AI Frontier

EP 89

딸깍과 덜컹

· 노정석, 최승준, 김유진 · 44:03
페이지 전체

인트로: GPT-5.4 출시와 딸깍의 시대 00:00

00:05 노정석 녹화를 하고 있는 오늘은 2026년 3월 7일 토요일 아침입니다. 이번 주에 저희가 기다리던 GPT-5.4가 나왔고요. Claude도 새로운 기능들이 발표가 됐고, 사방에서 딸깍딸깍 “나 이거 만들었어, 이거 만들었어”라고 하는 간증기를 보고 있죠. 오늘 GPT-5.4와 그 딸깍, 그리고 그 수많은 딸깍 뒤에 존재하는 실체, 저희가 덜컹이라고 승준님이 표현을 해주셨는데, 그런 부분들에 대해서 한번 알아보도록 하겠습니다.

AI 프론티어 사이트 소개 00:31

AI Frontier 팟캐스트 블로그 aifrontier.kr

00:31 노정석 근데 저희가 오늘 메인 내용을 시작하기 전에, 저희 AI 프론티어라는 사이트가 있거든요. 저희 편집자이신 유진님께서 만들어주신 사이트인데요. 한번 유진님, 어떤 건지 소개 좀 해주시겠어요?

00:48 김유진 우리 AI 프론티어, 저도 애청자로부터 시작해서 편집자를 하게끔 자청하게 된 상황이기도 한데요.

늘 아쉬운 점이 유튜브 그 자체가 폐쇄적이기 때문에, Claude나 ChatGPT 같은 경우에는 자막을 다 공들여서 구성해 놓아도 에이전트들이 그거를 읽지 못한다라는 문제가 있었어요.

그래서 Claude랑 열심히 딸깍딸깍을 해서 만든 게 이 AI 프론티어 사이트입니다.

아예 포스트를 통째로 다운로드하시거나 그러실 수 있게끔 기능들을 다 제공하고 있고요. 저희 챕터별로도 링크를 따로 빼거나 특정 챕터만 복사를 하실 수 있게 기능을 만들어 놓은 상황입니다.

저희 유튜브 영상 설명 페이지 등에 링크가 나와 있습니다. 그 회차에 대한 링크가 나와 있으니까 ChatGPT한테 질문을 던지는 식으로 활용해 보실 수 있을 것 같습니다.

01:42 최승준 유진님이 이거를 딸깍딸깍 뭐 하셨다고는 했지만, 그래도 공을 들여서 만들어주셔서 저도 복사해서 붙여놓고 ChatGPT 등하고 얘기 나누는 게 도움이 될 때가 많이 있더라고요. 한번 많이들 활용해 보시면 좋을 것 같습니다.

GPT-5.4 주요 기능과 데모 01:57

OpenAI - GPT-5.4를 소개합니다 openai.com Computer Use & Frontend UI with GPT-5.4 Thinking youtube.com OpenAI Showcase developers.openai.com

GPT-5.4 Thinking의 계획 제시와 세부 보강 예시 📷 GPT-5.4 Thinking의 계획 제시와 세부 보강 예시

01:57 최승준 그래서 GPT-5.4가 나왔죠. 자세히 살펴보진 못했지만, 몇 가지 링크들을 뽑아 놨는데 이 두 영상이 재미있었고, 이 영상 하나는 Computer Use 에이전트 쪽이어서 요새 OpenAI, GPT-5.4 나오고서는 뭘 만들었다 뭘 만들었다 하는 것들이 공유되는 것들이 다 이거 관련인 거. 어떤 게임이라든가 3D 장면 같은 것들을 잘 만들 때 피드백 루프가 형성되는 거, 그다음에 대화하다가 중간에 방향을 트는, 그래서 후속 질문을 할 수 있게 되는, CoT 중에 후속 질문을 할 수 있는 기능이 좋았고요.

그리고 좋은 데모들은 쇼케이스 공식 사이트에, 쇼케이스 들어가면 상당히 잘 되어 있습니다. 많이 회자되는 어떤 RPG 게임이라든가 심시티 비슷한 거, 만든 그런 것들 포함해서 나와 있더라고요. 심시티는 아마 이 왼쪽에 있는데, 뭐가 많네요. 하여튼 5.4가 추구했던 다양한 프로젝트들이 이쪽에 공유가 되어 있으니 참고하시면 좋을 것 같고요.

OpenAI의 현재 위치와 경쟁 구도 03:01

03:04 노정석 품질이 정말 잘 나온 것 같더라고요. 저희가 지난주에 성현님이랑 이야기를 하면서, RL 환경 스케일링이 굉장히 중요한 요소가 될 것 같다, 그리고 프론티어 랩들이 거기에서 굉장히 앞서가고 있는 것 같고, 많은 진보를 이룰 것 같다라는 말씀을 드렸었는데, Computer Use 저쪽에 CUA라고 이름을 지어서 부르던데, Computer Use 에이전트 같은 경우에도 그 아래 환경 학습을 정말 잘 해낸 거죠. 저걸 pretrain에서 배웠을 리는 없고, 그 환경에서 어떤 때 어떤 액션을 해야 되는지에 대해서 굉장히 많은 시행착오를 겪으며 RL을 돌려서 높은 품질을 내게 된 것 같습니다.

03:42 최승준 그렇죠. 요새 OpenAI가 좀 부침이 있고, 여러 가지 개발 상황뿐만 아니라 처한 상황들이 좀 부침이 있고, 유저들이 Claude로 한참 몰려가기도 하고, 그런 일인데 또 어떤 영향이 있을지 모르겠네요.

03:59 노정석 타임라인에서 보고되는 품질들은, 지금은 5.4가 지금까지 나온 모델 중에서는 가장 최강이다라는 공감은 있더라고요. 실생활에서 쓰는 업무는 표준적인 인간보다는 훨씬 잘한다라는 부분은 너무 자연스럽게 받아들여야 되는 그런 순간이 왔습니다.

쏟아지는 신기능들과 딸깍 생산성 04:15

04:18 최승준 OpenAI의 주장이긴 합니다만, GWS라는 거는 또 Google에서 나왔더라고요. 저도 써보지 못했는데, Google Workspace에서 CLI 돌아가게 하는 버전을 만든 게 있습니다. 이것도 좀 회자가 되는 것 같고,

GPT-5.4 외에도 이분도 Claude Code 개발하시는 분이거든요. Schedule도, Task도, 또 Voice도 있었고, 계속 shipping shipping shipping이라고 되어 있는 걸 볼 수 있습니다. 지금 어마어마한 속도로 기능을 못 따라갈 정도로 출시를 하고 있는 요즘인 것 같고, 그게 되는 거는 AI들이 열심히 만들기 때문이겠죠.

04:57 노정석 시작해라와 어떤 결과를 내야 된다라는 것만 해주면, 그 결과를 내기 위해서 필요한 거의 대부분의 지식들을 모델이 가지고 있어서, 그야말로 정말 딸깍이 일어나는 것 같습니다. 많은 부분에서.

05:09 최승준 주 단위 릴리즈도 아니고 일 단위 릴리즈를 한 느낌이고, Claude Code 쪽에 그래서 좀 정신없기도 합니다.

Three.js와 Ricardo Cabello의 Quake 포팅 05:12

mrdoob - 'Claude로 Quake를 Three.js로 포팅할 수 있을까?' x.com Three.js Quake mrdoob.github.io

Mr.doob의 Three.js 기반 Quake 포팅 예시 📷 Mr.doob의 Three.js 기반 Quake 포팅 예시

05:14 최승준 그다음에 요즘 분위기 중에서, Three.js가 요새 AI들이 많이 쓰기 때문에 사용량이 확 올라갔거든요.

근데 Three.js를 만든 Ricardo Cabello라고, 스페인 분인데 Mr.doob이라는 이름으로 보통 불리는 개발자분이 Claude하고 함께 고전 게임이 됐죠, Quake나 Descent 이런 것들을 포팅한 거.

소스가 공개돼 있기 때문에 그걸 포팅하고 에셋 같은 거를 붙여서 라이브로 돌아가는 Quake 같은 거를 거의 동작하는 수준으로 포팅을 하셨더라고요.

Descent도 있고, 3D 게임들을 포팅한 예를 볼 수 있습니다.

05:55 노정석 근데 저게 중요한 게, 굉장히 빠른 시간 안에 끝났다는 게 중요한 거죠.

06:01 최승준 여기 GitHub을 보면 이력이 나와 있는데요. 이게 GitHub만이 아니라 포스팅 시작 자체가 재밌어요. “오케이 Claude, Quake를 Three.js로 포팅할 수 있어?” 그리고 1시간 뒤 이렇게 돼 있죠. 물론 1시간보다는 더 걸린 것이 GitHub의 흔적이 나와 있고, 여러 가지 조정하는 과정들이 있긴 합니다만, 어떤 장면인지를 볼 수 있는 거죠.

Andrej Karpathy의 학습 속도 실험과 자기 개선 루프 06:21

Andrej Karpathy - nanochat 자기개선 루프 x.com

06:21 최승준 Andrej Karpathy의 며칠 전 포스팅이, 이거가 흥미로웠어요. GPT-2를 몇 달 전에 3시간 정도였는데, 지금은 2시간에 학습시킬 수 있다.

06:34 노정석 8개 H100 파드를 가지고 2시간 안에 GPT-2 레벨은 끝난다.

06:41 최승준 근데 여기서 상상력이 재미있는데, interactive, closer to interactive니까 거의 바로바로 학습되게 하는 것 쪽으로 상상력을 발휘하는 부분이 있었는데,

이게 nanochat을 AI 에이전트들이 자동으로 반복 개선하도록 만들어 둬서 post-AGI의 기분을 즐기려 한다라는 농담 같은 걸 한 게 있습니다. 12시간 동안 110번의 변경이 이루어졌고, 그게 loss를 얼마큼 줄여, 그런 얘기들을 한 게 있어서 요즘에 또 분위기 중에 하나인 것 같습니다. 자기 개선 루프라는 거죠.

07:09 노정석 시켜 놓고 바라봤다라는 거네요.

Mitchell Hashimoto와 하네스 엔지니어링 07:11

07:11 최승준 그리고 Mitchell Hashimoto가 요새 많은 분들이 즐겨 사용하시는 Ghostty 만든 분이고, 이분이 HashiCorp 창립자였잖아요. 지금은 그거를 아마 매각하고 코딩 장인으로서 활동을 하면서 재미있는, 또 빠르고 예쁜 터미널을 만들고, 많은 AI 쓰시는 분들이 Ghostty를 쓰고 계신 걸로 알고 있는데, 그분도 GPT-5.4 나오는 새벽이었나, GPT-5.4 나오기 직전 즈음에 했던 포스팅이 Codex 5.3이 자기가 여섯 달 동안 struggling, 싸매고 있었던 문제들을 풀었다. 그거에 관련된 포스팅을 한 게 또 있었습니다. 그래서 요새 분위기의 단면들을 비교적 젊은 세대 분들의 단면을 좀 봤고요.

근데 Mitchell Hashimoto를 제가 다시 언급한 거는 하네스 엔지니어링이라는 용어의 출처가 이분 블로그였거든요. 그래서 나의 AI 도입 여정이라는 글이 저는 2월 달에 읽은 것 중에 가장 좋은 글 중에 하나였는데, 이게 한 6개의 챕터로 이루어져 있거든요. 챗봇을 버려라부터 하네스를 설계하라, 항상 에이전트를 돌려라, 확실한 쉬운 일은 외주 줘라, 그런 식으로 되어 있는데 step 5가 하네스를 설계하라였습니다. 그래서 여기서 하네스 엔지니어링이라고 저희가 용어를 한번 생각해 봤는데, 에이전트가 실수를 하는 것을 발견할 때마다 시간을 들여 그 실수를 다시는 하지 않게 만드는 해결책을 설계한다. 엔지니어링한다는 개념으로 하네스 엔지니어링 해서 크게 두 가지를 얘기했는데, 프롬프팅이라는 것하고 실제 프로그래밍 도구를 통해서 에이전트가 나쁜 짓을 하는 거를 볼 때마다 다시는 그 짓을 못하게 하는 쪽으로 노력을 하고 있고, 에이전트가 좋은 거를 하고 있는지를 스스로 검증할 수 있게 하도록 어떤 하네스를 제공하고 있다라는 얘기를 하고 있습니다.

상당히 좋은 글이고, 내용이 이 밖에도 많이 있어서 한번 읽어보시는 걸 추천드립니다.

09:13 노정석 뒤에서 승준님이 하네스와 스캐폴딩 얘기하시면서도 얘기해 주시겠지만, 사실 하네스라는 표현이 굉장히 많이 사용되고 있잖아요. 그래서 하네스를 어떤 분은 Claude Code나 Codex같이 모델 옆에 붙어가지고 하는 어떤 프로그램 덩어리를 저희가 총칭하여 거의 하네스라고 부르고 있는데, Mitchell Hashimoto가 얘기한 하네스는 그거 이상의 프론트까지도 다 이런 개념으로 받아들이고 있는 것처럼 보이네요.

Alloy Analyzer wiki.g15e.com 강규영 - Alloy 기반 실행 가능한 명세서 x.com

Alloy 기반 실행 가능한 명세서 사례 📷 Alloy 기반 실행 가능한 명세서 사례

09:43 최승준 근데 증강하는 도구이긴 하지만 동시에 말의 안장이나 마구같이 딱 조이는 그런 느낌이 뉘앙스가 강한 것 같아요. 하네스라는. 그래서 그런 어떤 검증하고 조이는 도구의 참고 사례로 요새 코르카에서 CTO로 계시는 강규영 님이 작년부터 Alloy라는 언어를 말씀을 하곤 했었거든요. 그래서 Alloy가 굉장히 어떤 domain specific한 언어를 가지고서 형식을 만들어서 정확하게 검증할 수 있는 어떤 체계거든요. 그거를 가지고서 최근에 바로 어젠가, 트윗을 올려주신 거가 이렇게 Alloy를 활용을 해서 end-to-end 테스트랑 자연어 설명이 붙어 있는 실행 가능한 명세서, 그래서 working의 어떤 테스트, integrated test 아이디어에서 아이디어를 얻어와서 이렇게 모델이 어떤 정확한 일을 할 수 있게 하는 그런 어떤 검증 도구들, lint 이상의 것인 것 같아요. 그런 도구들을 만들어서 하네스 엔지니어링을 하고 계신 느낌을.

하네스의 의미: 검증과 제어의 도구 09:50

10:44 최승준 그래서 요즘 제가 좀 더 생각해 볼 지점이 딸깍 될 일과 안 될 일을 어떻게 감각할 수 있을까. 그래서 보통 이렇게 작은 step으로 만들어서 될 일이 있고, 그 방법으로도 안 되는 일이 있다라는 느낌을 좀 받긴 하거든요. 그래서 모든 어떤 풀어야 되는 문제들이 정확하게 테스트 만들고 검증하는 방법으로 과연 다 될까. 상당수가 되긴 할 건데, 안 되는 일이 있다면 어떤 일이, 그런 것들에 대해서 좀 생각을 해보게 됐고. 그리고 그거를 어떻게 판단할 수 있을까, 감각할 수 있을까에 대한 좀 질문 같은 것들이 생겨 있는 상황입니다.

국내 시니어 개발자들의 AI 코딩 사례 11:19

김민태 - 시니어 개발자가 AI와 6개월간 25만 라인의 시스템을 만들며 발견한 것들 medium.com

11:24 최승준 근데 최근에 어떤 저희 국내 개발자분들의, 시니어급 엔지니어 개발자분들의 어떤 트렌드를 볼 때도 당장 저희 출연하셨던 정규 님이 40일간 100만 라인의 코드 베이스를 혼자서 작업하셨다고 하셨죠. 그래서 그거를 저희가 한 2, 3주 전에 이야기를 좀 나눴었는데, 어마어마한 일인 것 같습니다. 그런데 또 이번 주에 김민태 님이라고 예전에 KTH에서 이렇게 재미있는 분들, 잘하시는 분들 많이 모였을 때도 멤버였던 것 같고, NC나 우아한형제들 이렇게 거쳐서 계속 이렇게 오랫동안 일하고 계시는 민태 님, 시니어 개발자가 AI와 6개월간 25만 라인의 시스템을 만들며 발견한 것들이라는 블로그를 좀 소개해 주셨어요. 근데 그 글도 상당히 좀 흥미로운 부분이 있었던 것 같습니다. 그리고 조금 전에 말씀드렸던 규영 님도 흥미로운 거를 만들고 계시는데, 그게 3주간 4만 LOC 정도 AI 혼자서 작업하면서 이 정도 규모의 코드베이스는 한 사람이 혼자서 AI 에이전트들하고 매니징하는 패턴들이 발견이 되고 있는 것 같아요. 정석님도 좀 자주 보고 계시는 거죠.

아 근데 여기서 다시 정리 얘기가 나오네요. 누군가 이미 성공했다, 그리고 그런 게 큰 힌트가 되는 것 같아. 그러면 어떤 인물이 뭔가를 딸깍 만들었다. 그런데 인물의 역량도 중요하지만, 사실 그게 가능했던 거는 모델과 하네스의 영향이 있기 때문에 가능한 것 같다. 그러면 “야 나두”, 즉 성공 케이스는 “나두, 나두”가 된다. 어떤 인물이 뭔가를 만들었다는 것 자체가 굉장히 큰 힌트라는 거죠.

누군가 이미 성공했다면 될 일이다 12:36

13:06 노정석 그게 됐다라는 결과만 있고 그 결과물에 대해 코드 베이스가 있으면 사실은 설계서를 입수한 거나 마찬가지고, 마지막으로 돌아가는 use만 봐도 그걸 모델에 넣으면 모델이 그걸 decompose해서 계획을 세워주고 어떻게 만들면 되겠다.

13:18 최승준 너무 구체적인 힌트가 되는 거고, 그 정도가 아니라 누가 뭘 했다더라만 해도 큰 힌트라는 거죠. 그거를 제가 어디서 느꼈냐 하면 Lablup에서 CTO님이 HWP, HWPX로 페어링에서 메타 언어를 만들어서 HWP 바이너리를 만드는 데 성공했다고 정규 님이 힌트를 주셨잖아요. 준기 님이라는 분이 그거를 할 수 있었다는 걸 아는 것 자체가 큰 힌트라는 거죠. 그분이 어떤 역량을 가지고 계신 분인지 대강 알고, 그다음에 뭘 해냈다는 걸 알면, 어떻게 했을까를 모델과 이야기 나눠볼 수 있는 상황이다 보니까 그게 정답은 아닐지언정 추리해 보는 데 도움이 돼서, 아마 그런 식으로 이건 어떻게 했을까 저렇게 했을까 같은 것들을 뭐라고 해야죠? 리버스 엔지니어링하는 경우들이 이미 많이 있는 상황일 거라고 봅니다.

그래서 그런 거에 대해서도 좀 고민을 해봤고, 그리고 이거 자체가 페어링에 대한 메타에 대해서 좀 더 생각해 볼 기회가 되긴 했었는데요. 여기도 보면 A라는 거하고 B라는 거에 페어링이 있고, 그거를 어떻게 할 수 있을까에 대해서 생각해 보는 것들이 사람과 성공과의 페어링하고도 비슷한데, 이런 거 같은 경우에서 페어링을 했을 때 이게 성공한 게 부분적인 성공이라고 하면 사실 이게 변환이 되는 거에 대한 커버리지를 늘려가면서 조금 더 완벽하게 다가갈 수 있기 때문에 그런 것들이 또 좀 어떤 아이디어가 되는 것 같아요.

그다음에 이게 제가 9월 달에 한번, 작년 9월에 소개해 드렸던 거가 이 복리를 돌릴 수 있는 시간이 길지 않은 경우들이 꽤 있을 것 같다라는 생각이 다시 한번 재인출됐습니다. 그래서 이 부분에서의 잠정적인 제 느낌은 누가 이미 성공한 일이라면 될 일이다, 누군가 이미 성공한 일이면 이미 된 일이므로 될 가능성이 매우 높은 일인 것 같다라는 소회가 좀 있었고요.

하지만 이런 거는 좀 어려울 수도 있을 것 같아요. 왜냐하면 고인물들이 하는 것들은 좀 난이도가 있어 보였고 Donald Knuth라고 그 The Art of Computer Programming이라는 일생의 저작을 쓰고 계신 분이 2026년 현재 88세인데 이게 뉴스에도 올라왔죠. 미해결 조합론 문제를 해결하는 과정을 논문으로 공개를 하고 Hacker News에서도 며칠 전에 다뤄졌는데 이게 안 될 거라 AI를 안 쓰는 쪽이었다가 되는 걸 보고서는 초고수가 그걸 해내는 그런 얘기들을 좀 살펴볼 수 있습니다.

Donald Knuth: 88세 노장의 AI 활용 15:20

15:50 노정석 본인이 난제로 가지고 있었던 문제인데 AI의 도움을 얻어서 풀어낸 거죠. 누가 어떤 분이 트위터에서 봤는데 이 Donald Knuth의 문제를 그대로 가지고 가서 GPT-5.4 Thinking에 넣었더니 정답을 다 풀었다고 하더라고요. 검색하지 말고 풀으라고 그랬더니. 네.

16:08 최승준 그래서 그 조합론 쪽의 문제들이 지금 좀 많이 풀리는 것 같아요. 같은 느낌이긴 해요. 그래서 마침 Donald Knuth가 아직 집필하고 있는 중인 책이 아마 현재 4B까지 나왔나, 조합론에 관련 combinatorial algorithms에 관련 집필하고 있던 중에 그런 쪽의 도움을 받은 것 같습니다. 그래서 어쨌든 88세의 노장도 AI를 통해서 더 나아가고 있는 중이고요.

16:35 노정석 끊임없이 진보하고 있는 거죠.

16:38 최승준 Donald Knuth에 대해서 좀 궁금하신 분들은 참고하실 수 있는 젊은 시절의 Donald Knuth가 펀치카드 시절에 했던 Electronic Coach라는 재미있는 영상이 하나 있고 그다음에 이분이 글 쓰려고, 책 쓰려고 했는데 조판 시스템이 없어서 TeX을 만들었지 않습니까? 그래 가지고 그게 결국에 LaTeX이 돼서 논문의 시스템이 된 건데 그거를 만든 장본인이시거든요. 그래서 그런 이야기가 궁금하면 좀 살펴보셔도 좋습니다. literate programming이라는 개념 같은 거를 굉장히 일찌감치 말씀하셨던 분이거든요.

Guido van Rossum, Kent Beck의 AI 전향 17:10

17:11 최승준 그리고 저도 깜짝 놀랐는데 나이 조사하다가 Python 만든 Guido van Rossum이 70세래요 올해.

17:16 노정석 Andrej Karpathy와 30년 차이네요.

Kent Beck - '90%의 스킬은 가치 하락, 남은 10%는 1000배 상승' x.com

17:19 최승준 Guido van Rossum도 요새 AI 쓰는 쪽으로 전향을 해 가지고 Claude를 써서 뭘 했다 같은 것들을 타임라인에서 볼 수 있고 몇 번 소개해 드렸던 Kent Beck, Extreme Programming이라든가 소프트웨어 디자인 패턴 쪽에서 유명한, 또 Agile Manifesto에도 참여했던 Ward Cunningham하고 또 되게 친한 분이죠. 그래서 그분이 64세인데 genie라고 부르던 AI를 가지고서 뭐하는 거에 대해서 라이브 코딩하는 걸 genie session이라고 올리시고 그런데 2023년에는 이렇게 얘기했었거든요. reluctant하니까, 마음에 확 와닿지 않지만 억지로 하는 그런 쪽으로 해서 ChatGPT 좀 써봤다가 내 skill의 90%가 사라지는 거야 라고 한 거를 23년에 올렸다가 잘 쓰는 쪽으로 해서 지금은 굉장히 신난다. 코딩하는 게 재미있다 얘기하고 최근 어떤 발표를 또 강의하는 거를 예정에 두고 어떻게 genie가 프로그래머가 해야 될 일과 하지 말아야 될 일을 바꾸었는가라는 제목.

18:27 노정석 이 아래에 써주신 23년 4월에 쓰셨던 글도 굉장히 본질적이네요. 내가 가지고 있는 90%의 skill은 가치가 떨어졌지만 그다음에 remaining, 남아 있는 10%의 값어치는 천 배가 뛰었다. 단순히 코딩하는 기술이 아닌 다른 어떠한, 저희가 요새는 이걸 도메인 암묵지 이렇게 요약해서 부르고 있었는데 이 부분에 대한 가치는 훨씬 뛰었다라는 얘기를 했었네요.

18:54 최승준 저희가 팟캐스트 시작할 즈음에 그런 시절인데 벌써 시간이 훌쩍 지나갔습니다. 그래서 2026년 현재 아직은 통하는 생각 방식이 하네스로 될 일과 스캐폴딩으로 될 일이 있다고 생각을 좀 하게 됐는데요. 스캐폴딩은 도움 계단을 주는 거잖아요. 하네스는 아까 조이는 쪽이고 스캐폴딩은 교육학 쪽에서도 많이 쓰이는 용어인데 비계 설정이라든가 나중에 치울 거긴 하지만 학습자가 스스로 올라갈 수 있게 도와주는 어떤 상황이나 환경 같은 거를 설정하는 거를 말하기도 하거든요.

하네스와 스캐폴딩: 위임과 스킬 형성의 딜레마 19:04

19:30 최승준 GPT-5와 스캐폴딩이라는 그 어떤 부분이 트랜스크립트를 번역한 건데 그냥 물으면 절대 못 한다. 어떤 문제가 있을 때 GPT-5에게 그대로 던지면 답이 안 나온다. 너무 어렵다. 그래서 GPT-5 주변에 스캐폴딩을 구축한 것이다. 여기서는 스캐폴딩이 여러 가지가 있는데 어떤 에이전트는 아이디어를 제안하는 에이전트, 실행하는 에이전트, 검증하는 에이전트, 서로 다른 결과를 병합하는 에이전트 등을 주면서 그거를 열린 문제를 바로 처음부터 던지는 게 아니라 워밍업시켜 가지고 자기가 알고 있었던 해법을, 알고 있는 문제를 풀게 한 뒤에 그 해법을 실제로 더 도전적인 문제를 풀어야 되는 컨텍스트에 넣어준 다음에 일반화한 문제를 공격해 보는 거를 하게 해라 했더니 그 과정에서 나온 CoT라든가 결과물이 놀라운 것이 나왔다 하는 부분. 그래서 이 후반부의 내용도 재미있는데요.

그거를 어떻게 asset으로 쓸 것이냐, 그리고 그거를 통찰을 자동으로 찾아내는 방법을 만들어보는, 한 단계 더 가는 건 어떻게 할 것이냐. 아무도 던져본 적 없는 질문을 이 과정을 통해서 어떻게 던질 수 있도록 하는가에 대한 흥미로운 얘기가 나오는데 이런 맥락이 좀 스캐폴딩에 관련된, 조여 가지고 작은 단위를 확인시켜서 될 일이 있고 더 흥미로운 가설들을 세워가면서 도전하면서 하게 하는 일들이 있고 그게 공존하는 상황인 것 같거든요.

그런 상황이 됐을 때 그래도 공통적인 거는 위임인데 나의 AI 도입 여정에 중요한 점은 나는 다른 일을 한다는 방식이 널리 알려진 Anthropic의 skill 형성 논문을 어느 정도 상쇄한다고 생각한다는 것입니다. Anthropic의 skill 형성 논문이 뭐냐 하면 에이전트에 위임한 작업에 대해서는 인간의 skill이 형성되지 않는 대신에 내가 계속 수동으로 하는 작업에서는 자연스럽게 skill이 계속 형성된다. 그래서 스캐폴딩이 됐든 하네스가 됐든 내가 그거를 위임을 통해서 AI를 쓰게 되는 건데 위임하되 잃지 않으려면, 퇴화하지 않으려면 또는 다른 역량을 개발하려면 어떻게 할 수 있을까. Kent Beck처럼 자기의 남은 10%가 여전히 천 배가 된다고 생각하는 사람들도 있을 수 있지만 보통의 사람들은 위임하다 보면 잃어버릴 수 있죠. 그게 좀 고민이 되는 부분.

21:50 노정석 이런 이야기는 저희가 AI나 에이전트의 활용이나 이런 걸 나오기 전에도 항상 자기 계발 도서에 뻔히 있는 그런 내용이었거든요. 어떻게 해야 어떠한 일들이 나를 가치 있게 만들고 어떠한 일들은 열심히 하지 않고 위임하거나 혹은 하지 않아야 하고 이런 얘기들은 꽤 있었기 때문에. 저희가 소프트웨어 엔지니어링이라는 것 자체에 저희도 많은 부분 함몰되어 있거든요. 왜냐하면 출신이 그렇다 보니까. 그리고 소프트웨어 엔지니어링이라는 게 어떻게 보면 지난 한 20~30년간 황금기를 구가했잖아요. 코로나 때는 6주짜리 부트캠프만 하더라도 회사에서 15만 불, 20만 불 이렇게 연봉을 받고 취직되고 그런 시대가 막 끝났잖아요. 그러다 보니까 소위 호들갑을 저희가 막 떨고 있는 거지. 근데 항상 무언가 수급이 바뀌면 시장의 다이내믹스는 다 바뀌고 있잖아요. 근데 그게 우리가 어떻게 보면 러다이트 운동의 당사자이기 때문에 그 부분에 대해서 과하게 호들갑을 떨고 있는 게 아닌가라는 생각이 저도 이제는 하게 되고,

소프트웨어 엔지니어링의 상향 평준화와 도메인 확장 22:12

23:03 노정석 어떻게 보면 아 이 Claude Code가 이걸 했대, Codex가 이걸 했대라고 하는 것도 저희 지난 한 2, 3개월 동안 굉장히 하루하루가 신기하고 이런 걸 해보면서 도파민이 터지는 시기였는데 어느새 이게 일상이 됐고 나만 할 수 있는 것도 아니고 모두가 할 수 있는 세상이 됐고 그럼 어떻게 해야 되는가라는 고민들에 다 밀려난 것 같아요. 거기에서 무엇을 어떻게 할 건가, 아까 Kent Beck이 그럼 나는 내 남아있는 10%가 어떻게 천 배의 값어치를 갖게 할지 recalibrate 해야 되겠다라는 표현을 했었는데 모두가 다 recalibrate을 해야 되는 그런 타이밍이 오는 거고,

그리고 소프트웨어 엔지니어링이라는 나름의 그래도 지식 노동에서는 최첨단에 있는 부분들이 모델에 다 휩쓸려 갔으니 이 다음은 저희가 여전히 어떤 물리학 논문이라든지 생물학 논문이라든지 화학 논문 혹은 변호사들이 쓴 법전 문서 이런 걸 보면 와닿지 않거든요. 그리고 그거는 그 안에서의 어떤 skill이 아니면 접근이 안 됐었는데, 모델의 도움을 가지고 그 도메인에 가는 게 전혀 이상하지 않은 그런 세상이 됐거든요. 그래서 뭔가 학습하고 문제를 정의하고 새로운 관점으로 바라볼 수 있는 그런 입장에 있는 사람들은 이 도메인이 엄청나게 넓어지고 있는 거죠. 만약에 그런 도구가 없었다면, 저도 이번 주는 일이 너무너무 많은 주간이었는데 이런 주간일수록 괜히 이상한 책 보게 되고 어려운 논문 보게 되고, 그래서 생명공학에 관련된 논문들을 몇 편을 봤는데 예전 같았으면 제가 감히 무슨 말인지 한 문장도 못 알아들었을 그런 것들을 찬찬히 읽어내고 다 가르쳐 주고 그것들의 함의를 하고, 심지어 GPT-5.4에 넣으니까 이 논문 이상이 앞으로 만들어 낼 거는 이거 될 거야. 나도 증거가 없지만 거의 90%의 확률로 이렇게 될 것 같아라고 얘기를 하는데 그 내용들 듣고 있다 보면 지금은 어떤 노벨상을 노리는 그런 생명공학자가 했어야 될 이야기를 얘가 아까 그 승준님이 말씀하신 것처럼 누군가 이걸 했다라는 소식을 들으면 나도 할 수 있어가 되는 것처럼 그런 세상이 돼버린 거라서 또 다른 도메인들로 계속 어떤 탐험의 경계가 넓어지는 거 아닌가 라는 그런 생각이 듭니다. 재미있는 시기입니다.

그래서 어쨌건 제가 이야기를 요약을 하면, 아 이제는 우리도 Claude Code랑 Codex랑 이 하네스가 어떤 일을 할 수 있고 어떤 한계가 있고 이런 얘기는 이제는 접어야 되는 시기가 오는 것 같다. 이건 그냥 되는 게임이야. 인캡슐레이션 돼서 아래 레이어로 그냥 내려갈 거고 우리는 다음 레벨로 올라가서 거기서의 게임을 다시 생각해 봐야 되는 거고, 솔직히 승준님이랑 저랑 올해를 시작하면서 이 하네스 논쟁은 곧 끝날 거고 모델은 AGI에 곧 도달할 테니 이 다음 레이어에는 다음 도메인인 사이언스나 이런 쪽으로 좀 더 우리도 가보자라는 얘기를 했던 기억이 납니다. 근데 워낙 소식들이 많아가지고 저희가 AI 사이언스, 그다음에 알파 지놈이라든지 바이올로지가 컴퓨테이션과 AI와 결합해서 하는 부분들, 화학이 결합해서 하는 부분들, 이런 부분들 이야기를 많이 안 했는데 그런 쪽으로 저희도 좀 기어를 바꿔야 되는 게 아닌가라는 생각을 하고 있습니다.

26:28 최승준 근데 이렇게 말씀하신 거 듣다가 저도 한번 되묻고 싶어지는 부분이, 정석님도 코딩이나 이런 거는 확실히 안 하고 있을 가능성이 크다고 보는데 그럼에도 불구하고 아까 생명공학에 대한 걸 살펴본다거나 뭔가 나 자신을 다음으로 인도하는 정보를 흡수하는 일들은 또 잘 하게 되는 거가 맞는 거죠. 그런 역량이 오히려 발휘가 되고 있는 거라고.

26:54 노정석 그렇죠. 결국은 학습하는 자라고, 저희도 예전에 자기계발서 결국 끊임없이 학습하고 스스로를 변신시키는 게 중요하다라는 얘기를 했었는데 과거에는 어떤 학습을 통해서 지적인 skill로 하나의 skill을 머릿속에 하면 그게 노동의 가치로서 쓰일 수 있는 그런 시기였잖아요. 그런데 그게 막 끝나가고 있지 않습니까? Python 잘하는 사람, 프론트엔드 잘하는 사람, DB 잘하는 사람, 뭐 잘하는 사람, 사실 그들은 어떤 문제 자체에 대해서는 신경 쓸 필요가 없고 문제를 누가 정의해 오면 그거를 잘 시공하는 시공자들의 이런 것들이 됐는데 이건 1800년대 중반에 방직 기계를 잘 다루던 그 옷감 짜는 사람과 다를 게 하나도 없는 거죠. 근데 그 사람들은 그래도 한 2, 30년 한 세대를 두고 이게 없어졌는데 저희는 거의 지금 6개월이잖아요.

Claude Code가 작년 3월에 나왔어요. 승준님 그리고 저희가 Claude Code 처음 써본 게 5월인가 그랬고, 겨우 1년 되는 건데 단 1년 만에 Opus가 판올림하는 것과 GPT가 판올림하는 것과 그와 덩달아 이렇게 만들어진 하네스들이 1년 만에 이거 싹 끝내버린 거거든요. 아직도 안 쓰는 사람 많아요. 이걸 쓰지 않는 사람이 저는 쓰는 사람보다 아직 훨씬 많다라고 생각하거든요. 소프트웨어 엔지니어 중에서도 이걸 쓰기 시작한 사람들도 이렇게 시간 차이가 나는 건데 결국은 이 문제는 어디로 귀결되냐면 결국 상향 평준화돼요. 제일 잘하는 사람이 모든 일을 다 하는 식으로 해서 다 상향 평준화되죠.

산업화도 섬유 사업도 그랬고 철도 사업도 그랬고 자동차 사업도 그랬고 시계 사업도 그랬고, 항상 이렇게 고도 성장기가 생기는 것처럼 보이지만 끝나고 나면 항상 서너 개 회사가 다 끝내거든요. 어쩌면 소프트웨어 엔지니어링이라는 이 영역도 저희도 끊임없이 아 그래도 도망갈 도메인이 있을 거야, 뭐가 있을 거야라고 얘기했는데 그 막강한 generality를 가진 모델이 밀고 오면서 우리가 그 specific하다는 그런 영역들도 하나씩 다 steamroll 시키는 걸 보고 있잖아요. Donald Knuth처럼 난 알고리즘은 완전 특화돼 있어라고 하는 사람도 이제 할 일이 없잖아요. GPT-5.4가 무언가 문제를 주면 더 잘 풀 테니까.

그래서 이런 시기에서 저희가 뭔가 가치관의 렌즈를 좀 이젠 기어를 시프팅해야 된다는 생각은 들어요. 물론 이 타임 갭 때문에 생기는 부분들도 여전히 사업 찬스가 있을 수 있는데 와 이 타임 갭을 무언가 좀 알아채고 exploit 하기에도 너무 압축이 심해요. 너무 압축이 심해가지고, 결국은 상대성이거든요. 더 상대적으로 어렵고 희소하기 때문에 특정 전문가들만 가 있는 그런 도메인들이 여전히 굉장히 많아요.

그리고 그 도메인들 어마어마하게 크고, 거기가 코딩처럼 한 번 털어 먹으러 가야 되고 털리겠구나, 이런 생각을 하면서 저도 승준님도 물리나 이런 쪽에 관심이 있으시듯이 저도 화학과 생명공학 이런 거 보고 있어요.

29:57 최승준 어쨌든 근데 정석님의 얘기를 좀 한번 리캡해 보면, 발상 자체를 좀 안, 또는 발상이라기보다는 시선 자체를 좀 다른 곳을 봐야 된다는 거죠.

30:11 노정석 다른 도메인과 이런 쪽으로 하면 저희가 지금까지는 태핑하지 못하던 영역들도 할 게 너무 많다.

30:18 최승준 코딩이나 이런 AI 쪽의 발전은 그 기울기를 상수로 봐야 된다는 거죠. 계속 잘될 일이다.

30:22 노정석 어제 정규 님이 그 얘기하시지 않았었나요? 그 단톡방에서. 될 것 같은 일은 하지 마라. 왜냐하면 가치가 없는 일이니까.

수십 개 대화와 대량 코드가 누적된 실험 기록 📷 수십 개 대화와 대량 코드가 누적된 실험 기록

30:30 최승준 그거를 아까도 저도 고민했던 포인트가 될 일과 안 될 일과 조금 노력해서 될 일 같은 것들에 대한 감이 있어야 된다니까요. 그래서 저는 3월 1주에 정석님은 그런 어떤 쪽에 공부를 좀 하셨고 저도 나름 공부를 했는데 저는 아직도 웹에서 대화하기에는 웹이 훨씬 편하기 때문에 웹에서 대화를 많이 하고 CoT를 또 보는 거를 좋아하다 보니까 아무래도 이쪽을 하게 됐는데, 3월 1일 정도부터여서 어저께까지 대화했던 한 60개 정도의 대화.

3D 메쉬 알고리즘 도전기: 논문 투 딸깍 실험 30:38

31:03 노정석 다 어떤 3D나 이런 쪽이네요.

31:11 최승준 하나의 문제를 풀기 위한 대화. 그래서 그 대화마다도 코드가 한 천 줄 정도 있는 경우들이 많고, 이렇게 몇 턴 되니까 몇 턴 빼더라도 최소로 잡아도 한 6만 라인 정도의 코드가 들어 있는 대화 분량이에요. 그래서 무슨 문제를 풀려고 했었냐 하면 제가 2020년에 그 소셜미디어에 올렸던 포스팅인데 아, 이런 거 내가 개발해 보고 싶다. 그래서 비메쉬라는 알고리즘이 잘 알려져 있는 게 있어요. 그게 블렌더라는 3D 도구였고 지브러시라는 데에서도 비슷한 것들을 일찌감치 쓰곤 했는데 부드럽게 그 모델을 만들어 주는 그런 거거든요. 근데 제가 그거를 AI 코딩이 없었던 시절에 인간지능으로 비슷한 거를 구현하려고 해서 했지만 그거를 구현하지 못하고 파생한 걸 구현하는 게 있었는데 이게 그 어린이들이 그린 그림을 넣으면 이렇게 스키닝 되어 있는 걸 만들어서 이런 거를 만들어 놓은.

32:00 노정석 이게 승준님의 21년 작품인 거죠.

32:02 최승준 이런 지금도 이렇게 바로 볼 수 있는 도구가 있는데 여기서 예를 들어서 제가 어떤 PNG 파일을 이렇게 생긴 PNG 파일인데 그거를 여기다가 드래그 앤 드롭하면 이렇게 만들어줘요.

32:16 노정석 얘는 3D인가요? 3D겠네요.

32:20 최승준 그렇죠. 3D인데 앞뒤가 같은 거고 애니메이션이 되어 있고, 그래서 이렇게 만든 거. 어린이들이 만들면 제가 그거를 이런 식으로 졸업식 할 때 한 명 한 명 그린 거를 이렇게 만들어. 그거를 얘네들이 어떤 말을 걸어주는 글이긴 하지만 그런 거를 한 게 있었어요.

근데 요새는 직접 이런 걸 코딩을 하지 않지만 그때 도전하지 못한 거는 이렇게 앞뒤가 똑같은 게 아니라 입체적인 구조를 하려고 했던 건데 거기까지는 제대로 스스로는 못 했어. 이미 알려져 있는 논문들이 있고 코드들이 있음에도 불구하고.

왜냐하면 그게 사실은 선형대수 관련된 아이겐 같은 거를 의존하는 경우가 있거든요. 아이겐이라는 라이브러리가 있는데 그거가 좀 까다로워서 웹 환경에서는 하기가 어려웠고.

PoC는 되지만 깍은 어려운 지점 33:05

GPT-5.4로 진행한 논문 투 딸깍 실험 화면 📷 GPT-5.4로 진행한 논문 투 딸깍 실험 화면

33:05 최승준 그런데 GPT-5.4 나온 김에 “논문 투 딸깍”이 과연 될까 실험해 봤습니다. 되지 않았지만 얼추 비슷하게 나왔습니다.

33:11 노정석 지금 “따알”까지 갔고 아직 “깍”이 안 나온 거죠.

GPT-5.4로 진행한 소스 투 딸깍 실험 화면 📷 GPT-5.4로 진행한 소스 투 딸깍 실험 화면

33:15 최승준 그래서 요거 그냥 “논문 투 딸깍” 정도를 보여드리면 이거는 한 30분 정도, 20분 정도 작업한 건데 이렇게 처음에는 시작은 간단히 한 다음에 계획 세우고 티키타카 한 다음에 어떤 구조 잡고서는 진행을 하게 한 거예요. 그래서 MVP 정도로 최소 구현 정도로 하려고 했는데 나오긴 나왔습니다만 사실 아쉬움이 많아서 “소스 투 딸깍”을 해봤습니다. 그 논문을 보고 구현해 놓은 GitHub이 또 있거든요. 그래서 그거에 아카이브를 받아가지고 했는데 그거는 10분 걸렸어요. 그런데 조금 더 품질이 낮습니다. 왜냐하면 이건 포팅이니까 훨씬 더 난이도가 낮은 문제죠. 하지만 이런 구간들이 안 되는 구간, 구현했다고는 했지만 사실은 성공하지 못한, 딸깍도 안 되는 것들. 하지만 그래도 어떤 PoC 정도는 보여주는 능력을 아주 간단한 프롬프트에서는 된 거고 근데 딸깍 됐던 부분들이 있었습니다.

그래서 지난 3월 1일인가 2일 즈음에 제가 이걸 만들었었거든요. 이거는 뭐냐 하면 여기다가 지금 잘 안 보이지만 고질라라고 쓰면 이게 생성이 되는 거예요. 그리고서는 애니메이션도 되고 그다음에 여기 산타클로스라고 제가 아마 다음에 썼을 거예요. 산타클로스라고 쓰면 산타클로스 비슷한 애가 생성이 되고.

근데 이거는 아까 거랑 비슷해 보이지만 그 아이소서피스라는 거를 써가지고 이게 훨씬 더 쉬운 알고리즘이에요. 이게 쉽게는 만들어지지만 디테일은 좀 부족해. 손가락 같은 거를 생성하거나. 이거는 30분 정도에 했습니다. PoC는 다듬는 거는 하루 이틀 더 걸리긴 했었고요. 그다음에 이것도 PoC는 한 30분 정도에 했던 겁니다. 조금 더 제대로 가려고 아예 모델링 도구 같은 것들, 사람 형상이 있으면 늘려서 좀 줄이거나 다른 형태로 만들어 보는 그런 거를 지브러시라는 그 3D 도구에서 지스피어라는 개념을 가지고 한 게 있는데 이런 거를 만드는 것 정도는 Gemini가 특히나 3D가 잘 되다 보니 너무 쉽게 되더라고요. 여기까지는 쉬웠습니다.

덜컹 구간: 모델도 풀지 못한 경계 연결 문제 35:18

35:18 최승준 그래서 논문에서는 이거를 보간해가지고 잇는 게 관건인 거거든요. 이걸 만들어서 이거를 목표로 하는 건데 거기서부터가 덜컹이었어요. 그래도 이 가장 그 끝단의 이음새 빼고는 복원하는 거는 쉬웠어요. 근데 이 부분이 인간이 보기에는 너무 쉬운 부분인데 수학으로 생각해야 될 거는 사실은 많은 부분이.

35:40 노정석 관절 부위인 거죠.

35:47 최승준 그래서 이거를 한번 보여드리면 여기서 아까랑 똑같은데 중간을 잇고 끄고 하면 이렇게 되는데 바운더리 엣지 같은 것들이 이런 식으로 나와서 이거를 연결 부위들을 잇는 것들이 생각보다 자명하지 않은. 그거에 관련된 수학이랑 알고리즘을 탐색하는 것들이 주간 한도를 다 쓰면서 안 돼서 다른 모델들도 쓰고 하고 있었죠. 그래서 아까 대부분의 대화는 그 가설과 실험을 반복했던.

그런데 문제를 디바이드 앤 컨커를 하기 위해서 문제의 부분을 끊어와가지고, 또는 비슷한 문제를 재현해서 그거를 하나씩 하나씩 작동하나 안 하나 그런 것들을 테스트를 해봐가지고. UI 붙이고 이거 자체는 딸깍이 돼서 너무 좋긴 했습니다. 이걸 제가 예전에 하려고 했으면 이거 자체를 구현하는 데만도 시간을 많이 썼는데 어떤 perturbation을 시키거나 vertex 수 조절, 이런 것들이 순식간에 되니까 나는 그냥 가설만 세우고 실험을 하는 거는 AI가 하는 거예요.

그래서 이거를 이 가설을 해보고 컨벡스 헐, 볼록 껍질이라는 가설을 실험해 보고. 저는 생각을 못했는데 모델이랑 얘기를 하다가 동적 계획이라는 거를 쓴다는 거예요. 그런데 동적 계획이라는 DP라는 알고리즘을 이렇게 쓸 생각은 저는 못 했거든요. 그런데 모델이 하자는 대로 따라가 봤더니 제가 검색을 해봤을 때 메쉬에서 이런 걸 하는 거는 좀 드문 편이더라고요. 없진 않았는데 그거를 좀 배우게 되는 게 있었어요.

근데 모델들은 반대했지만 제 직관을 밀어붙인 게 있거든요. 그래서 이거는 제 직관은 이런 식으로 어떤 링들이 있을 때, 이렇게 보이는 이런 것들이 있을 때, 이거를 위상 동형까지는 아니지만 얘네들이 어떤 링 비슷하게 펼칠 수 있고, 그거를 구면에 투영을 하면 이렇게 돼서 이 나머지 부분들을 연결하는 방식으로 컨벡스 헐을 구현할 수 있지 않을까, 이걸로 하면 되겠다라는 아이디어를 얻었다.

37:50 노정석 그러면 이 아이디어는 “따알”에서 “깍”으로 넘어가는 어떤 출구가 되신 건가요?

37:57 최승준 결론적으로 말하면 아직 못 됐습니다만, 큰 힌트가 되긴 했죠. 그리고 이거 자체로 유용한 부산물이 됐어요. 다른 데 또 활용할 수 있겠다. 그런데 이거는 모델들은 반대했지만 제가 어떤 직관을 가지고 이거 될 것 같다라고 밀어붙이면서 했어요. 그런데 그래서 될 거라고 생각해서 아까 이렇게 된 상태에서 이거를 써야지 했는데, 작동을 하는 척하기만 했습니다.

38:19 노정석 좋아지긴 했네요. 조금 육안으로 보면 연결이 되긴 했지만 사실은 풀지 못했고.

가설과 실험을 반복하며 문제를 좁혀가는 과정 📷 가설과 실험을 반복하며 문제를 좁혀가는 과정

38:27 최승준 근데 이것도 GPT-5.4가 한 거긴 한데, 문제가 뭐였냐 하면 제가 문제를 재현했지, 있는 문제를 그대로 가져온 게 아니었어요. 그래서 상황 자체가 다른 그런 케이스들이 꽤 있었습니다. 되는 케이스가 있고 안 되는 케이스가 섞여 있어서, 이걸 제대로 하려면 특정 문제를 만나면 그거를 세이브 포인트 만들어 놓고서는 거기에서 다양한 가설을 세우고 우선 탐색한 다음에, 가설에서 성공하면 괜찮지만 안 되면 백워드로 올라가서 하는 거죠. 이런 거 비슷한 알고리즘이 많죠.

가설-실험-직관의 반복과 세이브포인트 전략 38:36

38:54 노정석 Ralph loop죠. 저 시점에서 될 때까지 해 봐라고 토큰을 무한히 넣으면 언젠가는 되겠죠.

39:03 최승준 근데 저의 관점은 좀 다릅니다. 왜냐하면 스캐폴딩을 어떻게 하느냐에 따라서 좀 달라지는 구간인 게, 이게 왜 그러냐 하면 그래픽스 쪽에서 TDD를 하기가 좀 어렵다는 평이, 제 시절에는 그게 좀 어렵다는 평이었어요. 이게 시각적으로 볼 때는 자명한데, vertex merge check 이런 거로는 통과하지만 품질이 안 좋은 것들이 있을 수 있기 때문에. 요새 모델이 잘하는 거는 결국에는 그 정보를 피드백 루프 안에 넣는 거잖아요. 그게 아주 잘 되지 않은 상태에서는 인간이 보기에는 쉬운 거지만, 알고리즘적이나 아니면 모델이 풀기에는 여전히 어려운 지점들이 있는데, 그 구간에서 Ralph loop를 돌려버리면 토큰을 낭비할 가능성이 큰.

현재는 back and forth의 반복이긴 한데요. 근데 제 사전 확률은 될 거라는 거거든요. 이건 된 일이기 때문에, 제가 지금 좀 우여곡절을 겪고 있긴 하지만 좋은 경로를 찾으면 그게 딸깍 하고서는 될 것 같다. 아까 제가 제목을 그렇게 적어봤잖습니까. 딸깍과 덜컹, 그리고 덜컥. 덜컹은 안 되는 구간, 근데 그러다가 덜컥 될 수 있다는 거. 근데 그거가 약간 믿음의 문제이기는 한데, AI와 내가 하다 보면 그게 될 것 같다라는 그 느낌이 어떻게 있는지는 잘 모르겠어요. 근데 그 느낌을 가지면 밀어붙이면 될 것 같긴 하거든요.

문제를 정의하는 능력의 시대 40:24

40:27 노정석 근데 방금 승준님이 말씀해 주신 구간에 저희가 항상 하던 얘기들이 다 들어있어요. 처음에 뭘 해야 되겠다라고 하는 문제의 정의. 그리고 어떤 문제가 어떤 난제에 부딪혔을 때, 거기에 사람의 인사이트를 가져와서 human in the loop로 해가지고, 소위 90%가 아닌 10%의 승준님만의 필드 날리지, 암묵지가 투입되는 거고. 그리고 이걸 될 때까지 의지를 가지고 밀어붙이면 언젠가는 될 거고, 그러면 사실은 그게 또 진보가 일어나는 거잖아요.

안타까운 점은 최승준 님이 저걸 했다라는 소식을 밖에 포스팅하면 누군가도.

41:03 최승준 저도 이거 남이 한 거를 보고선 되겠거니 하고서 하는 거긴 합니다만, 쉽게 복제되는 건 당연한 거죠. 왜냐하면 된다는 거니까. 그리고 사람의 힘만으로 된 게 아니잖아요. AI의 힘으로 된 거고, 그거는 거의 공평하게 주어져 있는. 물론 비용이 들긴 합니다만, 어쨌든 그거는 어느 정도는 접근 가능성이 예전에 비해서 훨씬 높아진 상황인 거죠.

41:23 노정석 저희가 정규님 이후에 사실은 성현님, 그리고 오늘까지 하면 어떻게 보면 저희의 어떤 답답함과 이렇게 막혀 있는 구간, 덜컹 구간에 대한 이야기들이 계속 이어지고 있는 것 같은 느낌이 듭니다. 저희가 모두 딸깍딸깍 하는 그런 구간을 넘어온 것 같아요. 그거는 이건 되는 거니까 안 해라는 걸로 어떤 머릿속에 생각들이 좀 세팅돼 있는 것 같고. 저희가 지금 승준님도 그렇고 사실은 저도 그렇고, 딸깍 해서 되는 구간으로 막대한 이익을 얻을 수 있지만, 나의 무언가와 결합해서 온전히 다른 부가가치를 낼 수 있는 그러한 문제를 정의하는 데 상당히 많은 관심들이 가 있는 거라고 저는 보이거든요. 그래서 결국은 problem인 것 같아요. Problem. 그래서 문제를 잘 포착하고, 그다음 문제를 잘 돌려볼 수 있고, 그리고 그 문제 해결 과정을 잘 가이드할 수 있는 그런 능력을 가진 사람. 그런 게 사람이 가져야 되는 덕목인 것 같다라는 것 같아요.

토큰이 끊기면 인간이 된다: 의존과 브라운아웃 42:11

42:32 노정석 어제 또 제 옆에서 어떤 frontier knowledge를 주시는 어떤 엔지니어분이 그 얘기하셨던 게 기억이 나요. weekly 토큰을 자기가 갖고 있는 그 구독에서 다 써버려 가지고, 그게 딱 끝나는 순간 자기는 한낱 미물 인간으로 돌아온다고. 그럼 할 일이 없기 때문에, 할 수 있는 일이 하나도 없기 때문에 잠을 자는 것만이 내가 할 수 있는 일이다라는 얘기를 하시더라고요. 근데 그게 또 묘하게 울림이 있더라고요.

저희도 지금 모든 일들이 다 GPT와 Claude 옆에 끼고 있잖아요. 솔직히 그게 없으면 이젠 하루의 대부분의 업무가 걔와 같이 하는 거로 돼 있거든요. 그게 없으면 Andrej Karpathy가 얘기했던 것처럼 이게 사회 전체가 브라운아웃이 되는 거죠. 약간 전기가 떨어진 듯한.

마무리: AI 시대에 강화해야 할 인간의 덕목 43:21

43:21 최승준 하여튼 이런 일주일을 보냈고, 정석님은 또 그런 파고드는 경험을 하셨고, 저도 나름의 방식으로 좀 파고들면서. 중요한 건 아까 정석님이 말씀하신 것 같은데, 그럼에도 불구하고 좀 이런 거를 AI에게 위임을 하면서 오히려 획득해야 되는 거나 강화해야 되는 요소들이 있는 것 같긴 해요. 예를 들면 끈기라든가, 가설을 세워보거나, 약간 쉬는 것도 좋은 일이죠. 왜냐하면 머리가 맑아야지 좋은 가설들을 떠올릴 수 있는 거. 그래서 그런 것들에 대해서도 좀 생각해 보는, 또 탐색하는 건 또 재미있기도 하고. 뭔가 이렇게 문제를 푸는 것 자체는 또 재미있는 느낌이 있습니다. 일단 여기까지 준비를 해봤습니다.

43:59 노정석 네, 오늘 또 즐거운 내용들이었습니다.