EP 89: ワンクリックとガタガタ

イントロ: GPT-5.4のリリースとワンクリックの時代 00:00

00:05 ロ・ジョンソク 今週、私たちが待っていたGPT-5.4が出まして。Claudeも新機能が発表されて、あちこちでカチカチと「これ作った、これ作った」という証言のような投稿を見ています。今日はGPT-5.4とそのカチッ、そしてその数多くのカチッの裏にある実体、私たちはそれをスンジュンさんがガクンと表現してくれたのですが、そういう部分について見ていこうと思います。

AIフロンティアサイト紹介 00:31

AI Frontier 팟캐스트 블로그 aifrontier.kr

00:31 ロ・ジョンソク でも今日メインの内容を始める前に、私たちにはAIフロンティアというサイトがあるんです。私たちの編集者であるユジンさんが作ってくれたサイトなのですが。ユジンさん、どんなものか少し紹介していただけますか。私たちのAIフロンティア、私も

00:48 キム・ユジン 熱心な視聴者から始まって編集者をするように自ら志願することになったのですが。いつも残念だった点は、YouTubeそのものが閉鎖的なので、

00:59 ClaudeやChatGPTのような場合は字幕を丁寧に全部構成しておいてもエージェントたちがそれを読めないという問題がありました。

01:09 それでClaudeと一生懸命カチカチして作ったのがこのAIフロンティアです。投稿全体を丸ごとダウンロードしたり

01:19 できるように機能を全部提供していますし、私たちはチャプターごとにもリンクを分けたり特定のチャプターだけコピーできるように機能を作ってある状況です。

01:29 私たちのYouTube動画の説明ページなどにリンクが出ています。その回のリンクが出ていますので、ChatGPTに質問を投げる形で活用してみていただけると思います。

01:42 チェ・スンジュン ユジンさんがこれをカチカチして作ったとは言いましたが、それでも手をかけて作ってくださって、私もコピーして貼り付けてChatGPTなどとやり取りするのが助けになることがかなり多いんですよ。ぜひ多くの方に活用してみてほしいです。

GPT-5.4の主要機能とデモ 01:57

OpenAI - GPT-5.4를 소개합니다 openai.com

Computer Use & Frontend UI with GPT-5.4 Thinking youtube.com

OpenAI Showcase developers.openai.com

OpenAIが同時に発表した3つの製品の紹介カード。左から順に『GPT-5.4 Thinking』『Introducing ChatGPT for Excel』『GPT-5.3 Instant』のタイトルが表示された発表画像

01:57 チェ・スンジュン それでGPT-5.4が出ましたね。詳しくは見られていませんが、いくつかリンクを抜き出しておいたところ、この2つの動画が面白くて、この動画の1つはComputer Useエージェントのほうで、最近OpenAIでGPT-5.4が出てからは、何を作った何を作ったというものが共有されているものはだいたいこれ関連なんです。何かのゲームや3Dシーンのようなものをうまく作るときにフィードバックループが形成されること、それから対話している途中で方向を変える、それで後続の質問ができるようになる、CoTの中で後続の質問ができる機能が良かったです。

02:38 それから良いデモはショーケース公式サイトにあって、ショーケースに入るとかなりよくできています。よく話題になるRPGゲームとか、SimCityっぽいもの、そういうものを作った例も含めて出ていました。SimCityはたぶんこの左側にありますが、いろいろありますね。とにかく5.4が追求していたさまざまなプロジェクトがこちらで共有されているので、参考になると思います。品質が本当にかなり良く出ている気がしました。

OpenAIの現在地と競争構図 03:01

03:04 ロ・ジョンソク 私たちが先週ソンヒョンさんと話しながら、RL環境のスケーリングが非常に重要な要素になりそうだ、そしてフロンティアラボがそこでかなり先を行っているようで、大きな進歩を成し遂げそうだとお話ししましたが、Computer UseのあちらではCUAと名前を付けて呼んでいたのですが、Computer Useエージェントのような場合もその下の環境での学習を本当にうまくやり切ったんです。あれをpretrainで学んだはずはなく、その環境でどんなときにどんなアクションをすべきかについて非常に多くの試行錯誤を経ながらRLを回して高い品質を出せるようになったのだと思います。

03:42 チェ・スンジュン そうですね。最近OpenAIはいろいろ浮き沈みがあって、いろいろな開発状況だけでなく置かれている状況にもやや波があって、ユーザーがClaudeへかなり流れていったりもして、そういうことですが、またどんな影響があるのか分かりませんね。タイムラインで報告される品質を見ると、

03:59 ロ・ジョンソク 今は5.4がこれまで出たモデルの中では最強だという共感はありますね。実生活で使う業務は標準的な人間よりはるかに上手くできるという点は、あまりにも自然に受け入れなければならない瞬間が来ました。OpenAIの主張ではありますが、

あふれ出す新機能とワンクリック生産性 04:15

04:18 チェ・スンジュン GWSというものもGoogleから出ていました。私もまだ使えていませんが、Google WorkspaceでCLIが動くようにしたバージョンがあります。これも少し話題になっているようで、GPT-5.4以外にも

04:32 この方もClaude Codeを開発している方です。Scheduleも、Taskも、そしてVoiceもありましたし、ずっとshipping shipping shippingとなっているのが見て取れます。今はものすごい速度で機能を追い切れないほどリリースしている最近のようで、それができるのはAIたちが一生懸命作っているからでしょう。始めろということと、どんな結果を出すべきかだけ与えれば、

04:57 ロ・ジョンソク その結果を出すために必要なほとんどすべての知識をモデルが持っているので、まさに本当にクリック一発で進む感じです。多くの部分で。週単位のリリースでもなく日単位のリリースをしている感じで、

05:09 チェ・スンジュン Claude Codeのほうもそれで少し落ち着かないですね。その次に最近の雰囲気の中で、

Three.jsとRicardo CabelloによるQuake移植 05:12

mrdoob - 'Claude로 Quake를 Three.js로 포팅할 수 있을까?' x.com

Three.js Quake mrdoob.github.io

05:14 チェ・スンジュン Three.jsを最近AIたちが多く使っているので使用量がぐっと上がったんです。

05:21 でもThree.jsを作ったRicardo Cabelloという、スペインの方でMr.doobという名前で普通呼ばれている開発者の方がClaudeと一緒に、今では古典ゲームになりましたが、QuakeやDescentのようなものを移植したんです。ソースが公開されているので、それを移植してアセットのようなものを付けて、

05:42 ライブで動くQuakeのようなものをほぼ動作するレベルまで移植されていました。

05:50 Descentもあって、3Dゲームを移植した例を見ることができます。でもあれで重要なのは、

05:55 ロ・ジョンソク かなり短時間で終わったということが重要なんです。ここでGitHubを見ると履歴が出ているのですが。

06:01 チェ・スンジュン これはGitHubだけでなく、投稿の始まり自体が面白いんです。「オーケー Claude、QuakeをThree.jsに移植できる？」そして1時間後にはこうなっているんですよね。もちろん1時間よりはもっとかかったもののGitHubの痕跡が出ていて、いろいろ調整する過程はありますが、どんな場面なのかを見ることができるわけです。

Andrej Karpathyの学習速度実験と自己改善ループ 06:21

Andrej Karpathy - nanochat 자기개선 루프 x.com

06:21 チェ・スンジュン Andrej Karpathyの数日前の投稿が、これは興味深かったです。GPT-2を数か月前には3時間程度でしたが、今では2時間で学習させられる。8個のH100ポッドを使って

06:34 ロ・ジョンソク 2時間以内にGPT-2レベルは終わるんですね。でもここで想像力が面白いんですが、

06:41 チェ・スンジュン interactive, closer to interactiveなのでほぼすぐその場で学習される方向に想像力を働かせる部分があったんですが、

06:50 これはnanochatをAIエージェントたちが自動で反復改善するように作っておいてpost-AGIの気分を楽しもうとするという冗談のようなことを言ったものがあります。12時間の間に110回の変更が行われ、それでlossがどれだけ下がるか、そういう話をしていたので最近のまた一つの空気感でもある気がします。自己改善ループということです。

07:09 ロ・ジョンソク 動かしておいて眺めていた、ということですね。

Mitchell Hashimotoとハーネスエンジニアリング 07:11

07:11 チェ・スンジュン それからMitchell Hashimotoは最近多くの方がよく使っているGhosttyを作った方で、この方はHashiCorpの創業者だったじゃないですか。今はそれをおそらく売却してコーディング職人として活動しながら面白くて、しかも速くて美しいターミナルを作っていて、AIをたくさん使う方々の多くがGhosttyを使っていると理解していますが、その方もGPT-5.4が出る明け方だったか、GPT-5.4が出る直前あたりにした投稿でCodex 5.3が自分が6か月間struggling、苦労して抱えていた問題を解いた。それに関する投稿もまたありました。それで最近の空気の断面を比較的若い世代の方々の断面として少し見ました。

07:59 でも私がMitchell Hashimotoにまた言及したのはハーネスエンジニアリングという用語の出典がこの方のブログだったからなんです。それで「私のAI導入の旅」という文章が私は2月に読んだものの中で最も良い文章の一つだったんですが、これは6つほどのチャプターで構成されているんです。チャットボットを捨てろから、ハーネスを設計しろ、常にエージェントを回せ、確実で簡単な仕事は外注しろ、そういうふうになっているんですがstep 5がハーネスを設計しろでした。それでここでハーネスエンジニアリングという用語を私たちでも一度考えてみたんですが、エージェントがミスをするのを見つけるたびに時間をかけてそのミスを二度としないようにする解決策を設計する。エンジニアリングするという概念でハーネスエンジニアリングとして大きく二つのことを話していて、一つはプロンプティングと実際のプログラミングツールを通じてエージェントが悪さをするのを見るたびに二度とその行為ができないようにする方向で努力していて、エージェントが良いことをしているかを自分で検証できるようにするためにある種のハーネスを提供している、という話をしています。とても良い文章で、内容もこのほかにもいろいろあるので

09:11 一度読んでみることをおすすめします。

09:13 ロ・ジョンソク 後でスンジュンさんがハーネスとスキャフォールディングの話をしながら話してくださると思いますが、実はハーネスという表現がかなり多く使われているじゃないですか。それでハーネスをある方はClaude CodeやCodexのようにモデルの横に付いて動く何らかのプログラムのかたまりを私たちが総称してほぼハーネスと呼んでいるんですが、Mitchell Hashimotoが言ったハーネスはそれ以上にフロントの部分まで全部こういう概念として受け取っているように見えますね。でも拡張する道具ではあるものの

Alloy Analyzer wiki.g15e.com

강규영 - Alloy 기반 실행 가능한 명세서 x.com

『MY AI ADOPTION JOURNEY』というタイトルと、木の枝のように広がるネットワークグラフィックが描かれたMitchell Hashimotoのブログ表紙画像

09:43 チェ・スンジュン 同時に馬の鞍や馬具のようにきっちり締めるそういう感じのニュアンスが強い気がします。ハーネスというのは。だからそうした検証して締める道具の参考事例として最近コルカでCTOをされているカン・ギュヨンさんが昨年からAlloyという言語の話をしていたんです。それでAlloyはとてもdomain specificな言語を用いて形式を作って正確に検証できるような体系なんです。それを使って最近ちょうど昨日だったか、ツイートしてくださったのがこうしてAlloyを活用してend-to-endテストと自然言語の説明が付いた実行可能な仕様書、それでworkingのある種のテスト、integrated testのアイデアから着想を得てこうしてモデルがある正確な仕事をできるようにするそういう検証ツールで、lint以上のもののようです。そうしたツールを作ってハーネスエンジニアリングをされている感じが。それで最近私がもう少し考えてみたいポイントは

ハーネスの意味: 検証と制御のための道具 09:50

10:44 チェ・スンジュン カチッといける仕事といけない仕事をどう感覚できるのか。それで普通はこうして小さなstepにしてうまくいく仕事があり、その方法でもうまくいかない仕事があるという感じを少し受けているんです。それであらゆる解くべき問題が正確にテストを作って検証する方法で本当に全部できるのか。かなりの部分はできるでしょうが、できないことがあるとしたらどんなことなのか、そういうことについて少し考えるようになりました。そしてそれをどう判断できるのか、どう感覚できるのかについてのちょっとした問いのようなものが生まれている状況です。でも最近、国内の開発者の方々の、

韓国のシニア開発者たちのAIコーディング事例 11:19

김민태 - 시니어 개발자가 AI와 6개월간 25만 라인의 시스템을 만들며 발견한 것들 medium.com

11:24 チェ・スンジュン シニア級のエンジニア開発者の方々のトレンドを見てもちょうどご出演いただいたジョンギュさんが40日間で100万行のコードベースを一人で作業したとおっしゃっていましたよね。それでそれを私たちが2、3週間前に少し話したんですが、とてつもないことだと思います。ところがまた今週、キム・ミンテさんという以前KTHでこういう面白い方々、できる方々がたくさん集まっていた時にもメンバーだった気がしますし、NCやWoowa Brothersなどを経てずっと長い間働いていらっしゃるミンテさん、シニア開発者がAIと6か月間で25万行のシステムを作りながら「発見したことたち」というブログを紹介してくれました。でもその文章にもかなり興味深い部分があったように思います。そして少し前に申し上げたギュヨンさんも興味深いものを作っていらっしゃるのですが、それが3週間で4万LOCほどをAIだけで作業しながらこの程度の規模のコードベースは一人が単独でAIエージェントたちとマネジングするパターンが見つかりつつあるようです。ジョンソクさんもかなり頻繁にご覧になっているんですよね。

12:34 あ、でもここでまた整理の話が出ますね。誰かがすでに成功した、そしてそういうことが大きなヒントになる気がします。では、ある人物が何かをカチッと作った。でもその人物の力量も重要ですが、実はそれが可能だったのはモデルとハーネスの影響があるから可能だったのだと思います。すると「自分も」、つまり成功ケースは「自分も、自分も」になります。ある人物が何かを作ったということ自体が非常に大きなヒントだということです。それができたという結果だけがあってその成果物についてコードベースがあれば

誰かがすでに成功しているなら、できるはずだ 12:36

13:06 ロ・ジョンソク 実際には設計書を入手したのと同じですし、最後に動くuseだけ見てもそれをモデルに入れればモデルがそれをdecomposeして計画を立ててくれてどう作ればよいか分かるわけです。

13:18 チェ・スンジュン すごく具体的なヒントになるわけですし、それどころか誰が何をしたらしいというだけでも大きなヒントなんです。それを私がどこで感じたかというとLablupでCTOさんがHWP、HWPXでペアリングでメタ言語を作ってHWPバイナリを作ることに成功したとジョンギュさんがヒントをくださったじゃないですか。ジュンギさんという方がそれをできたということを知っていること自体が大きなヒントだということです。その方がどんな力量を持っている方かおおよそ分かって、その次に何をやり遂げたかが分かれば、どうやったのかをモデルと話し合ってみられる状況なのでそれが正解ではないとしても推理してみるのに役立つので、おそらくそういう形でこれはどうやったのかああやったのか、といったことを何と言えばいいでしょうか。リバースエンジニアリングするケースがすでにかなり多くある状況だと思います。それでそういうことについても少し考えてみましたし、

14:11 そしてこれ自体がペアリングに対するメタについてもう少し考えてみる機会にもなったのですが。ここを見てもAというものとBというものにペアリングがあり、それをどうできるかについて考えてみることが人と成功とのペアリングとも似ているのですが、こういう場合にペアリングをしたときこれが成功したのが部分的な成功だとすると実際にはこれが変換されることへのカバレッジを広げながらもう少し完全なものへ近づけることができるのでそういうこともまた何かのアイデアになる気がします。その次に、これは私が9月に一度、昨年9月にご紹介したことですが

14:53 この複利を回せる時間が長くないケースがかなりありそうだという考えがもう一度再想起されました。それでこの部分での暫定的な私の感覚は誰かがすでに成功したことなら、できることだ、誰かがすでに成功したことなら、すでにできたことなのでできる可能性が非常に高いことのようだという所感が少しありました。ただ、こういうことは少し難しいかもしれません。

15:17 なぜなら、熟練者たちがやることは少し難易度が高そうでしたし、Donald Knuthという、あの『The Art of Computer Programming』という生涯の著作を書いていらっしゃる方が2026年現在88歳なのですが、これがニュースにも出ましたよね。未解決の組合せ論の問題を解く過程を論文として公開しHacker Newsでも数日前に取り上げられましたが、これは無理だろうとAIを使わない側だったのに、できるのを見て超一流がそれをやり遂げる、そういう話も見ていけます。

Donald Knuth: 88歳の老練者によるAI活用 15:20

15:50 ロ・ジョンソク ご本人が難題として抱えていた問題ですがAIの助けを得て解いたわけですね。ある方がTwitterで見たのですがこのDonald Knuthの問題をそのまま持っていってGPT-5.4 Thinkingに入れたところ正解まで全部解いたそうです。検索せずに解けと言ったら。はい。

16:08 チェ・スンジュン それでその組合せ論のほうの問題が今かなり多く解かれている気がします。そんな感じではあります。それでちょうどDonald Knuthがまだ執筆中の本がたぶん今4Bまで出たのかな、組合せ論に関するcombinatorial algorithmsに関する執筆をしている途中でそういう方面の助けを受けたようです。それでとにかく88歳の老大家もAIを通じてさらに前に進んでいるところです。

16:35 ロ・ジョンソク 絶えず進歩しているわけですね。

16:38 チェ・スンジュン Donald Knuthについて少し気になる方は参考にできる若い頃のDonald Knuthがパンチカード時代にやっていたElectronic Coachという面白い映像が一つあってそれからこの方は文章を書こうと、本を書こうとしたのですが組版システムがなくてTeXを作ったではないですか。それでそれが結局LaTeXになって論文のシステムになったのですが、それを作った張本人なんです。なのでそういう話が気になるなら少し見てみてもよいと思います。literate programmingという概念のようなものをかなり早い時期におっしゃっていた方なんです。そして私も本当に驚いたのですが

Guido van Rossum、Kent BeckのAI転向 17:10

17:11 チェ・スンジュン 年齢を調べていたらPythonを作ったGuido van Rossumが今年70歳だそうです。

17:16 ロ・ジョンソク Andrej Karpathyと30歳差ですね。

Kent Beck - '90%의 스킬은 가치 하락, 남은 10%는 1000배 상승' x.com

Kent Beck（@KentBeck）の2023年4月19日のツイート: 『The value of 90% of my skills just dropped to $0. The leverage for the remaining 10% went up 1000x. I need to recalibrate.』 — 140万ビュー

17:19 チェ・スンジュン Guido van Rossumも最近はAIを使う方向に転じていてClaudeを使って何かをしたみたいなことをタイムラインで見ることができますし何度かご紹介したKent Beck、Extreme Programmingとかソフトウェアデザインパターンの方面で有名で、またAgile Manifestoにも参加したWard Cunninghamともとても親しい方ですよね。それでその方が64歳なのですがgenieと呼んでいたAIを使って何かをすることについてライブコーディングするのをgenie sessionとして上げていてでも2023年にはこう話していたんです。reluctantだから、気持ちとしてはしっくりこないけれど無理やりやるという感じでChatGPTをちょっと使ってみたら自分のskillの90%が消えてしまうんだと2023年に上げていたのですがうまく使う方向にして、今はとても楽しいそうです。コーディングするのが楽しいと言っていて最近、ある発表をまた講演する予定にしていてどうやってgenieがプログラマーがやるべき仕事とやってはいけない仕事を変えたのか、というタイトル。

18:27 ロ・ジョンソク この下に書いてくださった23年4月に書かれた文章もかなり本質的ですね。自分が持っている90%のskillは価値が下がったけれどその次にremaining、残っている10%の価値は1000倍になった。単にコーディングする技術ではなく別の何か、最近はこれをドメイン暗黙知と要約して呼んでいましたが、この部分の価値ははるかに上がった、という話をしていたんですね。

Anthropicレポートの表紙。『支援がコーディングスキル形成に与える影響、2026年1月29日』というタイトルと、手がスライダーを操作するイラスト

18:54 チェ・スンジュン 僕たちがポッドキャストを始めた頃がそういう時代でしたがもうずいぶん時間が過ぎました。なので2026年の現在、まだ通用する考え方としてハーネスでできることとスキャフォールディングでできることがあると少し考えるようになりました。スキャフォールディングは補助の階段を与えることですよね。ハーネスはさっきの締めるほうでスキャフォールディングは教育学のほうでもよく使われる用語ですが足場かけのようなもので、後で取り払うものではあるけれど学習者が自力で登っていけるように助けるある種の状況や環境のようなものを設定することを指したりもするんです。

ハーネスとスキャフォールディング: 委任とスキル形成のジレンマ 19:04

19:30 チェ・スンジュン GPT-5とスキャフォールディングという、そのある部分はトランスクリプトを翻訳したものですが普通に聞いただけでは絶対にできない。何か問題があるときにGPT-5にそのまま投げると答えが出ない。難しすぎる。だからGPT-5の周辺にスキャフォールディングを構築したのです。ここでのスキャフォールディングにはいろいろありますがあるエージェントはアイデアを提案するエージェント、実行するエージェント、検証するエージェント、異なる結果を統合するエージェントなどを与えつつそれを、開かれた問題をいきなり最初から投げるのではなくウォームアップさせて、自分が知っていた解法を、知っている問題を解かせたうえでその解法を実際にもっと挑戦的な問題を解くべきコンテキストに入れてから一般化した問題に挑ませてみろと言ったところその過程で出てきたCoTだとか成果物に驚くべきものが出てきた、という部分。なのでこの後半の内容も面白いのですが。それをどうassetとして使うのか、そしてそれを洞察を自動で

20:34 見つけ出す方法を作ってみる、さらに一段先へ進むにはどうすればよいのか。誰も投げたことのない質問をこのプロセスを通じてどう投げられるようにするのかについての興味深い話が出てくるのですがこういう文脈は少しスキャフォールディングに関係する、締めて小さな単位を確認させることでできる仕事がありさらに興味深い仮説を立てながら挑戦させて進める仕事もありそれが共存する状況のようなんです。そういう状況になったときそれでも共通しているのは委任ですが

21:04 私のAI導入の旅で重要な点は自分は別の仕事をするというやり方が広く知られたAnthropicのskill形成論文をある程度相殺すると考えている、ということです。Anthropicのskill形成論文とは何かというとエージェントに委任した作業については人間のskillは形成されない代わりに自分が継続して手動で行う作業では自然にskillが形成され続ける。だからスキャフォールディングであれハーネスであれ自分はそれを委任を通じてAIを使うことになるのですが委任しつつ失わないためには、退化しないためにはあるいは別の能力を育てるにはどうすればいいのか。Kent Beckのように自分の残った10%がやはり1000倍になると考える人たちもいるかもしれませんがふつうの人たちは委任していると失ってしまうことがあります。そこが少し悩ましい部分です。

21:50 ロ・ジョンソク こういう話は、僕たちがAIやエージェントの活用やこういうものが出てくる前から、いつも自己啓発本にありきたりに載っていた内容だったんですよ。どうすればどんな仕事が自分を価値あるものにしどんな仕事は一生懸命やらずに委任するべきか、あるいはやるべきではないかこういう話はかなりありましたから。僕たちはソフトウェアエンジニアリングというもの自体に僕たちも多くの部分で没入しているんですよ。なぜなら出自がそうだからです。そしてソフトウェアエンジニアリングというのはどう見てもここ20〜30年ほどの間黄金期を謳歌してきたじゃないですか。コロナのときは6週間のブートキャンプだけでも会社で15万ドル、20万ドルそういう年俸をもらって就職できてそんな時代がちょうど終わったじゃないですか。そうなると、いわゆる大騒ぎを僕たちがしているわけです。でもいつだって何かの需給が変われば市場のダイナミクスは全部変わっていくじゃないですか。でもそれは、僕たちがどう見てもラッダイト運動の当事者だからこそその部分について過剰に大騒ぎしているのではないか、という考えを僕も今ではするようになって、

ソフトウェアエンジニアリングの底上げとドメイン拡張 22:12

23:03 ロ・ジョンソク どう見ても、このClaude Codeがこれをやった、Codexがこれをやった、というのもこの2、3か月の間、僕たちは毎日がすごく不思議でこういうことをやってみながらドーパミンが出る時期でしたがいつの間にかこれが日常になって、自分だけができることでもなくみんなができる世界になってではどうすべきかという悩みにすべて押し流された気がします。そこから何をどうするのか、さっきKent Beckが、それなら自分は残っている10%をどうやって1000倍の価値にするかrecalibrateしないといけない、という表現をしていましたがみんながrecalibrateしなければならないそういうタイミングが来るのであって、そしてソフトウェアエンジニアリングという

23:44 それなりに、それでも知識労働の中では最先端にある部分がモデルにすっかりさらわれてしまったのだからこの次は、僕たちがいまだに物理学の論文だとか生物学の論文だとか化学の論文、あるいは弁護士たちが書いた法典文書のようなものを見ると実感が湧かないんですよ。そしてそれは、その中での何らかのskillがなければアクセスできなかったのに、モデルの助けを借りてそのドメインに行くことがまったくおかしくないそういう世界になったんです。だから何かを学習して問題を定義し、新しい観点で見られる、そういう立場にいる人たちはこのドメインがものすごく広がっているわけです。もしそういう道具がなかったら、私も今週は仕事が本当にものすごく多い週だったんですが、こういう週ほど妙に変な本を読むようになって難しい論文を読むようになって、それで生命工学に関する論文を何本か見たんですが昔だったら、私にはいったい何のことか一文たりとも分からなかったようなものをじっくり読んでいけて、全部教えてくれて、その含意まで説明してくれて、しかもGPT-5.4に入れるとこの論文が今後生み出すものはこれになるはずです。私にも証拠はないけれど、ほぼ90%の確率でこうなると思います、と言うんですがその内容を聞いていると今ならノーベル賞を狙うようなそんな生命工学者がするべきだった話をこいつが、さっきスンジュンさんがおっしゃったように誰かがこれをやったという知らせを聞くと自分にもできる、となるような、そういう世界になってしまったのでまた別のドメインへと探検の境界がずっと広がっていくんじゃないかという、そんな気がします。面白い時期です。それで、いずれにせよ私の話を要約すると、

25:29 もうこれからは私たちもClaude CodeとCodexとこのハーネスがどんなことができて、どんな限界があってみたいな話は、もうたたむ時期が来ている気がします。これはもう当たり前にできるゲームなんです。カプセル化されて下のレイヤーにそのまま降りていくでしょうし私たちは次のレベルに上がってそこでのゲームをまた考えなければならないので、正直、スンジュンさんと私で今年を始めるときにこのハーネス論争はもうすぐ終わるだろうしモデルはもうすぐAGIに到達するだろうから、この次のレイヤーでは次のドメインであるサイエンスや、そういう方向に私たちももう少し行ってみようという話をした記憶があります。でもあまりにもニュースが多くて私たちがAIサイエンス、それからAlphaGenomeだとかバイオロジーがコンピュテーションやAIと結びついてやる部分、化学が結びついてやる部分、こういう部分の話をあまりしてこなかったんですがそういう方向に私たちも少しギアを変えなければならないのではないかと思っています。でも今のお話を聞いていて

26:28 チェ・スンジュン 私も一つ聞き返したくなる部分があって、ジョンソクさんもコーディングのようなことは確実にもうやっていない可能性が高いと思うんですがそれでもさっきの生命工学について見てみたり何か自分自身を次へ導く情報を吸収することはむしろうまくできるようになっている、ということですよね。そういう力量のほうが、むしろ発揮されているんだと。そうですね。結局、学習する者であって、

26:54 ロ・ジョンソク 私たちも以前、自己啓発書で結局は絶えず学習して自分自身を変身させることが重要だ、という話をしていましたが過去には、ある学習を通じて知的なskillとして一つのskillを頭の中に身につければそれが労働の価値として使える、そういう時期だったじゃないですか。でもそれがまさに終わりつつあるじゃないですか。Pythonが得意な人、フロントエンドが得意な人、DBが得意な人、何かが得意な人、実際、彼らは問題そのものについては気にする必要がなくて、誰かが問題を定義して持ってくればそれをうまく施工する施工者のような存在になっていたわけですがこれは1800年代半ばに織機をうまく扱っていたあの布を織る人と何も変わらないんです。でもその人たちはそれでも20年、30年、一世代くらいかけてこれがなくなったのに私たちは今ほとんど6か月じゃないですか。Claude Codeが去年の3月に出たんです。

27:45 スンジュンさん、そして私たちがClaude Codeを初めて使ったのが5月だったか、そんな感じで、やっと1年なんですがたった1年でOpusが世代更新することとGPTが世代更新することとそれと一緒にこうして作られたハーネスたちが1年でこれを全部終わらせてしまったんです。まだ使っていない人は多いです。これを使わない人のほうが、私は使う人よりまだずっと多いと思っているんです。ソフトウェアエンジニアの中でもこれを使い始めた人たちもこうして時間差があるわけですが結局この問題はどこに帰結するかというと、結局は上方平準化されるんです。いちばん上手い人がすべての仕事をやるような形になって全部上方平準化されるんです。産業化も繊維事業もそうでしたし

28:26 鉄道事業もそうでしたし自動車事業もそうでしたし時計事業もそうでしたし、いつもこうして高度成長期が生まれるように見えるけれど終わってみると、いつも3つか4つの会社が全部持っていくんです。ひょっとするとソフトウェアエンジニアリングというこの領域も、私たちも絶えずああ、でも逃げ込めるドメインがあるはずだ、何かあるはずだと言ってきましたがあの強力なgeneralityを持ったモデルが押し寄せてきて私たちがspecificだと思っていた、そういう領域までも一つずつ全部steamrollしていくのを見ているじゃないですか。Donald Knuthのように、自分はアルゴリズムに完全特化しているんだという人も、もうやることがないじゃないですか。GPT-5.4が何か問題を与えればもっと上手く解くはずですから。

29:09 だからこういう時期に、私たちが何か価値観のレンズをもう少しギアシフトしなければならないとは思います。もちろん、このタイムギャップによって生じる部分にも依然としてビジネスチャンスがあるかもしれませんがうわ、このタイムギャップを何とか見抜いてexploitするには、圧縮があまりにも激しすぎます。圧縮があまりにも激しすぎて、結局は相対性なんです。より相対的に難しく、希少だからこそ特定の専門家たちだけが行っている、そういうドメインが依然として非常にたくさんあります。

29:41 そしてそのドメインはものすごく大きくて、そこがコーディングのように一度荒らしに行かなければならないし、荒らされるんだな、そんなことを考えながら、私もスンジュンさんも物理やそういう方面に関心をお持ちのように私も化学や生命工学、そういうものを見ています。

29:57 チェ・スンジュン とにかく、でもジョンソクさんのお話をちょっと一度要約してみると、発想そのものをちょっと変えるというか、むしろ発想というよりは視線そのものを少し別のところに向けるべきだということです。別のドメインとこういう方向でやると

30:11 ロ・ジョンソク 私たちがこれまでタップできていなかった領域もやることが本当に多いです。コーディングやこうしたAI分野の発展は

30:18 チェ・スンジュン その傾きを定数として見ないといけないということです。ずっと伸び続けることです。

30:22 ロ・ジョンソク 昨日ジョンギュさんがその話をしていませんでしたか。あのグループチャットで。できそうなことはやるな。なぜなら価値がない仕事だから。

30:30 チェ・スンジュン それについて、さっき私も考えていたポイントができることとできないことと少し努力すればできそうなことに対する勘が必要なんですよ。それで私は3月第1週にジョンソクさんはそういう方面を少し勉強されていて私もそれなりに勉強したんですが私は今でもウェブで対話するにはウェブのほうがずっと楽なのでウェブでたくさん対話してCoTをまた見るのが好きでもあるのでどうしてもこちらをやることになったんですが、3月1日ごろからだったのでおとといまで対話したのが60件ほどです。

3Dメッシュアルゴリズム挑戦記: 論文からワンクリック実験へ 30:38

31:03 ロ・ジョンソク 全部3Dとかそういう方面ですね。1つの問題を解くための対話です。それでその対話ごとにもコードが

31:11 チェ・スンジュン だいたい1000行くらいあることが多くて、こうして何ターンもあるので、何ターンか抜いたとしても最低でも6万行くらいのコードが入った対話の分量なんです。それで何の問題を解こうとしていたかというと私が2020年にそのソーシャルメディアに上げた投稿なんですがああ、こういうのを自分で開発してみたい。それでB-Meshというよく知られたアルゴリズムがあるんです。それがBlenderという3Dツールでも、ZBrushというところでも似たようなものがかなり早い段階から使われていてモデルをなめらかに作ってくれる、そういうものなんです。でも私がそれをAIコーディングがなかった時代に人間の知能で似たようなものを実装しようとしましたがそれを実装できず、派生したものを実装したことがあってこれは子どもたちが描いた絵を入れるとこうしてスキニングされたものを作って、こういうのを作っておいたんです。

32:00 ロ・ジョンソク これはスンジュンさんの21年の作品なんですね。

32:02 チェ・スンジュン こういう、今でもすぐ見られるツールがあるんですがここで例えば私があるPNGファイルをこういう形のPNGファイルなんですがそれをここにドラッグアンドドロップするとこうやって作ってくれるんです。

32:16 ロ・ジョンソク これは3Dですか。3Dですね。そうです。3Dなんですが前後が同じで

32:20 チェ・スンジュン アニメーションにもなっていて、そうやって作ったものです。子どもたちが作ると、私がそれをこういう形で卒業式のときに1人1人が描いたものをこうして作るんです。それに子どもたちが何か声をかけてくれる文章ではありますがそういうことをやったことがありました。でも最近は直接こういうものをコーディングはしませんが

32:41 あのとき挑戦できなかったのは、こうして前後が同じものではなく立体的な構造にしようとしていたんですがそこまでは自力ではちゃんとできませんでした。すでに知られている論文もコードもあるにもかかわらずです。

32:54 なぜならそれが実は線形代数関連のEigenのようなものに依存する場合があるんです。Eigenというライブラリがあるんですが、それが少し扱いづらくてウェブ環境ではやりにくかったんです。でもGPT-5.4が出たので

PoCはできても、カチッと仕上げるのは難しい地点 33:05

Claude Codeの作業結果画面。左側にはbmesh-mvp-preview.objなどのプロジェクトファイル一覧がチェックマーク付きで表示され、右側にはTポーズを取る人体形状の白い3Dメッシュモデルが表示されている

33:05 チェ・スンジュン 「論文 to カチッ」が本当にできるか実験してみました。できはしませんでしたが、だいたい近いところまでは出ました。

33:11 ロ・ジョンソク 今は「カチ」まで行って、まだ「ッ」が出ていないわけですね。

33:15 チェ・スンジュン なのでこれ、「論文 to カチッ」くらいをお見せするとこれは30分くらい、20分くらい作業したものなんですがこうして最初は簡単に始めてから計画を立ててやり取りして、ある構造をつかんでから進めるようにしたんです。それでMVP程度、最小実装くらいでやろうとしたんですが一応は出てきましたが、実はかなり物足りなさがあって「ソース to カチッ」をやってみました。その論文を見て実装してあるGitHubもあるんです。それでそのアーカイブを取ってきてやってみたんですがそれは10分かかりました。ただ、少し品質は低いです。なぜならこれはポーティングなのでずっと難易度の低い問題なんです。ですがこういう区間はできない区間、実装したとはいっても実際には成功していない、カチッにもならないものです。でもそれでもある程度のPoCくらいは見せる力をとても簡単なプロンプトでは出せたんです。でもカチッとできた部分もありました。それでこの前の3月1日だったか2日ごろに私がこれを作っていたんです。

34:17 これは何かというと、ここに今はよく見えませんがゴジラと書くとこれが生成されるんです。それからアニメーションにもなってその次にここにサンタクロースとたぶん次に書いたはずです。サンタクロースと書くと、サンタクロースっぽいやつが生成されて。

34:31 でもこれはさっきのものと似て見えますがそのアイソサーフェスというものを使っていてこれはずっと簡単なアルゴリズムなんです。これは簡単に作れますが、ディテールは少し足りません。指みたいなものを生成したりとか。これは30分くらいでやりました。PoCを整えるのには1日か2日ほどさらにかかりました。その次に、これもPoCは30分くらいでやったものです。もう少しちゃんと進めようとして、最初からモデリングツールのようなもの、人の形があれば伸ばしたり少し縮めたりして別の形にしてみるそういうものをZBrushという3DツールでZSphereという概念を使ってやったものがあるんですがこういうものを作る程度ならGeminiは特に3Dがよくできるのでとても簡単にできたんです。ここまでは簡単でした。

ガタガタ区間: モデルでも解けなかった境界接続問題 35:18

Zsphere v5 HTMLビューアで人体3Dメッシュを表示した画面。『Boundary Edges』と『Gap Edges [*1]』レイヤーが有効になっており、胴体と手足の接続部分に白い境界線がはっきりと見えている

35:18 チェ・スンジュン それで論文ではこれを補間してつなぐのが肝なんです。これを作って、これを目標にするんですがそこからがつまずきでした。それでも一番端のこの継ぎ目さえ除けば復元するのは簡単でした。でもこの部分は人間が見るにはとても簡単な部分なのに数学で考えなければならないことは実はかなり多い部分です。

35:40 ロ・ジョンソク 関節の部位ということですよね。それで、これを一度お見せするとここでさっきとまったく同じなんですが、

35:47 チェ・スンジュン 真ん中をつないだり切ったりするとこうなるんですが、バウンダリーエッジのようなものがこんなふうに出てきて、これで接続部位をつなぐものが思ったより自明ではないんです。それに関連する数学やアルゴリズムを探索することを週間上限を全部使いながらやってもできなくて、他のモデルも使ったりしていました。それで、さっきのほとんどの対話はその仮説と実験を繰り返していたんです。ところが問題をdivide and conquerするために、

36:16 問題の一部を切り出したり、あるいは似た問題を再現して、それを一つ一つ動くか動かないかそういうことをテストしてみて。UIを付けて、これ自体はカチッとできたのでとても良かったです。これを私が以前やろうとしていたら、これ自体を実装するだけでもかなり時間を使っていたんですが、何かperturbationをかけたり、vertex数を調整したり、こういうことが一瞬でできるので、私はただ仮説だけ立てて実験をするのはAIがやるんです。それで、この仮説を試してみて、

36:50 convex hull、凸包という仮説を実験してみて。私は思いつかなかったんですが、モデルと話しているうちに動的計画法というものを使うと言うんです。ところが動的計画法というDPというアルゴリズムをこんなふうに使う発想は私はできなかったんです。でもモデルの言う通りにやってみたら、私が検索してみたところメッシュでこういうことをやるのはやや珍しいほうでした。まったくないわけではなかったんですが、それを少し学ぶことがありました。

37:14 でもモデルたちは反対しましたが、私の直感を押し通したことがあるんです。それで、これは私の直感では、こういうふうに何かリングがあるとき、こう見えるこういうものがあるとき、これを位相同型とまでは言わないですが、これらを何かリングっぽく展開できて、それを球面に投影するとこうなって、この残りの部分をつなぐ方式でconvex hullを実装できるのではないか、これでいけるだろうというアイデアを得ました。ではこのアイデアは「カチッ」から

37:50 ロ・ジョンソク 「ガクン」へと移っていく何か出口になったんですか。結論から言うと、まだなってはいませんが、大きなヒントにはなりました。

37:57 チェ・スンジュン そして、これ自体が有用な副産物にもなりました。他でもまた活用できそうだ。でもこれはモデルたちは反対しましたが、私がある直感を持ってこれはいけそうだと押し通してやりました。それで、できると思ってさっきこうなった状態でこれを使おうと思ったんですが、動いているふりをしていただけでした。良くはなりましたね。

38:19 ロ・ジョンソク 少し見た目ではつながってはいましたが、実は解けてはいなかったと。でもこれもGPT-5.4がやったことではあるんですが、

38:27 チェ・スンジュン 問題は何だったかというと、私が問題を再現したのであって、もともとある問題をそのまま持ってきたわけではなかったんです。それで状況自体が違う、そういうケースがかなりありました。できるケースとできないケースが混ざっていて、これをきちんとやるには特定の問題に出会ったらそれをセーブポイントとして作っておいて、そこでさまざまな仮説を立ててまず探索したうえで、仮説で成功すればいいですが、だめならbackwardで戻ってやるんです。こういうのに似たアルゴリズムは多いですよね。

仮説-実験-直感の反復とセーブポイント戦略 38:36

38:54 ロ・ジョンソク Ralph loopですよね。あの時点でできるまでやってみろとトークンを無限に入れれば、いつかはできますよね。でも私の観点は少し違います。

39:03 チェ・スンジュン なぜならscaffoldingをどうするかによって少し変わってくる区間なんですが、これがなぜかというとグラフィックスのほうではTDDをやるのが少し難しいという評価が、私の時代にはそれが少し難しいという評価だったんです。これは視覚的に見ると自明なんですが、vertex merge checkみたいなもので通過しても品質の悪いものがあり得るからです。最近モデルがうまくやるのは結局その情報をフィードバックループの中に入れることじゃないですか。それがあまりうまくできていない状態では人間が見るには簡単なことでも、アルゴリズム的に、あるいはモデルが解くには依然として難しい地点があるんですが、その区間でRalph loopを回してしまうとトークンを無駄にする可能性が大きい。

39:41 現在はback and forthの繰り返しではあるんですが。でも私の事前確率は、できるということなんです。これはできたことだからで、私が今ちょっと紆余曲折を経験してはいますが、良い経路を見つければ、それがカチッとしてできそうだ。さっき私がタイトルをそう書いたじゃないですか。カチッとガタガタ、そしてガタッ。ガタガタはできない区間、でもそうしているうちにガタッとできるかもしれないということ。でもそれは少し信念の問題ではあるんですが、AIと私でやっていると、それができそうだというその感覚がどうあるのかはよく分かりません。でもその感覚を持てば、押し通せばできそうではあるんです。でも今スンジュンさんがお話しくださった区間に

問題を定義する力の時代 40:24

40:27 ロ・ジョンソク 私たちがいつもしていた話が全部入っています。最初に何をすべきかという問題の定義。そして、ある問題がある難題にぶつかったとき、そこに人のインサイトを持ち込んでhuman in the loopにして、いわゆる90%ではない10%のスンジュンさんだけのフィールドナレッジ、暗黙知が投入されるわけです。そして、これをできるまで意志を持って押し通せばいつかはできるだろうし、そうすると実はそこでもまた進歩が起きるわけじゃないですか。

40:54 残念な点は、チェ・スンジュンさんがあれをやったという知らせを外に投稿したら誰かも。私もこれ、人がやったのを

41:03 チェ・スンジュン 見て、できるだろうと思ってやっているわけではありますが、簡単に複製されるのは当然なんです。なぜなら、できるということだからです。そして、人の力だけでできたわけではないじゃないですか。AIの力でできたのであって、それはほとんど公平に与えられている。もちろんコストはかかりますが、とにかくそれはある程度はアクセス可能性が以前に比べてはるかに高くなった状況なんです。

41:23 ロ・ジョンソク 私たちがジョンギュさん以降、実はソンヒョンさん、そして今日まで含めるとある意味、私たちのある種のもどかしさと、こうして詰まっている区間、ガタガタする区間についての話がずっと続いているような感じがします。私たちがみんなカチッカチッとするそういう区間を越えてきた気がします。それは、これはできることだからやらない、というふうに頭の中の考え方がある程度セットされている気がして。今、スンジュンさんもそうですし、実は私もそうですし、クリック一つでできる領域で莫大な利益を得ることもできますが、自分の何かと組み合わせて、まったく別の付加価値を生み出せるそういう問題を定義することにかなり多くの関心が向いているように私には見えるんです。だから結局はproblemだと思います。Problem. だから問題をうまく捉えて、その次に問題をうまく回してみることができて、そしてその問題解決の過程をうまくガイドできるそういう能力を持った人。そういうのが人が持つべき徳目なのではないかと思います。昨日また私の隣で

トークンが切れれば人間になる: 依存とブラウンアウト 42:11

ChatGPTの使用量画面。『週間上限』セクションで『すべてのモデル』項目のゲージが満杯になっており、『100%使用済み』『22時間14分後にリセット』と表示されている

42:32 ロ・ジョンソク あるfrontier knowledgeをくださるあるエンジニアの方がそういう話をされていたのを思い出します。weeklyトークンを自分が持っているそのサブスクで全部使い切ってしまって、それがちょうど終わる瞬間自分は取るに足らない小さな人間に戻るんだと。そうなるとやることがないので、できることが一つもないので、寝ることだけが自分にできることなんだ、という話をされていたんです。でもそれがまた妙に響くものがあったんですよ。今、私たちもあらゆる仕事をGPTとClaudeを横に置いてやっているじゃないですか。

42:59 正直、それがなければ今では一日の大半の業務がそれと一緒にやる形になっているんです。それがなければAndrej Karpathyが言っていたように社会全体がブラウンアウトになるんですよね。少し電気が落ちたような。とにかくこういう一週間を過ごしましたし、

締めくくり: AI時代に強化すべき人間の徳目 43:21

43:21 チェ・スンジュン ジョンソクさんはまたそういう深掘りする経験をされて、私も私なりのやり方で少し掘り下げながら。重要なのは、さっきジョンソクさんがおっしゃったことのように、それにもかかわらず、こういうことをAIに委任しながらむしろ獲得すべきものや強化すべき要素がある気はします。例えば粘り強さとか、仮説を立ててみることとか、少し休むのも良いことですよね。なぜなら頭が冴えていてこそ、良い仮説を思いつけるからです。だからそういうことについても少し考えてみる、また探ってみるのも面白かったりしますし。こうして問題を解くこと自体はまた面白い感じがあります。ひとまずここまで準備してみました。

43:59 ロ・ジョンソク はい、今日もまた楽しい内容でした。