AI Frontier

EP 97

AI Psychosis 时代的人们

· 卢正锡, 崔升准 · 1:17:03
整页
查看本期参考资料

开场:Google I/O 的 harness 战略 0:00

0:00 卢正锡 好,今天录制的日期是2026年5月17日,星期日早上。2026年已经快过去一半了,感觉变化的速度真的越来越快。年初的时候,大家还在说要用 Claude Code、Codex,AI 编程、agent 编程这些东西开始流行,现在说所有人都在用,虽然有点夸张,但确实可以说所有人都知道了。所以关于工作流该怎么推进,各种技巧真的是让人喘不过气地来来回回传播,而且拿这些工具来工作的事情,已经不只是以前的工程师阶层,现在是所有知识工作者阶层,都在逐渐吸收 Claude Code 或 Codex 的实践,这已经到了能切身感受到的程度。与此同时,模型也在持续变好。卢正锡一直说,模型会不断发展,与模型相匹配的 harness 也会发展,harness 所具备的特征又会进入模型内部,然后 harness 又会变得更好,这样一种不断变好的良性循环结构,会形成起来,卢正锡经常这样说,而非常理所当然地,它正在以令人窒息的速度推进着。

Google I/O와 구글의 하네스 전략 1:12

1:12 卢正锡 这周好像会有 Google I/O,模型应该会有新的发布吧。升准?从时间线上的传闻来看,

1:21 崔升准 Gemini 3.5 Flash 好像出现在 Arena 上了,我似乎瞥到过这个消息,也有人猜测 Veo 4会不会发布。Google 最近这大约6个月里,

1:34 卢正锡 在 harness 竞争方面,自从去年年底推出 Google Antigravity 之后,对于由 Codex 和 Claude Code 引领的 harness 竞争,似乎并没有特别积极地参战。不过从现在出现的东西来看,

Google AI Studio,Google 好像是在说:“喂,这样用语言来回沟通,不如只要大概说一下想要什么,它就自己全部完成并做出成果,这才对吧”,我感觉他们是不是在这样想。

只要在 AI Studio 里说上几句话,就能直接把这个目标产物精准地交付出来,让我感觉他们是不是想推出这样的工作流。我不太清楚 Google 到底有什么想法,

2:16 崔升准 但很明显,它没有跟上 Codex 或 Claude Code那种奔跑的步调。按一些人的传闻,

2:24 卢正锡 Demis Hassabis 对生物工程、科学、解决衰老和疾病兴趣要高得多,而把编程看得非常微不足道,也有这样的说法。不过毕竟这是一个很大的市场,Google 无论如何当然也会参战。但 Google 毕竟一直是在最前线引领这种趋势的玩家,所以相比某种渐进式发展,我觉得它会追求 game changer、showstopper,也就是能一下子结束战斗的那类东西。与此相对应,事实上OpenAI 的 GPT-5.6 也据说很快会出来,与此同时 Claude Mythos也一直在预热,他们说“这真的很厉害”,但另一些人的传闻是,Anthropic 只是因为计算资源不够,所以才拿不出来。某种程度上,这话好像也对。从计算资源的角度来看,

GPT-5.6、Anthropic 的计算约束与模型发布周期 3:01

3:27 崔升准 很难想象 Google 会落后。

3:29 卢正锡 实际情况到底如何,我也不太清楚。从 Google 内部听到的传闻是,其实非常多的训练,以及这类事情都会占用计算资源,所以内部的一些环境、生产环境之类的地方,计算资源也并不是那么宽裕地分配下来,我偶尔会听到这样的说法。DeepMind 可能在哪些地方用得很多吧。无论是开发新模型,还是做别的什么等等。但可以确定的是,模型性能持续上升这一点,现在已经毫无疑问了。

프론티어 모델의 두 달 출시 주기 4:03

4:03 卢正锡 而且大概从 GPT-5.4、5.5 之后开始,人们已经时不时会谈到 AGI。当然,他们会谨慎地使用一些政治性修辞,比如说它参差不齐、是 jagged 的,在某些方面表现出超越人类的智能,但在某些方面又像傻瓜一样,会这样谨慎地表达,但事实上,在我们通常说的大多数知识工作任务上,它的性能确实非常出色。

4:31 崔升准 在 Ryan Petersen 那一期,Dwarkesh Patel 的采访里,到后半部分会转到 Chinchilla 的话题,然后先设定一个假设,关于模型会以多长的周期发布,再用算术去计算预训练所需的计算资源,那里的前提是两个月。

也就是那个模型活动两个月。因为它是 frontier 模型。

GPT-5.2 也快要 sunset 了。现在当前模型是 5.5。所以它活动的周期大概有两个月左右的节奏,

也就是说每两个月就会有新的东西出来。但是现在每次往上升 1,

5:12 卢正锡 按去年的标准来看,其实就是 major update,所以变化周期在持续缩短,这一点是确定的。最后只说结论的话,计算资源在持续扩展,数量增加的同时,计算效率也在提高。有工程层面的某种进步,

去 NVIDIA 化、推理芯片生态与 T_brain 瓶颈 5:34

5:34 卢正锡 也有卢正锡在 DeepSeek V4 中看到的算法层面的进步,而这些东西全部叠加起来,其实硬件方面卢正锡之后也会再讨论一次,尤其在推理方面,NPU、专用 inference 芯片正在大量增加。

DeepSeek V4 也提到了 Huawei Ascend 这款芯片,虽然不知道它实际使用的比例有多少,但无论如何,去 NVIDIA 化、不依赖 NVIDIA 的这类生态系统也正在快速增加,这一点似乎很确定。最近 METR 的图表,在 Mythos 级别上,

6:11 崔升准 好像是16.5小时左右,差不多是那个程度。现在 METR 所测量的东西,按照他们目前的方式,似乎需要做不少修正,我好像看到过一条带有这种意味的推文。所以模型的性能在特定领域内持续上升,也就是现在仍在 J 曲线上,这点是确定的。也正因为如此,最近不是也出现了 fast mode 吗?多付钱就能更快的那种。

T_brain 병목과 급행료 시대 6:35

6:39 卢正锡 简直就是加急费啊。那时候,我们做 Dwarkesh 那期的时候,

6:46 崔升准 不是聊过 T_compute、T_mem 这些吗?我最近开始会想到 T_brain。

6:52 卢正锡 人的瓶颈。

6:53 崔升准 也可能是瓶颈,反正就是要达到 break-even。这是在说当它发挥效率时,彼此之间存在 trade-off 的情况,所以那一部分,还有耗费在那里的时间之类的,最近我会有点去思考这些。

하네스 프랙티스의 대중화 7:08

7:08 卢正锡 所以今天我们久违地又回到了这种闲聊模式,我们平时总是带着某个主题,做那种学习型的节目,这次就是单纯的闲聊模式。也可以说是稍微中场休息的一页,虽然说是休息,

7:27 崔升准 但这也是一直让人后脑勺发紧、不断苦恼的问题。

7:30 卢正锡 而且这件事正在发生巨大的变化,我们的 workflow 也在变化,周围人的 workflow 也在变化,而我们很幸运地有机会在旁边看到一些走在前面的人,而且这样的机会很多,所以能看到他们正在创造怎样的变化,我们也从中学习,也确实大幅改变了我们的 workflow。现在他们所感受到的变化,即便只是去年年底,然后到今年年初,还在看谁能用更多 Claude Code 和 Codex 的 token,以及那些,我们称之为 Ralph loop 的东西,用很严苛的 hook 一直挂着,直到 task 完成为止,让某些东西这样一直跑 job,这种 meta harness 也曾经非常流行,现在则好像已经以相当稳定的形态落地了。然后还有 oh-my-claude 之类,oh-my-claude-code、oh-my-opencode,以及以 oh-my-codex、oh-my 系列为代表的那些 meta harness 里的优点,这些东西也正在被我们所谓的本品,也就是 Codex 或 Claude Code 的基础功能里慢慢搭载进去,我们一直在看到这种变化。

Claude 的政策变化与超级 App Codex 8:45

8:45 崔升准 不过现在 Claude 那边对这些东西感觉是在稍微施加一些惩罚。最近说从 6 月开始要改价格也是这样,对 Claude Pro mode 也好像开始加一些限制,所以对于一直跑 loop 或 exploit 这个的方向,看 Claude 的情况,Anthropic 毕竟在计算资源上,就算 확보了 Colossus,也未必是非常非常宽裕,可能因此如此。总之政策上的变化

那边也正在很快地让人感受到。

9:17 卢正锡 Claude Code 其实在今年上半年引领了潮流,甚至“AI 编程”这个流行语几乎就等同于 Claude Code。也正因为如此,入门 AI 编程的人,

大多都会注册 Anthropic,注册 Claude,安装 Claude Code,然后订阅 Max 套餐,小一点的则订阅 20 美元套餐,大家都是以这种形式开始的。

这应该对今年上半年 Anthropic 的某种爆发式增长产生了很大影响,但现在我们也知道了,Anthropic 的 computation资源是不够的。所以 Opus 模型的质量持续有点下降,也发生过这种事情。看大多数做 AI 编程的人,

都开着 Claude Code。我周围也是。

10:03 崔升准 最近流失、迁移都很多。在这期间 Codex 非常快地追了上来,

10:09 卢正锡 开始跟上了,而且 OpenAI 相对来说从去年开始就在 computing 资源上投入了相当多,看起来更有余裕。也正因为如此,那个 computing resource,其实 Codex 给的 token 余量要大得多。我还没有在 Codex 上碰到过 weekly limit。其实那真的是很难全部用完的 token,现在就是这样。

10:37 崔升准 总之 Codex 桌面 app 也好,单纯 CLI 也好,那边也几乎是按天发布新的 binary。没错。Codex 桌面 app 的周期也变得非常快了。所以如果总结上半年,

슈퍼 앱 Codex와 강조되는 AGI의 G 10:51

10:54 卢正锡 Codex 或 Claude Code已经不再只是和编程相关的东西了。实际上,一种认为它们可以介入几乎所有贯穿软件的 workflow 的哲学似乎开始形成了。像 OpenAI 的情况,现在干脆把 Codex 称作 super app。无论做什么,如果有某种东西拥有最 general 的能力,那么任何种类的 specific 工作都可以处理,他们现在也经常使用这种说法。所以 AGI 里的 G 正在被越来越强调,这确实像是这样的时期。正因为如此,人的、模型的性能,

裴辉东的 120x 与工程师 burnout 11:36

11:40 崔升准 以及 harness 的性能都在不断提升,而这个东西越用越能处理更多工作,所以人们开始诉说 burnout,哪止已经半年了?从去年开始就有这种抱怨了。最近则更加凸显出来。我最近在时间线上看到 Corca 的 ace lead 辉东发的文章,印象非常深。

12:02 卢正锡 我们要不要先看一下是什么文章?所以这里面提到了我们,

12:07 崔升准 我们也借着提到辉东来聊一下,看来第 67 集左右是在 9 月。所以那时候聊了 tech backend 这类工程师的话题,说的是创造 compute multiplier 的人们,但当时是觉得还需要再多做一点,结果做着做着,不知不觉好像就变成了 120x,他也这样说了。所以现在即使还谈不上产品化,但在 dogfooding 的程度、公司内部使用的程度上,非常快速,而且高效的某种生产流水线和实验正在推进,我觉得他说的是这样一种语气。不过大家不是经常说这个像多巴胺、像老虎机一样吗。很多人都会这么说。

这个东西在时间线上流动,滚动也在流动,你看着看着,模型概率性地做得非常好,一下下爆出来,所以大家经常用“多巴胺爆发”这种说法。现在就是沉迷在这种东西里,整天都在工作,于是又会产生辛苦感。尤其即使让 agent 长时间运行,

重要的协调和决策还是要由人来做,然后要减少工作时间也很难,因为觉得可惜,所以就得一直做下去。所以有一种像疯了一样,以背景速度、不均衡的速度奔跑的那种压力,也有某种来自期待的压力。所以现在如果不做其他兴趣爱好,只是一味开发,健康就会变差,也有这些说法。这里的评论里也能看到,有些有共鸣的人也留下了评论。所以我和周围的工程师们吃过几次饭,大家都在用 SSH 之类的方式,吃饭时也在派工作。

13:49 卢正锡 要么用手机,要么拿出 iPad。

13:54 崔升准 所以他们一边看着那些细小的代码,一边不断地派工作。

13:58 卢正锡 大多数人都会至少开一个像 Hermes 或 OpenCode 这样的 agent,然后又让这些 agent主要去管理自己的 task,在下面再接上 Codex 之类的,或者 Claude Code 这样的东西,以这种结构来跑,很多人都是这样运行的。可这是一件好事吗?

14:20 崔升准 这种话不只是辉东在说,最近我在很多帖子里也看到了。不过如果我们回想一下,就到去年为止,

软件制作特权的终结 14:25

14:30 卢正锡 制作软件还是一种相当大的特权。需要相当程度地学习和练习,才能入门,是一个很好的职业群体,而且制作出软件这件事本身就是附加价值,我们在这样的时代里生活了很久。因为做不出来,所以无法扩展业务,因为做不出来,甚至连业务都完全开不起来的情况非常多。所以我们说要创业、要做点什么的时候,

大多数在 IT 行业里,工程师人数有多少,以及我们能把这个做出多少,和开始一项业务事实上曾经是等价的。如果拿到投资,那笔投资金额的几乎三分之二理所当然会进入工程和产品团队的人力成本,而那个团队的质量最终会连接到公司的价值,这样的范式统治了差不多 10 多年,几乎接近 20 年。所以从那些不具备这种资源的其他人立场来看,这是非常令人羡慕的资源。但现在,所有人都能做了。

因此现在拿着 Claude Code 或 Codex,以前自己无法做出来的某种产品,有用户存在,有 UX、有工作流,其中还有 DB 和 UX 这些东西,现在能够做出这些,实在太神奇了,所以大量产品正在被批量生产。无论是出于个人目的,还是某种工具性的目的,又或者是真正的商业目的。所以早期把这些东西做出来之后,“我做了这样的东西。

请试用一下”,这种事情非常新奇,去别人做的 GitHub repo,看着那个 README.md,还会尝试安装一下的时期,如果说也就是去年秋冬左右,那么现在,在今年第一季度结束的这个时间点,如果有人说“我做了这个”,然后上传到 GitHub,各位有试用过吗?升准?

16:40 崔升准 我没有。我现在也几乎没有了。虽然会说“有人做了这种东西啊”,

16:45 卢正锡 但如果里面有某个非常新奇的点,我只会好奇这是怎么做出来的,只会对那个差异化的点、那个 edge 感兴趣。那这种情况下怎么办?下载 GitHub repo,然后就让我的 agent 去做。让它分析一下,知道我在运营什么代码库的我的 agent 读完之后,会回答说“这里没什么特别的地方”,或者会这样回答,也可能会说“这个点很有意思”。那么那个点事实上只要点一下,我也就可以利用了。我觉得我们正在进入这样的时代。

基础设施时代的结束与 AI 应用时代的开启 17:25

17:25 卢正锡 我现在想在这里说的是,其实我们现在正处在模型和harness 的时代。而模型和 harness 本身,或许现在也可能已经是商品了。如果借用过去互联网时代,或者移动时代当时的某种比喻来思考,以前也是基础设施铺设好、基础设施稳定下来,价格在相当程度上下降之后,之后才开始进入应用的时代。移动端一路稳定下来,一开始我们会玩 Paper Toss或 Angry Birds 之类的东西并觉得开心,但之后事实上像 Uber、Airbnb 这样的大型垂直领域全部进入移动端之后,形成了巨大的产业化,我们所知道的那个移动时代也因此开花结果。所以现在人们好像也经常把这个比喻拿到 AI 时代来使用。好,现在模型已经足够稳定了,当然模型还在持续发展,

但如果接下来进一步发展的东西,以我们这样的普通人标准来看,已经无法再制造出某种 marginal 的差异,也就是说从我们的立场看,已经达到足够的水平了。没错,就像边际效用递减法则一样。那么现在从过去的某种分析来看,可以说基础设施已经足够稳定、也足够便宜的时代我们就先这样假设吧。那么,AI 应用的时代就要开启了,AI 应用会是什么样子,这是现在所有人都在问的问题。

워크플로우 자체가 된 AI 애플리케이션 19:02

19:02 卢正锡 而且未来 12 到 24 个月,也就是 1 到 2 年,按我们的时间轴,按我个人的时间轴来看,这相当于过去 10 年、20 年的强度,在这段时间里会发生非常惊人的事情。那么,它的形态,AI 应用是不是把过去我们的移动 App 或 Web 服务做得特别快,就是新的 AI 应用呢?我觉得不是。归根到底,就是 workflow。过去做某件事,是给人们一个 UX,然后解决那个问题的,必须是人来做。人要在里面寻找那个 flow,一边定义自己想解决的问题,最终在那个工具里解决问题。所以如果商家过去提供的是工具,而用户用那个工具解决问题,那么到了 agent 时代,其实用户只需要给出某种 intention,也就是意图,商家需要卖的,是问题的解决本身。也就是说,要卖 task completion。那么,这个阶段可能就不是 UX或这些东西的问题了。那它是不是对话式界面?也未必,但可以确定的是,它会是自然语言式界面。所以现在 OpenAI 也说要和 Jony Ive

AI surface 与界面的未来 20:23

20:26 卢正锡 推出新的电话,新的 UX 电话,但它可能并不是我们所熟悉的移动 App 的样子。它只是看见、听见我们所看见和听见的,同时看着我们所处的全部 context,像秘书一样把所有事情都解决掉,只把 solution 带给用户,这种形态现在被说成是新的 AI 应用形态,但其实那已经不是 product 了。所以它本身就是 workflow。

Jensen 上次不是讲了 AI 的五个 layer 吗,前面从能源到芯片,再到模型,然后是 orchestration 这些。最上面是 application,但那个 application 应该不会是我们过去所知道的那种 application。不是在 App Store 下载,每家公司都有一个 App,下载之后可以做什么,不会是这种概念。application,也就是应用的 80% 到 90%,几乎都会是 harness 本身,而在它之上,用户和那个 harness 之间被称为 interface、UX 的部分,最近人们常用的说法是AI surface。就是 AI 的表面,而这个 AI surface 的形态,究竟会不会是我们现在熟悉的 ChatGPT那样的对话式,还是自然语言对话、voice interface,又或者会是别的东西,最终会不会变成 Neuralink 那样的东西,现在似乎还众说纷纭,我觉得这可能就是当前最大的议题。目前如果 OpenAI 和

Google 明确抛出“这就是新的 UX 形态”这个话题,大家都会一窝蜂跟过去,但关于这一点现在还没有被明确地定义下来,所以我觉得我们现在正处在一段混沌期。

下一代 AI 应用的样貌与 ChatGPT 平台张力 22:24

22:24 崔升准 不过在这个语境下,我也想稍微补充一下,也有一点好奇的是,现在已经有人用 Claude Code 这类东西,谈生产力是否提升,差不多已经过了 1 年零 3 个月,如果大致算成 1 年的话,在这 1 年里,AI 领域推出的产品里,除了 AI harness 或 AI service 之外,有没有令人印象深刻的产品?

刚才您说这是混乱期或过渡期,那有没有什么您记得的东西?没有。到目前为止,大部分其实仍然都是

22:56 卢正锡 Codex 和 Claude Code 的子集。

23:02 崔升准 也就是说,是用它能做的某种东西?对。换句话说,下一个 application

23:08 卢正锡 也可能就是像 Codex 那样的东西。

23:12 崔升准 能不能再展开说明一下?也就是说,现在的 Codex

Codex가 못 막는 버티컬의 가능성 23:14

23:15 卢正锡 其实就是 GPT-5.5 加上 computer use,然后再加上工具和 context 管理。但把这些 general 的东西组合起来之后,其实我们对 Codex 说:“喂,帮我在 Coupang 下单买三多水”,它也能做到。所以这实际上好像就是 Codex 所梦想的super app 的位置。无论让它做什么,只要投入开发工具、合适的工具,以及这些东西和 computation,它基本都能做。

23:49 崔升准 那时候 vertical 是什么?这就是一个非常好的问题,

23:53 卢正锡 升准,那么如果我把问题这样换一下,答案很快就出来了。尽管如此,仍然不能交给 Codex 做的东西。那是某种 tacit knowledge 吗?

24:03 崔升准 还是说,只是在商业层面上的另一层东西?我是这样想的。现在比如说 Coupang,

ChatGPT와 플랫폼 사업자의 긴장 24:08

24:12 卢正锡 Kakao,以及许多其他公司,不是有很多吗。这些公司是以什么形式向客户提供东西的呢?它们把自己的某些工具以及这些东西全部打包成 App 推出来,然后交给客户。而且不管出于什么原因,因为它们在市场中取得了胜利,所以占据了客户心智中非常大的 mind share,也因此形成正向循环,拥有 market leader 的位置。

但现在重要的是,它们和用户建立接触点的方式是移动 App 或 Web,那么 Codex 具备 computer use,这意味着什么?直接把它叫出来用就可以了。

24:52 崔升准 几天前 Codex 已经可以在手机上用了。但那个并不完美。

24:58 卢正锡 其实要变得完美,该怎么做呢?要变得完美的话,其实就是 Coupang以 OpenAI ChatGPT 能调用的某种干净的 API 形式,把所有东西都这样很好地 unbundle 后交给 OpenAI,ChatGPT 就真的能调用得极其出色了。但 Coupang 绝对不会那么做吧。做那件事的瞬间,就等于把自己的东西交出去了,对吧。自己在中间挂广告,在中间交叉推荐其他产品,靠这个来经营业务,所谓的媒体影响力就会全部被夺走。那么这中间,也就是商家和 ChatGPT 之间,其实就是一个紧张点。那么现在从 Coupang 的立场来看,就会有别的想法。

ChatGPT 拿着那种 general 的武器做不到的事情,他们会努力去设计别的东西。做出只属于自己的某种 agent,然后再配合那个 agent,运转更加个性化的 context,再把工具也强化得更多,虽然这当然也是去 OpenAI ChatGPT 那里能做的事,但如果来到这里,就能把那件事做得更好,他们会做出某种这样的东西。但那个所谓的某种东西,就是把 OpenAI 通过 Codex 提供的模型加 harness 的这个公式原封不动地拿过来,然后在其中加入只有在那里才方便使用的、能带来非常高附加价值的额外工具,或者是我至今购买过的产品、做过的那些 context,也就是所谓我被那家公司当作人质扣住的那些数据,由此产生的附加价值的结合。所以这些东西的总和,会和只装一个 ChatGPT 就够了的便利性展开竞争。但这其实全部都是在搜索时代,无数垂直类 Web 服务,

vertical 的差异化:客户数据与工具组合 26:15

27:03 卢正锡 以及在 Apple 和 Android 时代,general 的 App Store与无数垂直应用之间的竞争中发生过的事情的完全同构重复。只是以前它的形态是 Web 服务,是移动应用,而这一次,其实现在 Codex 展示出来的东西,我认为就是 AI 应用本身。这个 AI 应用本身的框架,你看,几乎 95% 就是一整块 harness。

然后如果我们非要给它贴上 AI surface 这个说法,AI surface 就是对话框。对话框,而 UX 是通过 conversation 来回往返的某种 timeline,然后在那里要么用键盘输入,要么用 voice 输入,二选一,只要人类还拥有某种人类的硬件接口,不会改变的东西,在这里也原样没有改变。如果这个要改变,那就真的得像 Neuralink 那样,往脑子里插点什么才行吧。所以现在 Codex,

在我看来就是所有 AI 应用的未来形态。那么现在其他企业要怎样打造 AI 应用,来阻止这个 Codex 或 Claude 以 general 性、以这种 super intelligent 的 general 性为武器,这样打进来呢。在 harness 里,我把两个东西当作轴来看,

真的就只有两个。其实就是他们能够完整差异化的工具组合,以及被他们扣住作为人质的客户数据,能在多大程度上控制这些东西。所以我认为 harness = control layer,能掌握多少这种控制权,现在会成为这些公司的新价值。您刚才说的那些公司,反正国内公司也都是大公司,

28:56 崔升准 现在我们看去年和今年正在发生的事,有很多人想方设法使用这个 AI,来做生意,也在举办 meetup,也在拿 funding,不是正在出现一些潮流吗。那么那些人需要突破的,也是同一个公式吗?playbook 是一样的吗?

playbook 落地与价值迁移 29:19

29:19 卢正锡 就我的感受来说,现在还处在 Anthropic 吗,也就是说企业家或者投资人脑海中的图像还稍微没有完全成形。而且现在要让本人做出决策、进行定义并采取行动,还稍微缺一点 peer belief。要解决这个问题,其实需要 OpenAI 或者 Google这样的地方把“这就是未来的 UX”定下来,然后人们稍微显现出一窝蜂涌向那里的样子,世界就会一下子翻到那个方向去。但那个 playbook 本身,我觉得现在是不是已经稍微定型了。

29:59 崔升准 什么东西定型了?现在新的附加价值,

30:04 卢正锡 应用的附加价值核心当然如此,现在如果还是 UX 块,或者我们现在这样咔哒咔哒咔哒做出来的某种传统的新形态移动应用,或者 Web 应用再出现,那不是答案。面向过去用户所制作的应用,现在全部都没有意义了。

那么现在新公司的核心是什么。最终只会是一整块 harness,那么那整块 harness与 Codex 有什么差异点和竞争力这个问题,接下来就会直接出现。那么这家公司只有这家公司拥有的、这个人只有这个人拥有的、对用户的某种排他性权利,数据加上只有这家公司拥有的某些 tool set,以及它们的组合,能以比 ChatGPT 完全不可同日而语的方式更干净地运转,这样的形态,也就是再一次变成 vertical。如果说这是一家能做出那种东西的公司,那它就有意义。

那么这现在按传统 IT 服务概念来说,在 B2C、B2B 应用中也那些事情会接连发生,而且我们一直在说,在生物学、材料工程、化学、物理这些领域,在科学领域里也会发生这种事,我觉得现在走向应用时代的起跑枪已经砰地响起来了。

31:36 崔升准 也就是另一层的应用。对,是另一层之上的应用,

31:40 卢正锡 而且这已经不再是UX的问题了。归根到底,是如何把用户的intent转化为问题解决,也就是说,我们的solution不再是以前那种一堆工具,而是问题解决本身就是商品。我们已经来到这样的时代了。

所以相应地,对于业务的观点现在也都必须改变,这就是我现在想说的。从这个意义上讲着讲着就讲到了这里,最近很多人在做的那种对已经存在的应用点来点去,复制一下然后推出自己的东西,现在只是练习题,就像刚开始学深度学习时解MNIST问题一样了。

向 AI 时代人才画像的转变与 AI 导入的分岔路 32:24

32:24 卢正锡 好,所以现在从这里开始,我们好像该回到今天原本的主议题了。感觉得好好衔接一下,

32:30 崔升准 总之,关于能够做到那些事情的人才画像,我们今天一边热热身聊一聊,也许会想到些什么,当时是这么想的。要不要试着连接一下?

32:42 卢正锡 现在如果试着描绘一下追求那些东西的人,应该会比较合适。不过这个层次可能有点不同,不是在既有企业内部做的人,

32:57 崔升准 应该说是在企业外部做的人吗。但无论如何,我们这段时间看过的那些脉络都是被大幅重组过的地方。合约也被重组,团队也被重组,不是有一种走向小规模的方向性吗?在那种情况下,要谈人才,或者要谈什么样的人才,我觉得需要想一想。可以确定的是,无论是老板们,

AI 도입의 갈림길: 데이터 정리와 DX 33:16

33:18 卢正锡 还是在公司工作的成员们,“啊,现在AI会把我们的workflow全部重新改写吧”这种认知,确实已经建立起来了。所以,对于正在做的事情,怎样通过AI让它变得更快、更方便,这些目标性都已经明确了,但至于要怎么解决,能够这样干净利落解决的公司极少。因为大多数公司,那些能够干净利落做到的公司的特点,我已经说过很多次,就是数据本身整理得很干净,而且digital transformation本身已经干净利落完成的公司,这件事会做得非常顺。因为只要把Claude Code SDK接到已经整理好的数据上,再把前端写好,大多数事情就能解决。直接交给Codex就行。交给Claude Code的话,实际上想要的事情几乎都会发生。

但如果完全不同意这些的人,公司里很可能连digital transformation本身都还没有完成。没有可以接上的data pipeline,或者即便有,也广泛散落在各个实务人员的Excel文件之类的东西里。而且就连制作那些Excel文档的成员,也没有去想这在更大的层面上有什么意义,以及这该如何转变成data pipeline。根本没有这种思考。实务人员没有这种思考,也就意味着上层leadership很可能连这些东西的存在都不知道。因为从上面看,只要下面的事情在运转,就觉得招个人来让他做就行,也就是所谓把它隐藏起来了。把它encapsulation起来了。一层层绑起来,最后最上面只要有一份“啊,我们销售额是多少”的PowerPoint文档交上来,他们就一直这样经营过来了。现在这样的公司就面临非常大的困难,而趁着这个空隙,现在有无数ACE公司进去,说我们会帮你们解决这个那个,但这就像过去10年、20年前,McKinsey或BCG这样的咨询公司进去,那家公司也无法脱胎换骨一样,并不是说某些ACE人才进去,就能解决的问题。这很多时候并不只是AI或某个技术的问题,而是单纯变成了经营管理的问题。到这里我最近一直在想的是,

AI Native 与 AI Assisted 的区分 35:53

35:58 卢正锡 必须区分AI native和AI assisted。AI native是几乎不需要人的帮助或介入,所有这些workflow就能结束,那才是AI native;AI assisted则是人做的事情没有变化,AI加入进去,让它稍微变好一点,这就是AI assisted。现在几乎大多数公司里发生的,“啊,我们也必须成为AI native company”这种说法,几乎大多其实都是在说成为AI assisted company。如果人们原本做的工作有100,我经常说,100并不是一个工作。实际上会被拆成5个单位、10个单位、20个单位、40个单位、50个单位这样,然后才成为那个人的工作。只是把那份工作里几个纯体力活替换掉而已,但几乎大多数人并不希望AI过来把自己的工作拿走,这是我经常看到的情况。因为那样自己的存在感就会消失。所以就变成AI assisted,AI assisted的某种工具做出来了也不用,因为不用,又不会有什么发展,于是项目是有人做完离开了,公司的生产力却还是原样,我见过很多这种情况。那是过去的digital transformation,DX,或者经营战略咨询,在流程咨询之类的事情中也是一直屡见不鲜的事情又重新发生了而已。

所以比起现有公司变成 AI native,我认为把那个流程以 AI native 的方式来使用会更快,我是这么想的。要是有擅长 IT 的创业者候选人来找我,说要进入那家公司,帮他们把那项业务做成 AI native,如果他们这样跟我说,那我就会问,那你这样能收多少钱?最近 AX 咨询的价格,或者所谓 FDE,也就是投入 Forward Deployed Engineer,去解决某项业务的公司,我看到很多,但单价完全不高。因为连委托这项工作的人脑子里也觉得,AI 都会帮忙做了,那你们到底是在做什么?所以结果就是,反正你们也就是点点 Claude Code,凭什么要这么贵,便宜点做吧,就是这样。而且做这种点点 AI 的事情的人现在也越来越多,所以单价还在持续下降,因此这些人的单价也下降,他们进到那样的公司里,把 AI assisted workflow大概这样搭好之后就出来了。聪明的公司看到那个就会学会,里面的人之后会拿着 Claude Code 来用,但不是这样的人就会变成,上了培训班却什么都没变啊,诸如此类。所以最后我如果遇到那些说要给某家公司做一个 AI assisted 什么东西的人,我就会说,你干脆把那个 workflow 重新写一遍,然后你去攻击那家公司试试看。这样那家公司拥有的东西,你自己不就也能拥有了吗?我这样换个角度一说,大家都会有点困惑。但这就是下一波创业的巨大浪潮。别人的利润就是我的机会。所以我觉得会往这个方向来。

AX 咨询单价下滑与新 AI 人才的标准 38:02

새 AI 인재의 기준과 해석 능력 39:30

39:30 卢正锡 顺着这个话题讲回去,AI 人才其实也分布在非常宽的光谱上。会用 Claude Code,那就是 AI talent 吗?Codex 用得很好。然后在 Codex 里面挂上 OMX,接到我们的 Hermes agent 上,我就是这样工作的。那这算 AI talent 吗?就在 6 个月前可能还算,但现在未必了。

40:03 崔升准 6 个月前的话,是 AI talent 没错。现在光靠那个已经不够了。

40:09 卢正锡 这样的人正在变得非常多。那么在这里又会再次

回到非常人性的部分。现在围绕 AI 环境的最大 driver,终究是模型和 compute 的竞争。通用模型的力量能增长到什么程度,以及能以多高效率运行它,会让整个游戏来回摇摆。我认为需要仔细看的部分,至少是能够理解这整个游戏正在流向哪里,以及哪些东西是核心 lever 的能力。然后在那之上,进入其中去开创业务,坦白说并不容易。并不容易。再然后,这也和那种通读文化等等相连接,氛围会被带起来,valuation 也会形成,但客户到底会不会真的使用那些东西,还是只会选择最好的东西。

其实我们也有 DeepSeek V4、GLM 之类便宜得多、也很好的模型 API 候选,但即使贵,大家还是会去找能给 Claude Opus 和 GPT-5.5挂 high 或 extra high token 的地方。因为这里正在快速发生向上拉平,所以必须能够理解这些环境。然后在那之上,我认为还有一个非常重要的部分,虽然人们几乎完全没有意识到,但我们上次在 Dwarkesh session 里也是为了这个目的学习并讨论过。推理,刚才也讲了 Coupang 的例子,即使要铺设像 Codex 这样的新 harness 并运行它,底下必须铺好的 infrastructure,也至少需要现在 frontier lab 在推理云、也就是 inference cloud 上部署的那种程度的infrastructure 加工程技术。不是简单装上 vLLM

Lablup 级编排基础设施与控制层 41:44

42:16 卢正锡 或 SGLang,然后说啊 done 就可以的。硬件要以什么方式 orchestration,在其上运行这些东西的工具要怎么跑,以及适合我们 workload 的最优 inference 架构是什么。因为有些 workload 可能会产生非常大量的 prefill 块,有些 workload 可能会有非常强的 decode dependency,根据这些,context length 也可能完全不同,而相应地,工程 infrastructure也必须完全不同。但具备这种 readiness 的公司几乎没有。

可是一旦说我要拥有自己的服务,我要承接自己的 traffic,其实就必须真的很会做这种工程。我认为在韩国,像 Lablup 这样的公司就是处在这种 orchestration 的顶点。看着那家公司处理的 workload 等等,我对这方面有很多视角。啊,这或许就像以前 2000 年代初期,Google 的 BigTable和 MapReduce 这类 computation,让计算高度分布式并高效化,那样的 infrastructure,也就是让存储分布式并高效化的 infrastructure,当时正好有两个。

一个是 compute,一个是 storage,当时那就是 MapReduce 和 BigTable。后来进入里面看的工程师们,看着 Borg 之类的东西在跑,经常会想,这太疯狂了。而那样的 infrastructure 在外部 open domain用 Hadoop 之类追赶上来,是花了相当长时间的。

所以这次也是,如果有公司梦想成为那种 OpenAI 或 Google 级别的公司,至少在某一个 vertical 里做到那种程度,那就会觉得,原来那种 orchestration layer还是得有才行,而再往上就是 application 了。到了那个 application 层,我认为核心最终是只有自己能搭出来的 control layer。而那个 control layer 的两个核心,是你会掌握什么样的客户数据作为筹码,乘以你会拥有什么样的工具,而这又和什么有关呢,就是我到底要为客户解决什么问题,这两者是相关的。而在这个点上,

컨트롤 레이어와 비즈니스 문제 정의 44:07

44:34 卢正锡 其实就会和超出 AI world 的其他形态发生关联。比如要叫出租车,或者要在工厂生产东西,或者要做这些事情,这些都已经和我们现在只用 IT 来谈的workflow 完全是另一回事了。

这样一路下来,这个产业的底层和上层,底座和顶端都会被构成起来,而能够把这些全部理解,并且在某个特定业务里,把目标客户的问题和这个正在疯狂变化的business cycle 的时机感很好地对齐,具备所有这些东西的人,才会成为 AI talent。变得极其严苛了。我刚才脑子里一直在冒问号。

45:22 崔升准 首先,能处理 Lablup 那种级别基础设施的公司,从到底能不能有 N 家开始说起,这就不是容易的事。是的。那边确实是比较大的业务,

45:33 卢正锡 但如果往上走到 application layer,其实就可以有非常多。也必然会有很多。因为客户不会因为 Codex 能做所有事情,就去安装 Codex。因为虽然知道把东西放到 Codex 上,然后我写一些编码指令,用这样那样的东西,就可以准备我的生日派对,但如果有某个服务商,把所有和生日派对相关的酒店预订、生日礼物寻找、以及和生日相关的快乐内容寻找,这些都很好地连接起来,并且在 Codex 之上把这个业务搭好了,客户就会去那里。所以这又会和另一个说法关联起来,

Benedict Evans 的 unbundling 与领域专家、meta optimizer 人才画像 46:20

46:20 卢正锡 最终就是以前我喜欢的人之一,a16z 的 Benedict Evans 这个人,我非常喜欢 Benedict Evans 展开思考的方式,那位先生最终说过的就是,过去 20 年,不管是 Web 也好,还是 mobile 也好,都是 unbundling Oracle。全部都只是把数据库里的某些信息整理起来,其实只要有那个 Oracle,就能做所有业务,只要有 Oracle 和某种 Web interface 就都能做,但偏偏它分化成无数 B2B SaaS 或 B2C application,并以这种方式发展了过来。所以过去 20 年就是 unbundling Oracle。但 ChatGPT 的时代也不会不同。ChatGPT 和 Codex 能做所有事情,即便如此,这些服务也会作为把 ChatGPT unbundling 之后的各个领域大量出现,他是这样预测的。

兜兜转转,我认为从叫出租车开始,到准备生日派对,再到决定这个周末去哪里玩,然后预订餐厅,会有某个服务商出现,把这些都捆在一起,去做大家想做的事,但如果所有战线都变宽,就不可能防守住所有战线。那么又会在各个单独领域里,出现最擅长做那件事的公司,这样最终转过一个周期之后,就像我们现在的 app 世界,由 Naver、Coupang,以及无数在 Cafe24 上运营的卖家,还有在 Instagram 上卖东西的 influencer seller,以这种方式形成平衡一样,AI 时代也会再次形成那种平衡。所以商业机会会不断出现。

48:17 崔升准 所以刚才您也提到了关于人才画像的事,要具备那种能力,大量使用 AI,亲手做一做 harness,可能是必要条件,但不是充分条件,对吧?这话也没错。

도메인 전문가와 메타 옵티마이저 두 인재상 48:33

48:33 卢正锡 我最近把人分成两类来看,刚才 升准 说的内容,从我的视角稍微展开来看,就是有一种人明确知道要朝什么目标走,知道要往哪里去,对某个 field 有明确的 knowledge,并且能把那个点指出来,由这种人来牵引 AI。还有一种是连那样的目的也不太清楚,只是连那个目的本身也进行 meta optimization,一边把事情 delegation 给模型,一边连目标都去寻找,这样的人。我是这样分成两类来看。比如有一位律师,

或者有一位 investment banking 出身的人才。他们非常清楚在那个 field 里应该解决什么问题,然后也非常清楚他们的同事们在什么意义上不适合 AI、跟不上 AI,而自己已经把 AI 用到了极致,也就是所谓以前曾经介绍过的10x Lawyer 或 10x Banker 那样,完全以 AI native 的方式重新书写那个业务,过去由一大堆人聚在一起的组织所提供的问题解决能力,现在自己想和 agent 一起提供出来,我见到很多这样的人。所以有这样一类人。然后比如说,如果要做新药开发 pipeline,那需要知道的知识也很多,所以有人原本就对这些很了解,知道这里有这个 pipeline,这里正在出现很多 AI 公司,而从时机上看还不算晚,所以我也要面向这样的客户,把这一部分正好用 AI 改掉,然后这样去做,有这种视角的人也有。我首先喜欢的是那样的 entrepreneur 或者首先,我喜欢那样的人才。

OMX 与 B2C/B2B 实验文化 50:33

50:33 卢正锡 但是我所说的那些所谓“年轻仙人”,那些奇怪的人,也常常被很多人贬低。说做出 OMX 这种东西,到底能拿来干什么,但我认为 OMX 本身也是非常好的 product。我最近也重新用得非常多。不过那些朋友在旁边做的事情,毕竟在生命工程、法律,以及这些领域,他们还不是具备深厚 field 积累的年龄或经验,所以他们做的大多数项目都是在进攻 B2C application。代表性的就是角色聊天之类的东西。据说角色聊天 Zeta 现在月营收已经超过2500万元人民币。除此之外,也有一个人或两三个人做出月营收几百万元人民币的公司,还有月营收约260万元人民币的公司。月营收几十万到上百万元人民币的公司也正在不断出现。而这种形态的 B2C 会大量出现,其次是传统上已经大量存在的B2B SaaS application。这些部分,即使并没有准确理解 B2B 的逻辑,只是靠那种点一点、点一点就做出来的人,现在也正在变多。升准在旁边也会看到很多。

那些人只是把目标物放在那里,然后跑 auto research。把 Ralph loop 和 auto research 合在一起跑,连他们自己认为是默会知识的部分,也直接 delegation 给 AI。所以连 goal optimization 都下放到 meta layer,连那个也依赖 AI 去寻找 goal,然后非常快速地追上自己原本不足的 field knowledge,这样的创业者群体,这样的人才群体,我正在看到。所以现在我把 talent大致分成这两个目标来看。但这两种 talent,升准,我已经默认他们两边都在极致地使用 AI,这个假设我已经全都做完了。在 Claude Code 或其他这类东西上,通过 OpenCode 这些东西,把自己的 workflow 全部自动化这件事,我已经把他们看作是都毕业了的人。在此基础上,再乘以、再加上,要解决什么问题,以及如何装载那种 sense,我问的是这个。说实话,AI 工具的 readiness,我现在已经觉得这就是理所当然必须带来的必要条件。那样的话,我也有点苦恼的部分是,

meta 学习与领域内化的边界 53:14

53:18 崔升准 我自己也还没有明确抓到一个形象,但刚才您说的后一种情况,只在 meta level 给出目的性,就能让它自己去做的那种 talent 的人,即使用 AI 用到极致,即使不把学习内化,不达到刚才前者那种水平,不在某个 domain 里完成跃迁,也能持续吗?我认为是可以的。

53:46 卢正锡 其实我最近在学习 longevity 和生命工程的时候,正是在借用那种方法论。我不知道的东西太多了,如果从底层开始一点一点积累,一边学习现在本科和研究生水平的,比如说分子生物学课程里的全部 curriculum,再越过它,那对我来说会花非常多时间。但我没有那样做,而是看已经在那些领域创业的公司,以及已经发表出来的 paper,这些东西,甚至连那是什么我都不知道。

但连这些我也交给 OpenCode,我在用 OpenCode。用 OpenCode 里的那个 loop,把它和 LLM 绑在一起,我最近也在让它跑任务,交给它之后,它会把我不知道的东西一大堆一大堆带回来。应该是 Codex 带回来的吧。Codex 里装着的 search engine也会再带回来,我不会深入到那里去,所以它就把所有东西一路整理好,告诉我如果想用最短路径达成想要的东西,应该怎么做。一页、两页地铺开。然后如果里面出现我感兴趣的东西,我再深入进去,它又在那里继续拆解、拆解、再拆解,几乎是在扮演永恒 tutor 的角色。所以我试着做了一个月之后,所谓刚才升准说的那种,

我原本对这个 field 什么都没有,但一个月过去之后,即使和在这个 field 做了几年的人聊天,也大致能进入 context 对得上的阶段。只用一两个月。这里有循环论证。

55:28 崔升准 正锡可能本来就不是 B。可能不是后一种。因为 position 本身已经有某个领域的 domain knowledge,所以才能把它内化。其实我正想坦白这个。

55:43 卢正锡 说只做了一两个月是假的。这其实是因为我一直有兴趣,几乎十几年里一直在读相关书籍和这些东西,大致的基础已经铺好了,所以才做得到。实际上说一两个月就把一个全然陌生的领域master 了,这显然是假的。这说不通。所以我觉得升准说得应该是对的。

但是 B2C 或 B2B application这些领域,不是可能做到吗?从系统或事情运转的层面来看,我也认为是可能的。

56:19 崔升准 所以让 business 可持续是可能的,但我比较在意的是,在个人的成长和发展上,这件事也不会被消耗掉。因为现在使用 AI 的时候,刚才也举了辉东的例子,

同时并发地做极其大量的事情,一边 context switching 一边做,所以最近不是常说会消耗 bio token 吗。那样的话,人的大脑要把那个通过学习内化下来,其实我觉得会很难。工作是可以完成的,

但也正因为如此,马上用这些东西做出业务,并把它实际变成产生收益的事情,也许可以持续,可是在其中个人的发展也能持续吗,以正锡的情况来说,因为正锡花了足够多的时间去学习那个,所以会有收获,但在不是这种状态下不停下来,持续把工作处理掉,这样健康吗,就会开始思考这些问题。这可能是吃饱了撑的说法。

AI psychosis 与多巴胺老虎机 57:12

57:14 卢正锡 那就和 AI psychosis 这个说法联系起来了。最近 AI psychosis 这个词出现得非常多,请你解释一下这个。在 Sarah Guo 那期里,Karpathy

57:29 崔升准 说自己现在处在 psychosis 的状态,去年 10 月左右出演 Dwarkesh 采访的时候,还说是在 Cursor 里按 Tab 这样做,诸如此类,是一种谨慎地使用自己大脑的方式,但 OpenClaw 出来之后就产生了 FOMO,现在转向把所有东西都 delegation 给 agent,说自己现在一直处在多巴胺爆发的某种过度沉浸状态里,所以提到了 psychosis。

不过 Karpathy 毕竟原本就有这方面的功底,所以好像能很明智地承受并善加利用。但最近提到 psychosis 的语境里,是说虽然确实能做到,但有点像病症。像精神病,像精神症状。这东西太容易让人过度沉浸、无法抽身,有这种让人消耗的部分。这就和刚才说的老虎机连上了。是啊。所以我也像是经常感受到那些东西,

58:30 卢正锡 如果把要做什么写进待办事项清单,就会产生一种好像已经做完了的错觉。因为只要让 AI 去做,它就会做。所以那些特别明确的事情,

反而会被我推迟。不过现在我只是从稍远一点的地方看整体氛围的话,这个市场或者社会的激励机制,正如刚才说的那样,正在奖励那些能把眼前的 agent当作基础体能来使用的人,所以必然会出现很多维持过度沉浸状态的人,这是不是一个他们不得不诉说疲劳的阶段。虽然不知道这会持续多久,但我会有这样的想法。这并不只是工作才这样,其实现在如果放在以前,

本来可以在小区里平静地过一生,但现在只要打开手机刷 Twitter,从最上面的 Elon Musk 开始,到就在我旁边的同事为止,所有人的生活状态都会显露出来。然后谁又赚了多少钱,这不只是说从 OpenAI 跳到 Meta 的那位工程师拿了超过5亿元人民币,也不只是这种故事,就连我旁边买了 SK Hynix 股票的人和没买的人之间,诸如此类,大家也会经常说所谓 FOMO 爆棚这种表达,所以人在这些人之间承受的压力,真的不是开玩笑。

59:54 崔升准 前不久简单介绍过的 Cat Wu 那个采访里,看 Lenny 整理的几乎后半部分,有一种在寻找能够承受这种混乱局面的人才的语气。昨天刚刚出现了一个 P0 issue,那个 0 本来还是一位数,到第二天下午就变成 00,成了两位数,能承受这种变化局面的人。但是如果 Anthropic 要招聘的话,在具备基本能力的状态下,他们说是在寻找能够享受混沌的人,这一点让我印象很深。但这其实是一个很令人不适的真相,

Cat Wu 所说的享受混沌的人才画像 60:03

60:33 卢正锡 事实上,我们现在所说的好工作,是指拥有某种稳定的头衔,只要不费太大力气持续重复稳定的工作,就能有高收益的那种地方,我们会说那是好地方。而那种好位置,某种意义上简单概括就是医生或者律师们。虽然是非常辛苦的职业,但为了得到那个位置,付出巨大的努力走到那里之后,即使进入某种 routine,也能在一定程度上得到保障,一辈子都是那样。

刚才说的,其实一般公司也没有什么不同。我只要说我是工程师,我是 PM,我是设计师,然后把明确落下来的任务在单位时间内处理完,那本身就是有意义的。也就是说,那是拿我的 intelligence 去交换的东西。而且一旦熟悉之后,就会越来越,我们之前学过 amortize 这个表达,只投入一点点,却可以长期吃到收益的那些东西,对我们来说就是好工作,但其实这样的工作现在正在全部消失。

这些东西,如果再回到刚才 Cat Wu 说的内容来看,所谓承受这种不确定性,

并且能在其中做决策的人,反过来说是什么呢,要能承受这种不确定性,就必须持续 catch up 不确定性,那意味着无论如何都要不断接收信息,学习,持续做决定,并不断动脑。thinking token 要这样才能先把它接收进来。还要越过接收这个阶段,才能在那里做出决定。但训练这些能力的地方,

其实除了所谓真正做事的某种 manager track,entrepreneur track、创业 track 这些 track 之外,并不太存在。所以说到底,Cat Wu 说的也是这样,别的也一样,我们今天讲的这些也是这样,绕来绕去再绕回来,最终都会走向这样一个结论:需要的是能够承受并管理不确定性,并在其中做决策、采取行动的人。如果极端概括的话。是有这样的部分。

62:58 崔升准 不过另一方面,也会出现这样的说法。这是什么呢,就是放进 PyDev OpenClaw 里的做 py 的 Mario Zechner 在今年 3 月说过的话,是在谈关于这个有点无法维护的问题,以及相关的苦恼。所以有些部分确实需要慢一点推进。

Mitchell Hashimoto、Mario Zechner 的警告与精英狂奔之后的课题 63:01

63:17 崔升准 不过类似的话,昨天还是前天 Mitchell Hashimoto 也说过。所以你看这里,因为推进得实在太快,现在人们在说的是,最终即使这是由 AI 完成的,只要有测试覆盖率,能验证它是可运行的,那是不是就没有问题了,Mitchell Hashimoto 又把这种说法比作 psychosis,讲过这样的话。但是在这样相信 AI 然后一路跑下去的过程中,表面上看是在运行,但实际上从整体架构上看,可能有什么东西已经坏掉了,而且这种东西可能正在不断累积,确实有文章在担心这一点。这里说的是稍微不同的 psychosis。不过 Mitchell 的意见是,

不管我怎么讲这件事,处在这条轨道上的人也不会接受。对。就连那个问题本身,

64:15 卢正锡 现在也已经到了全部 delegation 掉的阶段。以前我会让 AI 处理我们公司最核心的业务逻辑,比如广告管理,或者根据效果表现应该做哪些调优之类的事情,然后 AI 出来的报告,比如关掉哪个、打开哪个、做哪个,这些我以前会亲自看。但最近我就直接把它跑 Ralph。

出了结果以后,我就跑三次 Ralph。三次都说对的话,我就直接按那个按钮了。让它照那样做。

我最终其实就是一种非常理想主义的思维,认为所有问题都可以还原成 compute 来解决。然后这里还有另一个假设,就是模型比我更强这个假设。所以这个我并不是说

65:12 崔升准 Hashimoto 的话 100% 正确,而是说有这种担忧的一方,当然以前也一直存在,但像 Hashimoto 或 Mario 这样的人,本身也是想使用 AI、也想把它用好的人,他们也在从这个方向谈,所以我才拿来讲一下。所以我们刚才只是在谈现象,而且谈这个现象时,把那些走在前面的人

엘리트 질주 이후 남는 과제 65:31

65:39 卢正锡 当作一种形象来讲的话,事实上,那些走在前面的人很可惜,不管怎样,几乎大多数都是处在社会某种前沿位置的精英阶层。那么,是的,那些人即使我们不担心,也会自己做得很好。坦白说,就让他们走吧。然后从我们的立场来说,如果能投资那些人的公司就好了,如果能得到这样的机会就好了。那么在这之后,今天我们谈的是 AI 相关的,也谈了 AI talent,那下一阶段会是什么呢?首先,真的很会使用 Claude Code 或 Codex,你觉得这是必要的吗?我是觉得有必要。我也同意这一点。

66:26 崔升准 现在要有善用 AI 的经验,不过也不是无条件的,如果年纪太小,我觉得会有点麻烦,我现在是比较倾向于这个看法。在思考能力已经培养到一定程度之后,至少要知道现在能做到什么。

주니어 학습 박탈과 AI 가상 훈련장 66:39

66:46 崔升准 也要亲自试试看。以前我听 Latent Space 播客的时候,有人,应该是 Alessio 回答过,我不太准确记得当时的上下文,现在大家不是在说 junior 们的学习机会都被剥夺了,这是个大问题吗。那时候 Alessio 是那样说的。啊,那就用 AI 做一个训练他们的场域,让 AI 严格训练 junior 们之后,再让他们毕业就好了。虽然实际工作中并不需要,但把那种虚拟的训练工作用 AI 假造出来,让他们在那里做,等在那里完成一定程度的训练后,再把他们往上提就行。所以教育业务可以朝那个方向准备看看,我突然想起他说过这样的话。不过,聊着聊着,

总是会走向让人不舒服的一边。

其实我们不是挺高评价 Dwarkesh 吗?所以通过 Dwarkesh 那一集,而且 Dwarkesh 今年大概二十,用韩国年龄算是二十六吗,总之是很年轻的人。但如果浏览一下他最近在讲的内容,他拍了 Michael Nielsen 那一集。Michael Nielsen 也曾在 YC Research,Greg Brockman 或 Chris Olah也会提到这个人。说自己是看他的书学习的。

Dwarkesh 的学习法与施加负荷的工作 68:02

68:14 崔升准 而在那期 Michael Nielsen 节目里,Dwarkesh 从 Michael Nielsen 那里得到的建议是,做给自己施加负荷的工作。所以他说过这样的话。“Make some kind of demanding artifact, write something.”总之,就是做某种会给自己思考施加负荷的工作,这会把你的学习引向下一阶段,大概是这样的语气。

所以看 Dwarkesh 的做法,这个人一方面非常会使用 AI,同时也很明显能看到一种有意识地去学习这些东西的态度。同时又抓住中间的位置。最终在 Michael Nielsen 的这条建议附近,Dwarkesh 已经在思考的东西,以及要摆一块黑板来做学习 session 这件事。

昨天他又上传了从 scratch 实现 AlphaGo这类内容的学习。甚至网站上也已经出现那个了。出现了 flash card 列表。在 Lenny’s Pod 那一集之后,昨天那一集,Eric Jang 那集也上传了,他自己做了 deck,做了题目 deck,让自己去解这些题。

所以这一切,都是为了更好地记忆使用 Anki 之类工具的时候,会隔开间隔来学习的那种技巧,不是有吗。Dwarkesh 也从以前开始就对那类东西感兴趣,并且一直在实践。

而且是在自己的语境里设计学习路径,不是只让我会用好 AI,而是提升自身能力。

但这个 Dwarkesh 也已经作为非常独特的存在崭露头角了,所以也到了很难贸然一般化的程度。但我是觉得,像这样不只是把 agent 用好,

也要把自己的学习能力提升起来,这件事不能疏忽。

69:53 卢正锡 没错。当然这未必是标准答案。是啊。不过以前即便说

我不想过这样的生活,也还有很多不错职业可以选,但现在的问题是那些正在消失。现在说到底,那些帮人复印文件的几类工作,除非是真正很像公务员的地方,否则企业里持续把这些岗位去掉,已经是趋势了。

slow AI、mind-sized bites 与 I/O 之后的创业公司格局 70:17

70:17 崔升准 所以我最后还想提一下的是,虽然有很多学派,但也确实有 slow AI 学派。也就是说,以前就有一个说法,叫作“mind-sized bites”。意思是我的心智能够消化的一口大小。这是 Seymour Papert 说的话,虽然可以通过 AI 做成很多事,也可以执行工作,也可以学习,但归根结底,那个东西必须是我能够完成的大小的片段。正因为如此,不是去配合 AI 的节奏,而是希望以适合自己的方式来做,这样谈论 slow AI 的一派正在逐渐出现。

但我一边觉得这话没错,同时刚才听 正锡 的话,从短期来看,现在这个时代的激励本身好像就是要求人利用 AI,把它作为基础能力,快速处理大量工作,具备这种 orchestration 能力的人,似乎也是很多职场所需要的。可是那样做的话,消耗又是必然的。所以我也有点不舒服,但想法一直在原地打转。我们现在也感受到的是,和 6 个月前已经很不一样了。

I/O 이후 스타트업 지형과 자본 분산 71:25

71:27 卢正锡 很不一样,而且和去年夏天相比,现在又完全不同了。今年马上后天的 Google I/O 一过,又会有大量新形态的创业公司不断冒出来。最近看 Y Combinator 的批次也是,比起我们熟悉的一般形态的业务,更会觉得,啊,现在大家都在朝各自的方向奔跑,大量子类别正在不断出现,我经常有这种感觉。那么关于这一点,我最后也想问一下,

72:02 崔升准 刚才说确实会有某种新的应用,但具体是什么,其实还不知道,对吧?我们知道的只是,它的形态大概会是 harness 的

72:12 卢正锡 AI 服务。对。但因为不知道具体是什么,

72:19 崔升准 所以现在发生的很多事情,是在许多市场里撒下一些基金,去发掘那些能把它做出来的人,是这样一个阶段。应该都是混在一起的吧?

72:34 卢正锡 资本会以那种方式,向那些能够打开某种新东西的talent 大量撒钱,也会想在这方面做 diversify,做分散化,想要进行对冲。但制造这些问题的人,会想尽快拿到那些资本,让自己梦想的未来成为正确的未来,会有想把那个未来改写掉的心情。以前一个业务成长起来需要 10 年周期,现在看到它几个月周期也能成事,于是现在人们就会,怎么说,比起退到后面,说我闭嘴、与世界隔绝,走我自己的路,尽快所谓“出圈”的激励被强化了。

收尾:迈向第 100 期 73:28

73:28 卢正锡 我有一种相似的既视感,和演艺圈很像。

73:33 崔升准 怎么像呢?

怎么像呢?就是票房式生意。

有点是说,要有知名度或品牌价值那一边。

73:42 卢正锡 对。所以以前 正圭 代表来节目时,也说过是不是品牌的时代又要开始了,之类的话。但我现在从商业的角度看,从商业的角度看,会觉得,啊,现在比起制造某种东西的 build 能力,品牌和 distribution 变得更重要了,我会有这种想法。当然,如果我能创造那个品牌,那是最好的。

而把那种品牌做成自己的方法,又会回到营销最基本的东西。就是回到 positioning。所以如果别人已经有东西,就不要去那里做,而是创造自己的东西,并在那里成为第一。比起永远成为最强、成为更好的东西,最好的其实是成为那个唯一的东西。也就是成为 only one,而当你成为 only one 的时候,只要市场规模有意义,就能养活自己。而这些部分,我反过来用最近流行的话来说,

서브 컬처와 AI 거부 시장 74:42

74:44 卢正锡 subculture。年轻人看重的东西,从传统观点看,很多时候已经不是好房子、好车,这种情况非常多。是的,社会上的某种地位,好房子、好车,并不是成功的标准,而是各自建立自己的社区,在其中追求各自的某种价值,这样的事情正在变多。过去这件事本身常常被说成,啊,那是没能成为 mainstream winner 的人们组成的那种群体,甚至会用 subculture 之类的词来概括,不是那样的。它本身就是正在成为一个独立的世界,所以我认为这也是非常值得关注的趋势。

决定不使用 AI 的人也可能会增加,如果这种人越来越多,并形成某种新的势力,那就是市场。那样的市场也会出现吧。所以我觉得它是活着并不断变化的。今天我们其实没有做太多准备,

100회 기획과 커뮤니티 아이디어 요청 75:45

75:47 崔升准 就这样聊了各种话题,度过了一段时间。不知不觉我们也快走向第 100 期了,而且也有已经约好的嘉宾。下周还有 Google I/O 之类的活动。

76:01 卢正锡 是的。真是忙得不可开交。

76:04 崔升准 消息一直不断,但无论如何也得继续做下去。第 100 期要做什么呢?我们需要一些第 100 期的点子。

76:11 卢正锡 想给我们提出第 100 期点子的各位订阅者们。以前我们办过一次 逃亡者联盟 聚会,那时候 升准 和我都投入了太多精力,其实从去年冬天以后到现在差不多已经过了半年,但我们还真有点不敢再办。

76:31 崔升准 因为我们多少也有点年纪了。是啊。

年轻人 meet-up 的那种速度,我们确实跟不上。没错。其实我们现在也不能只靠我们两个人把这个全部撑下去,

76:43 卢正锡 确实到了需要尝试一些变化的时候。好,总之今天也是在周末

76:50 崔升准 这样分享了学习收获。谢谢。

76:55 卢正锡 托这个的福,我也整理了不少想法。好,升准,那剩下的周日也请好好度过。我们下周再见。