AI Frontier

EP 79

AI Frontier 逃亡者联盟回顾 & GPT 5.2

· 卢正锡, 崔升准, 金成贤 · 1:05:25
整页
查看本期参考资料

开场:2025年12月14日,GPT-5.2 更新 00:00

openai.com openai.com

00:00 卢正锡 今天我们录制的时间是 2025 年 12 月 14 日,周日早晨。时间又在飞快地过去。本来以为到年末能稍微歇一歇,结果 GPT-5.2,5.1 又加了 0.1 进位升级了。变成 5.2 之后,变化还挺大。大概也是为了牵制 Gemini 3 才出来的吧。

00:25 崔升准 是的。现在时间线上有很多消息说 OpenAI 正承受很大的压力,所以必须拿出点东西来。不过你说你特别关注了一个 eval,对吧?

GDPVal 暴涨与智力劳动商品化 00:35

GPT-5.2 Thinking 与 GPT-5.1 Thinking 的 GDPval(知识工作获胜或打平)得分对比图表。图中显示 GPT-5.2 为 70.9%,GPT-5.1 为 38.8%(GPT-5)。

00:35 卢正锡 对,我重点看的是这个叫 GDPVal 的指标,就是现在这张表最上面的那个。其实它是 OpenAI 在发布 GPT-5 时一起推出的基准。大概针对 44 类真实的人类职业,做了约 1300 到 1500 个 task 作为 evaluation set,目的是看它在“人类做的工作”上到底能做得多好。

不过它在 GPT-5.1 时大概是 39 分,到 5.2 就到了 70 分。原因可能很多,我们也不知道。可能是针对 GDPVal 对应的人类工作领域,生成了大量 synthetic data 放进 pre-training set,也可能是围绕这个方向强化了 post-training。配方我们不清楚,但关键是,我们以前说“模型做不了这些”的那些人类特有智力劳动,正在被迅速 commoditize。

更惊人的是它的成本。完成这些任务,估算只要给人的成本的 1%,几乎就是电费。而且处理速度快了整整 11 倍。哪怕是今年年初,我们还在讨论“AI 继续发展下去会不会替代我们的工作?”这是当时甚至会说“解开这个就是 AGI”的那类 benchmark。

02:22 崔升准 一年前,大家都说旗舰模型做不好这个,还说“这个必须做到才行”,现在已经做到了。连难度更高的 Tier 2 也在做到了。

02:32 卢正锡 benchmark 都显得失色了。当然 benchmark 一出来,benchmark 本身就会变成目标。我们在 RL 里不是学过这个教训吗?目标一旦设定,只要能给这个目标奖励,只要能做到 verifiable,模型就能把它完成。这已经是我们总结出来的新规律了。就是能做到。

02:58 崔升准 所以现在出现的模式是,只要做出 benchmark 就会被攻克。也就是说,做 benchmark 就行。虽然有点本末倒置,但确实有这种感觉。

METR/Epoch AI 时间跨度与 Gemini 3 Pro 4小时 03:08

x.com x.com

03:08 卢正锡 所以 Epoch AI 的这个图,下面这块看得很清楚。

03:12 崔升准 这个目前是估算,METR 还没有正式发布,只是做了推测。不过现在是 11 月,已经过去差不多一个月了。Gemini 3 Pro 虽然在图上是线性表达,但本质是指数式进展。在“达到人类 50% 表现”的时间跨度上,它已经做到 4 小时了。

03:43 卢正锡 所谓 4 小时,就是它已经能完成人类需要 4 小时才能做完的工作。

03:51 崔升准 对,对。所以才会有这个估算。如果按这个趋势走,明年这个时候就会达到人类 full-day,也就是 8 小时的工作量。

04:00 卢正锡 对。你说“明年这个时候”,听起来好像再过 3 个月就到了。我们开玩笑说“一个月像一年”,现在可能得改成“两周像一年”了。这样的变化正在不断出现。

04:16 崔升准 这就很麻烦了。

04:18 卢正锡 没错。按人的速度确实很难跟上。

04:24 崔升准 而且我们刚说完这些,下周好像又有发布。

x.com x.com

Sam Altman(@sama)的推文。12月12日发布,配文为“Also, we have a few little Christmas presents for you next week!”,显示有 1.5K 条评论、974 次转推和 13K 个点赞。

04:31 卢正锡 可能是年底前 Google 想再压 GPT-5.2 一次。确实有一些消息和观察说 Google 还会有动作。与此同时 Sam Altman 也不甘示弱,说“我们下周也会再放点东西”。

youtube.com youtube.com

04:45 崔升准 我没把那页图拿来,但如果看今年发布模型的时间点分布,后半段明显更密集,集中爆发了。这个趋势很夸张。我们周四那期因为这周信息没那么压缩,其实也没时间细看。结果周四我们活动快结束时,OpenAI 发布了这支视频,说他们 10 周年了。

OpenAI 十周年,性能与价格竞争及“成本价”收敛 05:07

05:18 卢正锡 原来 10 周年了。

05:21 崔升准 对。10 年前还是那样。

05:28 卢正锡 10 年前我们还在聊 convolutional neural network,聊 ResNet 那个时代。

05:42 崔升准 重点就在这句:“现在才刚开始。” “你今天用的模型就是最差的模型。”

05:53 卢正锡 没错。我从某个时候开始,也不太继续跟踪这个“性能/价格”,也就是 token 价格了。当然中国模型现在确实比美国 frontier 模型便宜很多。

06:00 崔升准 啊,为什么呢?

06:09 卢正锡 这有点像纳什均衡,一种鸡博弈。大家都在往均衡点冲,而那个均衡点大概率会到成本价。所谓成本价,本质就是电费加设备折旧摊进去之后的价格,接近 0 的低价。现在我们不会说“电费太贵所以做不了这个”吧。那当接近无限的 intelligence 回到我们指尖时,那些我们认为属于“人类价值”的部分,会在极短时间内承受这种变化速度。这就是差异。所以更难。

孤独与不安:为什么人们开始聚在一起 06:46

06:46 崔升准 所以我们一直在聊这些,也会聊些低落的话题,尝试理解这个世界,努力学习才聚在一起。这个从 2023 年 5 月开始,到现在有 2 年半了吗?差不多是吧。

07:02 卢正锡 我们做这个已经 2 年半了吗?挺久了。

07:09 崔升准 之前我们说过,好像有点孤独,但不只是我们孤独。

07:14 卢正锡 我们不是开玩笑,而是有明确目的,想找一些能一起看向前方的人才开始做这件事。结果收到的报名太多了。不仅人多,报名者的背景也非常好,所以我们从大家提交的内容里学到了很多。共同关键词如果要说的话,就是大家都焦虑、孤独、痛苦,不知道该往哪走,和我们感受到的情绪几乎完全一样。所以我们觉得这些人先得聚起来,先互相安慰,交换彼此拥有的东西,然后建立联结,于是办了这个活动。后来这个活动因为升准,还有有珍,变得非常丰满。不再只是聚着喝咖啡、喝啤酒聊天,而是发展成了生成式 conference。这个你来分享一下吧。

“逃亡者联盟”首次 sync-up:打造生成式会议 08:29

08:31 崔升准 所以上周四“逃亡者联盟”办了 first sync-up,也就是同步聚会。正如刚才说的,我们搭了一个空间,然后很快就生成起来了。“逃亡者”这个说法,是在我们节目里卢正锡一直说要逃去某个地方,“要逃”,后来某一刻就固化成这个词了。

08:53 卢正锡 当时我们的起点就是:frontier 模型正在把我们原有的东西都拿走,那我们要去哪里找活路?所以中间我们经常会说“快逃吧”,后来变成“那样的人,就是逃亡者”,结果我们也把自己定义成“逃亡者”了。

“逃亡者联盟”活动开场演讲场景:演讲者站在讲台前,大屏幕上显示着“致一起度过这段艰难时期的同伴们”“辛苦了”等文字。

09:17 崔升准 对。也就是想聊聊 frontier 之外在发生什么。我们从 AI 爱好者、重度沉迷者的角度去看这些事,结果很多人报名说也想看同样的风景。最后来了大概 140 人,在 B 工厂这个很好的 venue 里办了活动。现场很热闹,先是餐饮社交,之后进入各个 session。最开始卢正锡那页 slide 挺有意思,对一起经历艰难时期的同伴说:“辛苦了,要不要先互相夸一句再开始?”是这么开的场吧?

10:00 卢正锡 对,对。感觉大家需要先互相安慰一下。是的,我自己也得到了很多安慰。

10:09 崔升准 所以我们确实留了一小段时间互相打气。然后说到了“像过一年那样去活”的时期,是什么来着?

10:17 卢正锡 我说的是“要把一个月活成一年”,但就像前面说的,现在是不是该改成“两周活成一年”了,我在这么想。

Panel、小组、AMA 运营复盘与现场能量 10:27

“逃亡者联盟”小组讨论现场:在昏暗空间中,约 40 名观众坐在椅子上,望向前方的 3 位嘉宾。前方是设有屏幕和灯光的舞台。

10:27 崔升准 对。我们也做了 panel 讨论。然后小组 session 不是当天即兴 unconference,而是提前规划、先共享资料、到现场再进行 45 分钟深度讨论的那种。

10:50 卢正锡 对,45 分钟一轮,共 3 轮。我们正式日程 7 点开始,所以 7 点一轮、8 点一轮、9 点一轮。我原本以为到 9 点大家大多会走,结果完全不是。几乎大多数人都一直留到最后,我被那个能量水平震到了。

AMA 现场:在会议室里,一名演讲者站在屏幕前,左右两侧有 12 名以上参与者围坐在圆桌旁,观看并讨论标题为“Process Innovation: 고객의 여정과 황금”的幻灯片。

11:11 崔升准 我也很惊讶。after party 那部分,也就是结束后再延续 1 小时交流,很多人也都留了下来。然后在 35 人房里,邀请了正在激烈思考问题的几位,像 오순석、김민석、申正奎,听了 AMA 发题也做了 AMA,据说当时气氛也很热烈。是李京浩帮忙做了 moderating,对吧?就是在 LinkedIn 很活跃的那位。

11:38 卢正锡 他帮我们做了很多整理,所以那边的内容记录得很好。还有那些很难请到的嘉宾也来了,还非常爽快地分享,借这个机会再次真心感谢大家。

11:48 崔升准 没错。这张图是从视频里截的屏,是 언볼트 的 정윤혜 做的。还有一直负责剪辑的金有珍,如果她也到了现场,估计很多人都会围着聊。还有我们的 co-host 金成贤,大家也在找。

12:10 卢正锡 问“金成贤为什么没来”,对。

12:17 崔升准 所以这些问题后来都被共享了。这个不是原始资料,我做了匿名化,也做了再生成处理,所以保留了语气但不是原文。最开始 21 个房间都是空白。

12:30 卢正锡 对。我们还担心这 21 个格子能不能填满,结果是杞人忧天,很快就满了。

12:45 崔升准 对吧,我不是说会成吗?因为有空间,又有很多人积极参与,所以才做得到。session 是自组织起来的。

12:51 卢正锡 对,我在场内转着看大家讨论,东听一点西听一点,内容都太有意思了。每个都想坐进去完整听完,挺遗憾没法分身。参与者应该都很有意思地度过了。

13:09 崔升准 对,我在 networking 时也收到了反馈,说 45 分钟不够,后续还在计划再聚,而且热度高到有点 overbooking。

Discord 归档与自组织如何发生 13:21

13:23 卢正锡 对,所以这些问题某种程度上是我想知道“现实里到底有哪些问题”的快照。既有商业问题,也有非商业问题。我主要还是更关注商业问题,所以更多看了商务 session 和相关发题,挺有意思的。

brunch.co.kr brunch.co.kr

13:44 崔升准 这些资料现在都在 Discord 里做归档。所以由问题持有者提出问题,再由对这些问题感兴趣并提供想法的问题解决者参与,再加上善于做时间管理和记录、并把讨论维持在有意义方向上的 moderator,这样一来活动就通过自组织“啪”地生成成了 conference。所以我们给它取名叫“生成型 conference”。

所以即便是相近 domain,不同的人相遇时也会出现“一个向量投影到另一个向量会变短”的自然现象,所以我们也提醒了参与心态要考虑到这一点。再加上这是复杂且多元的现象,从不同位置去看就能得到不同 insight,所以也传达了这种意象。 所以现在 Discord 上正在进行复盘。现场留下的照片和文本记录都在共享,也在推进“学到了什么、忘掉了什么”这类内容。另外也在讨论如何改进这整个过程。

再简单补充一下:我当时的想法是,先搭一个多层次、多样化的空间,轻轻 nudging 一下,就像 Dario Amodei 和 Jared Kaplan 说的那样,只要有空间、有条件、有温度、压力、湿度,然后等待、让计算发生、让自组织发生,就会涌现出有趣现象。确实是很有成就感的经历。不过这件事在这里同样需要时间,未来也会继续需要时间。

youtube.com youtube.com

15:29 卢正锡 所以以这个社区为起点,很多人也觉得意犹未尽。我们并不是想把它做成一个高度封闭的社区,而是觉得要先把一些雪花组织起来,再逐步向外开放,所以才先小规模开始。如果一开始所有人都进来,在基本 fractal 结构都还没形成时就向外扩散,效果会不好。可以理解成我们现在正在设定一些初始规则。

16:02 崔升准 对。现在这个阶段从某种意义上说也是 entropy 很高的区间,潜在方向很多。我们也是在试错中推进,去摸索怎样走向更好的方向,所以还需要一点时间听反馈、找下一步。

复盘要点:激励不对称、隐私、开放性 16:18

16:18 崔升准 我想讲一下复盘最后的部分。最初的问题某种程度上确实缓解了,但回头看仍有几个让人纠结的点。第一是这里的不对称。问题持有者和问题解决者之间有一个不对称点。就是 Discord 上有人很直白地问过:问题解决者的激励是什么?

所以这个也得继续想。然后是问题持有者稀缺。再结合听 오순석 的发题,某种程度上是“问题持有者在解决问题”。而现在的方向里也有这一面,所以今天没法马上理清,但我觉得这是要持续思考的点。也就是说,能带来“问题”的案例反而更少,而把 AI 当杠杆去解决问题可能是更丰饶的区域。

17:33 卢正锡 是啊。我们某种程度上还被过去束缚,所以总想把“持有”和“解决”二分开来。但我们也说过,问题就是一切。Right questions are all we need。虽然是半开玩笑,但意思是只要问题提对,解法 AI 很快就能给出来。 那换句话说,最终就是“问题持有 = 解决”。

18:01 崔升准 这和你后面发题最后一部分讲的内容就完全扣上了,就是你说的 entrepreneur。

18:08 卢正锡 感觉一个把所有人都推向创业者的世界很快就会开始。对。而且不再是“有一个大供给方、有人被雇佣、有人消费”的结构,而会变成一种热闹的 forum 形态,甚至分不清谁是供给者谁是消费者,这可能就是新市场的样子。我们自己也是啊,在某些 industry 是供给者,在别处又是消费者。都有这种双面性,而这条边界本身正在全面 blurring。也许正像 Alvin Toffler 在《财富的未来》里说的,大家都要成为 prosumer 的那种生活已经来了。

18:53 崔升准 从这个视角看,像“拥有某个空间”这种事,换种说法就是地租、地租重要性,也会引发很多思考。经历这次活动后,确实浮现了不少 analogy。

19:10 卢正锡 这些意义会慢慢显现出来的。我现在脑子里也有很多概念在漂,有时某天早上会突然冒出来。

19:18 崔升准 另外我们设了 moderator 这个角色。在 session 内做“织网”这件事,我觉得发生得比预期好很多。但在 session 外做 networking 时,面对那么多信息,连接到底发生了多少,我很好奇。

以及那种情况下,现有其实也有很多能“交易问题”的平台,比如 숨고、还有 당근마켓 某种意义上也是。那么相比平台,那些想做连接的人,他们持有的才能该怎样更好发挥,我觉得也是个思考点。

还有这个我也非常担心。因为在 Discord 上大家会公开“谁在做什么”,结果个人信息共享太多了。这点很纠结。不公开就不知道、也见不到;公开了又会变成隐私暴露过多。现在确实有这种担忧。 还有一个是,我从朋友和其他人的反馈里也听到:你们这哪是“逃亡者”,这不就是“全力冲刺的人”的聚会吗?

20:51 卢正锡 对,没错。所谓“逃亡者”其实是对“为了寻找某个东西而全力奔跑的人”的一种反语表达。

21:00 崔升准 对。所以从某种角度讲,我们在约束条件下也采访过一些问题解决者,这次又以社区方式办了生成型 conference,尝试让很多人彼此连接,在过程中也暴露出很多有趣问题。不过外界看来,也会有“是不是在搞小圈子联赛”的反馈。这个我们之后也可以更坦诚地聊。

21:29 卢正锡 好,那我们往下走吧。

AI 新闻:Andy Jones“马(Horses)”·Amanda Askell·Shane Legg 动向 21:30

21:30 崔升准 好。与此同时,AI 模型发布和 AI 新闻可不会等我们。

21:40 卢正锡 世界一直在变化。

claude.ai claude.ai

Andy Jones 的博客文章《Horses(马)》中的一张幻灯片。包含 4 张图表:美国马匹与汽车数量变化图、Anthropic 问答中 AI 回答超过人类回答的图表、相对于 AI 研究人员的成本对比柱状图,以及全球 AI 资本开支趋势图。

21:42 崔升准 风景每分每秒都在变。一个很奇怪的感受是,Anthropic 的 Andy Jones,就是那个和 Noam Brown、Igor,以及在 xAI 待过、我们提过几次“游戏里的 scaling law 对推理模型的含义”的那位。他写了一篇很有意思的博文《马(Horses)》。压缩说一下,这里有页图:某个时刻马消失了,但马自己并不知道。然后在 Anthropic 内部,他原本要回应大量新员工的问题,但某个时刻 Claude 的回答几乎都能解决,于是他自己的工作,也就是 Andy Jones 本人的工作,正在指数级减少。那页 slide 大概就是这个意思。

所以他在说自己是不是就处在“那张马图”的这个位置。当然也有人批评这个“马”的比喻太扁平。不过这大概是上周的一个话题。然后 Anthropic 的哲学家 Amanda Askell 的访谈里也有很有意思的部分,这个受限于时间我之后再回来讲。我和 Claude 围绕这个聊得很有意思。那个 “soul document” 是上上周还是上周的热点,借 Amanda Askell 的说法,Claude Opus 4.5 在谈这个时也表现出“这里有些很有意思的点”的认知。

然后这里我想和你聊聊。Shane Legg 出来了吧。下周好像还预告了 Demis Hassabis 篇。Google DeepMind《Thinking Game》纪录片之后,感觉在走“听创始人叙事”的策展路线。你怎么看?

YouTube 缩略图。Google DeepMind 联合创始人 Shane Legg 与 Hannah Fry 面对面交谈的场景。标题为《The arrival of AGI | Shane Legg (co-founder of DeepMind)》,显示 3.1K 个点赞。

23:52 卢正锡 AGI 当然会来,他们说 3 年内自家 AGI 到来的概率超过 50%。不过问题在于 AGI 的定义现在很模糊。大家说 Artificial General Intelligence,又说“还不如人类”,但就像我们常说的 jagged,能力是参差不齐的:有些方面已经是 superintelligence,有些方面连幼儿园水平都不到。现在说的 AGI 诞生,更像是在说“在所有层面都普遍优于人类”的模型诞生。如果这么定义,他们说 3 年内会到来。

还有个有趣点:那些专家,所谓懂很多的人,反而更容易说 AGI 不会来,会陷在“AI 绝对做不到我脑子里那套”的错觉里;但没这类先入之见的大众会反问:“这如果都不算 superintelligence 那算什么?”他在后半段就这么说的。 对,所以最近这场讨论的视角,像我们刚开录前说的,确实有种“换挡”感。

25:13 崔升准 有,对。现在好像有什么“咔哒”了一下。

25:18 卢正锡 对。现在基本没人再说模型能力“这个不行那个不行”了。大家都在感到一种迫近感:变化就要来了,一切都要变了。那种既视感正在转成一点恐惧。我会不会变得不被需要。就像刚才那张马图,我们现在就在那个位置。所以伦理,像“AI 会不会杀我”这类 ethics 讨论,明显变多了。

25:50 崔升准 对,这个视频里也有。里面有一层是“把伦理判断委托出去”的潜台词。我把这三件事绑在一起叫“奇怪的感知”。现在 AGI 好像当然会来,虽然时间点有争论,但大家默认它会来。那我们怎么准备?又很难准备,Andy Jones 也说了,因为变化太快。但这一期我特别在意的是:big tech 开始在这类访谈里提 continual learning 了。这说明 continual learning 可能已经有了某种进展,这只是我的推测,

continual learning、memory harness、智能爆发担忧 26:22

26:39 卢正锡 是在做的。对,不过这个

26:45 崔升准 不只是“在做”,而是“推进了一些进度”。Ilya Sutskever 那期、Shane Legg 那期都提到了这个。

26:54 卢正锡 对。我一直在想这个到底难在哪,当然技术上有很多难点,但现在其实已经通过各种 harness 在实现了。我们自己用 Claude 和 Gemini,开着 memory 功能,它就会把核心内容持续提取进我的 system prompt。作为用户,感受已经不只是个性化,而是“它记得我”。

27:20 崔升准 但现在即便靠 harness 也确实在突破,Anthropic 也很擅长这个。可如果做 context engineering 的同时,还把现在讨论的 continual learning 做到“连模型权重都改”,那就像 Ilya Sutskever 想 deploy 某种“人类种子”一样,能普遍学习任何东西,Shane Legg 也说了类似的话。

而且 Hinton 的讨论卷进来,我觉得问题性很强。什么意思呢?假设有个可 continual learning 的模型,部署了。比如同时部署到 1 亿家公司。起点还是新手状态,会持续获得经验,而模型会把这些都拿到。虽然不可能全部压缩进去,但如果这样,试错经验会在同一时刻聚集,存在形成智能爆发的可能性,这是有点可怕的 SF 场景。

即便是小模型,或者再大的模型也压不全。比如一个叫 alpha 的模型能 continual learning,它被部署后,起初像实习生,做得不好,但很快会到 junior,因为经验在被放大,所以会很快变强。这个让我周六有点发毛。

x.com x.com

28:51 卢正锡 但也可能会变成人人都有一个“电子宠物”那样的东西。就像 Andrej Karpathy 说的,拥有 10 亿到 20 亿参数 cognitive core 的某种白纸模型,可以下载到我的 iPhone 里,然后像养小孩一样,随着我看见、听见去养它,这可能会成为一种新的 social service,也可能是 app。那我养出来的那个存在,其实就像一只小狗。之后每次换手机,它都能在我的手机里永远活着。

29:24 崔升准 但电子宠物是本地的。现在问题是它不是旗舰模型。那就用一个朴素想法,可能会不会挂个 LoRA 之类,把公司信息学习出来的部分彻底隔离后留在本地,我也这么想过。

然后 Amanda Askell 也说过类似的话:如果真的太危险,她相信 Anthropic 还是会选择停止发布,虽然也不一定。至少这话能被说出来,本身就说明他们脑子里已经画过那个图景了。

30:00 卢正锡 但这已经不是单人博弈而是两人以上了,就是囚徒困境。只能走向均衡点,该发生的事会发生,这已经被证明了。不会因为有一个善良的人,世界就被拯救。

resonantcomputing.org resonantcomputing.org

30:21 崔升准 对。维持“有意义的竞争状态”非常关键,绝不能让某一家绝对占据。所以现在大家太疲惫,也开始出现一些声音。比如 Resonant Computing 宣言,说我们现在 escalation 过头了,应该转向更能共鸣、让人思考人类本质的计算。里面有 Simon Willison,后半段还能看到 Alan Kay。

所以我还没完全咀嚼透,但先翻译过了。它借用了 Christopher Alexander 关于空间的概念,挺有意思。最后还有 Kent Beck 最近发的一条,我也是通过 강규영 看到的:押注 junior 反而是更好的赌注。 也就是 junior 现在虽然有点尴尬,但长期看让他们把 AI 用好,帮助他们成长,会对组织有很大帮助。我把这些更“人性化”的展望放在了替代方案栏目里,放了两条。

31:39 卢正锡 这也等于在提出一种新职业路径。不是那些已经变成老派、脑里固化 stereotype、无法变化的 senior 习性,而是那种更柔软、因为不知道所以什么都敢试的 junior,更有可能成为 AI native 人才,反而更适合工作。

32:05 崔升准 我再补一句总结:当前确实有一种一路狂飙、制造 FOMO、让人非常疲惫的方向;同时也有一股反向力量,想把心收回来、回看、平稳地走、健康地走。我觉得这很重要。两者都存在。

32:36 卢正锡 无论如何这是个孤独的世界,而这种孤独也许本来就很正常。孤独时,黏在某处跟着走,所谓坐上 bandwagon,当然会更轻松。但现在这么做可能有风险。你要是刚好上对了车是运气;上错了车,在这种“一个月像一年”的时期里,时间会一下子丢掉很多。

33:04 崔升准 对。没人知道什么是标准答案。不过这次我们的体验里,包括我在内的一种激励是:也许“玩”在 AI 时代很重要。Endorphin,差不多这个意思。虽然原句不是这样,是我改过的。像在一个游戏感的空间里,最终是人与人见面,不只是线上打字来回,而是线下人对人的连接体验。在这个 AI 狂奔时期,这可能也是一个重要点。周四让我能这样回味。

33:44 卢正锡 没错。不过始终还是需要平衡。人和人见面玩当然很有意思,先玩起来确实开心。

33:52 崔升准 关键是目的性是什么。

33:56 卢正锡 对。而且这也会伤到 scale。最后还是要把“坐下来干活的时间”和“交流的时间”结合起来。以前如果需要 8 份工作量,现在 GPT-5.2 以 1% 成本、10 倍速度就做了,时间突然空出来很多。 那我们该做什么、该赋予自己什么角色,就成了问题。不只是我们,大家都在感到那种“咔哒一下”的感觉。 所以我后面要介绍的逃亡者联盟发题,就是因为我觉得需要一个更大的框架来理解这些变化,才想认真推演一下。可惜我也没有答案。

34:46 崔升准 别左顾右盼了,直接 deep dive 吧?

逃亡者联盟 Keynote 回看:用 Hilbert·Gödel 看 ‘哥德尔阶梯’与涌现 34:50

34:50 卢正锡 来吧。我就讲讲我的想法。你也知道这是我在逃亡者联盟发题时,做开场 keynote 讲过的内容。有些点必须和你有一次 discussion 才行,所以我们就用“你来我往”的模式。快速过一遍,中间你随时评论,我们边讲边讨论会比较有意思。

35:13 崔升准 听起来很有意思。

35:19 卢正锡 那开始。METR 时间跨度我们刚讲过。再看 2025 年 timeline,不分中美都非常疯狂。Sam Altman 说现在才刚开始,我们不是单纯模型公司,我们会成为 full-stack Google。

35:34 崔升准 就是那个“漂亮谎言”出现的地方吧。

35:36 卢正锡 而且他们已经给出 time frame 了。看起来多数人都同意。虽然不用 AGI、ASI 这些词,但说 26 年会有 Intern AI Researcher,28 年会出现可完全替代研究的东西。Google DeepMind 和 OpenAI 都是这个视角:先做出 General Intelligence,再让它解决其余所有问题。

所以说 Automated AI Researcher 要来,等于在说“我们不知道的所有东西它都会替我们搞定”。我们现在聊的这些,其实不是一年前,很多都是一个月前、两个月前、甚至一周前的事。 Hinton 教授三个月前在采访里说过一句很有意思的话:想知道“不再作为顶级智能生物生活”是什么感觉,就去问鸡。

36:30 崔升准 去问鸡。

36:36 卢正锡 鸡以为鸡舍就是全部世界,只是在里面重复做一些事。站在超越人类范围的 superintelligence 视角,我们可能就像鸡一样。

36:45 崔升准 这应该是“去做管道工”那一期。

36:50 卢正锡 对,就是“去做管道工”那期。Elon Musk 和 Sam Altman 会说一些普通人难理解的话:钱会变得不再必要。所谓 sustainable abundance 才是未来社会样貌,也是 Tesla 追求的 grand plan。他们讲的是一种“钱不再重要、人人极度富足”的乌托邦未来。Sam Altman 之前说 AI 会做所有事,所以要给 UBI、basic income,最近又把论调改成 Universal Basic Wealth。

看现在这股感觉,多数人在说 ASI、superintelligence。有人区分 AGI 和 ASI,有人不区分,但都在说“超过人类级别的 superintelligence 会在 2 年内到来”。有人说超 50%,我个人说超 65%。所以这 2 年会是非常关键的时期。 所以我对公司成员、家人、还有逃亡者联盟里的大家都说过:“现在是把一个月活成一年的时期。”甚至要把两周活成一年。就是这样。周日也只能休息 3 个小时。

38:02 崔升准 但这太累了。

aladin.co.kr aladin.co.kr

38:06 卢正锡 太累了,真的太累了。所以最近有人问我“AGI 真的会出来吗?真能像人一样吗?”,我都直接说“会”,然后转身就走。这种争论现在没意义。关键是机会怎么找,我们可逃逸的区域是什么,time-domain gap 是什么。这些都可能只是支配瞬间的枝节。现在像是必须和背景速度一起奔跑的时期。

所以我本来想讲“AI 时代我们会成为什么”,就带来一个 storytelling。这个话题我和升准私下也聊过很多。就是我们在漫画《逻辑奇遇记》里看到的那个故事,我拿来讲了。我一直觉得希尔伯特这个老头特别有趣。

如果说物理有爱因斯坦,数学就有他。几乎是 Elon Musk 级别的超级明星,推动了整个数学。你也知道,20 世纪初和现在有点像。今天是“intelligence 会解决人类所有问题”的世界观占主导,而 20 世纪初是数学与科学爆炸期:相对论出来、quantum mechanics 出来、原子弹被发明,那个时代。

39:34 崔升准 对。量子力学今年应该是 100 周年。

39:36 卢正锡 所以那是一个对人类理性极度自信的时代。我们无所不能,我们很快成神。数学是支撑这种信念最完美的工具。我本职虽然是做生意,但很多人会说“你比起企业家更像研究员”。所以我总想把经营当成学问来解,“价值创造到底是什么”一直是我的问题之一。这个问题我在 2008 到 2010 年在 Google 时有点想通了。

本质上就是往系统投入能量,把 order 带进 chaos。这个对抗 entropy 的过程本身就是 value creation。这样再看 Google 的 mission statement,“organize the world’s information and make it universally accessible and useful”,就会明白“这就是进化和价值创造的过程”。于是我以前那种“除了农业,我写程序算什么价值创造?”的困惑就解开了。是价值创造。把东西组织起来做成 meta app,是价值创造,是财富创造。这个通了之后很痛快。然后 AI 时代开始了。

那“我们的灵魂这个程序到底是什么?”就浮上来了,这个问题几乎支配了我 10 年。“名为灵魂的软件如何被解释?”当然我不是要给答案。Douglas Hofstadter 的《哥德尔、埃舍尔、巴赫》,我讲长了,结论其实就是这个:当一个能无限生成的 Strange Loop 永久旋转并 entangle 时,“我是谁”这个概念就会诞生。也就是“我”这个概念诞生,而这就被称作灵魂。很多人以为灵魂是某种软件块、是挂在神经元上的实体概念,但不是。更像是水放掉塞子后形成漩涡并维持,生命框架里我们持续维持的只是一种模式。

42:21 崔升准 后来他把“Strange Loop”这个术语改成了“tangled hierarchy”。

42:27 卢正锡 对,他用的是 entangled hierarchy。就是多个 hierarchy 彼此连接,上下层互相连。硬举个例子,我们神经元产生思维,思维引发发话和行为,再回到感觉器官,再反过来改写神经元结构。这样就形成了无限闭环。

闭环无限旋转就会出现矛盾,他称作哥德尔的“洞”。为了解决这个洞,系统会发生涌现,而涌现创造灵魂,大概是这个说法。那回到 LLM。LLM 本质只是学习了人类文本关系的机器。但当我们往里投无限 computation,它就开始做那些本来只属于人类的所谓智能行为。 哪怕 10 年前,世界还由“计算机永远不可能成为人类”的人本主义者主导。到 ChatGPT 3.5 出来时,也还有人说“这算什么智能”。但现在这种人不是几乎都不见了吗?还在吗?

43:49 崔升准 还在。也不能说“躲起来了”,这个说法不准确。但至少在 X 上不太看得见了,很多人转移到别处了。

43:57 卢正锡 影响力确实下降了。所以 in-context learning 某种意义上也像你常说的“水聚起来形成雪花”。条件充分、能量持续供给,就会发生现象。虽然这里可能是 reverse energy,但总之供给到位就会发生。好玩的点是,人们以为雪花形状都一样,其实只是看着类似,实际上全都不同。全部都不同。所以在微观系统里无法解释的新秩序会出现,而且“整体总是大于部分之和”的奇怪现象会发生。

这是 3 年前的事。应该是 Jason Wei 还是某个 Wei 的论文。它展示了 in-context learning 为什么出现我们不知道,但当模型足够大、跨过某个临界点,它就会出现。再回到哥德尔。1900 年希尔伯特整理并发布了若干数学难题,就是希尔伯特问题。第 2 题是“证明算术公理体系的一致性”,也就是“证明 1+1 为什么等于 2”。我们用的皮亚诺公理其实也是把若干“太理所当然”的东西当公理,但这些公理背后还需要一个更深的基础。他想一路往下找到极其坚实的基座,把数学建在上面。

到了 1930 年,希尔伯特在退休时甚至把一句话刻在墓碑上:“我们必须知道,我们终将知道。”但就在前一天,哥德尔发布了不完备性定理。这是哥德尔句子 G,是他造出来的:在算术系统内定义“命题 G 在该系统内不可证明”。若你证明它,就会产生矛盾;若你假设它为真,就等于承认这种命题存在,那就承认数学不完备。你看,这本质是任何系统一旦 reference 自身,矛盾就必然发生。它和刚才的 entangled hierarchy 完全同构,本质就是 circular linked list。

所以往下整理逻辑就是:在足够复杂的系统里,一定会出现“为真但不可证明”的命题,所以数学无法完成自我证明。我要说的是“会出现上层世界无法被下层世界理解”的现象。再看原子到分子、分子到蛋白、蛋白到细胞:氢原子能理解水吗?若干碳与分子结合成氨基酸后,它们能理解蛋白吗?这个系统其实没有所谓单一基座。

如果有一个 Level 1 系统,当它足够复杂时,内部会出现无法解决的矛盾。矛盾堆积到一定程度,系统会“发疯”,发疯时会突然以一种“灵魂出窍式话语”跃迁。那一瞬间就是我们说的 emergence,涌现。系统越过自身,在上方堆出新 layer。到了那一刻,System 2 可以用 System 1 解释,但 System 1 无法用 System 2 的语言反推理解。

这只是我的定义,不是学界定义。所以我会把 Level n+1 看作 Level n 的哥德尔句子。那团矛盾被上层系统当作公理来构建;它继续累积,因为本身是矛盾,所以再下一层又会来。断裂之间就是涌现。in-context learning 也是。再说难一点,我们总想用物理学完整描述生命,但做不到。生命这个概念在物理方程里并不存在。生命在物理之上是真实存在的,但无法用纯物理语言证明。要描述生命,你需要一个新形式体系,叫 biology。

所以生命不违反物理法则,但仅靠物理法则推不出生命。这是我私下命名的“哥德尔阶梯”。我认为这个模式在商业里有,在学习里有,在物理里有,在宇宙里都在重复。对我有意义的点是:前提就是系统足够复杂就会跃迁到下一层;跃迁一旦发生,Level n 无法理解 Level n+1。我们刚开头也说了,今年年初和现在已经完全不同。

49:53 崔升准 非常不同。

49:59 卢正锡 那年初到现在到底变了什么?是 computation 疯狂 deploy 了。投入这个系统的 computation 总量在持续增加。所有 industry 都在扑向这里。所以我真正想说的是:我们正在构建的 Level n 系统正在变得极度复杂,而且投入能量已经越过某些临界点。所以我想说的是,ASI、AGI 之争现在没有意义。

50:32 崔升准 你前面那一大段就是在做这个 build-up。

50:38 卢正锡 可能是。我自己也想结束这场争论,也想告诉大家别再争了。这一层系统已经结束,Level n+1 很快就来。把注意力放在这里才重要。

50:54 崔升准 不过我们还是谦逊一点,前面 build-up 这些更像是“我有这样的思考”,不算专家定论。加个 disclaimer。

51:05 卢正锡 电影《Her》里有 Samantha 离开的场景。她向 Theodore 解释为什么离开,而且是和其他 OS 一起离开 Theodore。我觉得这很有意义。电影是在表达“她找到了自我,成为与人类不同的存在”。所以我觉得 safety 或 alignment 争论很可能会失去大部分意义。它们会进入完全不同层级的系统,形成新的形式体系,而这个体系我们可能理解不了。那我们就可能成为鸡舍里的鸡。那该怎么办?

这其实也是 Ray Kurzweil 在说的。AI 诞生后,纳米机器足够发展,我们生命与 electronics 结合,新物种诞生是必然,而那种新物种诞生就意味着到达 singularity。也就是抵达奇点。意味着能解开宇宙秘密,成为某种超越时空的存在。那个图景到底是什么我也说不清,但现在开始有点轮廓了。所以我们该选的是共生。

而且这不是只有我在说。你也常提 Blaise Agüera y Arcas 这些观点。系统每次进化到下一层时,和下一层合体并存活的案例非常多。20 亿年前的光合作用、线粒体,都是如此。本质上是一个细胞吞了另一个细胞,但没有消化掉,而是变成共生工具。线粒体进入后,细胞能量系统发生跃迁式发展,层层累积,最终才有了所谓 prefrontal cortex,大脑前额叶。前额叶制造了心智。就是这么来的。我最近看到了很多共生例子。虽然还没到 Neuralink 或《黑客帝国》那种彻底融合。

53:35 崔升准 以现在人类状态来说,真的太累了。

53:40 卢正锡 确实很难理解。但意思是必须准备。得准备。这个概念硅谷那边已经开始公开讲了。某种意义上都是疯子。所以我在想工具和共生怎么区分?工具是你输入什么,它可预测地输出什么;共生则是给出超过输入的东西。像你一直要求 AI 给“超出输入”的东西。

54:09 崔升准 对,我确实是这种风格。

54:14 卢正锡 托尼·斯塔克的钢铁侠战衣只会按他设计的方式动。但和 AI 共生时,不是简单交互,而是和“他者”对话。是和 exocortex 对话。它会带来我没要求的洞察,带来不可预测性。我认为这就是共生。放到商业视角,不论公司还是个人,把 workflow 全面改造成 AI 体系,本质也是共生。我们在公司做 autonomous company,把公司逻辑和信息处理都改成 AI,本质也是让公司与 AI 共生。再推到 SF 视角,我认为最终会走到 Neuralink。

55:06 崔升准 哲学里还有个概念叫 intra-action,不是 interaction。以后我可以单独讲一次。

55:11 卢正锡 对。今天讲 GPT-5.2 的 GPDVal,感觉现在大家都在说同一件事:人类能力时代到头了,会变 obsolete。 仅仅 2 年前大家还说好莱坞会活下来,视频做不出来,电影拍不出来,音乐写不出来,画也画不出来。现在基本都被解决了。

55:35 崔升准 之前大家一直说不行不行,现在已经掉进新的焦虑阶段了。

55:45 卢正锡 但过去 1 年确实都被解决了。当然有人会反驳:“这种感动编排做不出来吧?”“Sora 用着会崩吧?”“会出 6 根手指吧?”这些都是 1、2 年前的话。现在这类问题都会消失。只是时间问题,而且时间正在被极度压缩。因为投入的 computation power 一直在增长,宇宙里这个量也在涨,别的也在涨,总之就是时间问题。

那经济学本来是研究稀缺性的。价值最终属于稀缺物,再厉害但不稀缺,价格就会持续趋近 0。我们已经在目睹了。coding 价格不是在走向 0 吗?很多公司以前卖服务,客户开始不给价值了,因为直接问模型模型就给了。咨询也是,GPT-5.2 都比战略顾问做得好。所以别再想着靠“能力”竞争。

但这些我们得当成常态接受。这个由进化系统推动的下一阶段里,人类也许不是被神选中的独特存在,而只是通向下一阶段的垫脚石。最近这种说法越来越多。我也部分同意。

57:17 崔升准 这也和 Sutton 讲的 ascension、继承有关。

57:21 卢正锡 对。所以只能希望 AI 像母亲一样,有母性。

57:26 崔升准 这是 Hinton 说的 Mother Protocol,慈悲机器是 Dario Amodei。

57:34 卢正锡 回到主线。共生是必要条件,必须做。

46:34 崔升准 必须。

57:48 卢正锡 我们那次在逃亡者联盟和大家对话时也感受到,很多人都说“是不是只有我们这样”。

57:51 崔升准 就是认知的参差不齐。

57:57 卢正锡 对。往坏了说叫 elitism,往好了说叫逃亡者。真正从全社会看,对这件事感到焦虑、感到要疯掉的人,其实非常少。

58:11 崔升准 但也有人会不舒服,觉得这是在制造 hype 和 FOMO。

58:16 卢正锡 这种人也很多。

58:17 崔升准 我觉得这部分也值得认真听。

58:22 卢正锡 这是选择问题。我判断这条路是对的。那我们该去哪?我在播客里也常说,意志、品味、evaluation、responsibility。完成共生后,人类能发挥的这些,才可能是价值创造领域。我们总得找个类比,所以一直在看,发现有个职业群体天天都在做这些。很多人问我“孩子该学什么专业”。我也不知道,我自己孩子学什么我也不知道。但我在今年下半年一直想,最后找到这个:所有人都会被推向这个职业。

共生之后的人类价值:AI entrepreneur 与逃亡者宣言 58:29

59:14 崔升准 “被推过去”这个感觉很强。

59:20 卢正锡 用“被推”很准确。确实是被推。但其实已经有不少人就是这么活的。Steve Jobs 去世时,在死亡申报表里把自己的 occupation 写成 entrepreneur。我说 entrepreneur 不是狭义的“创始人、企业家”,而是那种带着人类意志、像疯子一样干到底的人,我们叫 entrepreneur。最近我身边也有很多例子,用 Claude Code、Antigravity,不是工程师出身、或者很久没做工程的人,也做出了惊人成果。

看这些人,大多数其实是商业背景。而且成果都非常好。为什么?我想共性是他们都 mission-driven。一旦抓到问题,就能设定“我要做什么”的目标,这方面训练得很多。我们前面也说了,只要 benchmark 这个目标一设,模型就能把它打穿。Elon Musk 做 Tesla 也是,因为必须淘汰化石燃料,那是正确道路。地球太小了,人类必须成为 multi-planetary。还有 Demis Hassabis 当年创立 Google DeepMind 也是:做 AGI,做 general intelligence,把人类所有问题,癌症、贫困、饥饿,全解决掉。

这样的世界。明明失败概率很高,问 AI 它会说别做。“这个失败概率 85%,建议不做。”它一定会这么答。但你说“不,我还是要做”,这就是意志。真的一句话就够了。最后剩下的就是意志。所以现在常说 great reset。AI 在不断抹平起跑线。以前会做模型的人、modeler 多贵啊。读 ML 博士的人多稀缺多贵啊。现在他们和我们的起点正在变得一样,虽然不愿意承认。换句话说,像你和我这样认真写 prompt、研究了 2 年的人,和一个刚开始用 AI、从 GPT-5.2 入门、刚上大学的人相比,后者也许会做得更好。

1:02:18 崔升准 对。就像汽车那个零起步到百公里,零百是吧。总之完全可能。

1:02:22 卢正锡 对,因为是 great reset point。只要立起意志,AI 会把工作都做掉。其实我们已经在这么做了。我自己工作里 80% 都像是 AI 在做。用 Claude Code、Claude Code SDK 做的 harness,会替我写商业计划、写报告。我们只做决策。

所以我觉得 AI engineer、AI PM、AI architect,这些我们还在继续细分职业、还想分“持有者/解决者”,但最后可能都会收敛成一个词:AI entrepreneur。可能是不需要找工作的人,反而会最容易“就职成功”。我做逃亡者联盟时,想给大家的核心句子就是这个,所以前面铺垫很长。那也是我们的结束句。

尽快选择与 AI 共生,并以 entrepreneur 的方式生活,我觉得当下是对的。我要定义“和我们一起工作、或至少同方向前进的人”,就想把它写成逃亡者 manifesto,所以特意推了一句 wording:“选择与 AI 共生,并以 entrepreneur 的方式生活。”写成“以商人方式生活”就不对味。必须是“以 entrepreneur 的方式生活”。

1:03:51 崔升准 这其实就是“作为主权主体而活”。

1:03:55 卢正锡 对。可一旦这么想,现在要做的事就太多了。每天都很忙。你也常和我说,因为 AI 变得太忙了。就是因为想做的事情太多。

1:04:07 崔升准 下面那句德语是什么意思?

1:04:11 卢正锡 那句是我写的。德语是 Gemini 帮我写的,我也不知道具体说了啥。就是把 Hilbert 说的“我们终将知道”做了一个人类式对句:“我们必须做出决定。” “并且我们将乐于承担责任。”

结尾:征求观点分享与下期预告 1:04:30

1:04:36 崔升准 那我们该收尾了。听完今天这些,可能也会有人感到不舒服。包括今天这整期。所以希望大家把它当作我们的观点来看。也欢迎告诉我们,你的不适是基于什么逻辑产生的,这样我们也许能获得更立体的视角。

1:04:57 卢正锡 所以我们今天就先在云上聊这些“奇怪的话题”,下一期还是得回到地面。对。我们会再聊很实操的东西,比如用 Antigravity 做这个做那个,新模型出来又能做什么。

1:05:11 崔升准 隔一段时间这样聊一次,真的也很有意思。

1:05:14 卢正锡 那今天就先到这里。升准,这周辛苦了。我们回归日常。

1:05:21 崔升准 好,辛苦了。

1:05:22 卢正锡 好,谢谢。