EP 79
AI Frontier 逃亡者联盟回顾 & GPT 5.2
开场:2025年12月14日,GPT-5.2 更新 00:00
卢正锡 今天我们录制的时间是 2025 年 12 月 14 日,周日早晨。时间又在飞快地过去。本来以为到年末能稍微歇一歇,结果 GPT-5.2,5.1 又加了 0.1 进位升级了。变成 5.2 之后,变化还挺大。大概也是为了牵制 Gemini 3 才出来的吧。
崔升准 是的。现在时间线上有很多消息说 OpenAI 正承受很大的压力,所以必须拿出点东西来。不过你说你特别关注了一个 eval,对吧?
GDPVal 暴涨与智力劳动商品化 00:35

卢正锡 对,我重点看的是这个叫 GDPVal 的指标,就是现在这张表最上面的那个。其实它是 OpenAI 在发布 GPT-5 时一起推出的基准。大概针对 44 类真实的人类职业,做了约 1300 到 1500 个 task 作为 evaluation set,目的是看它在“人类做的工作”上到底能做得多好。
不过它在 GPT-5.1 时大概是 39 分,到 5.2 就到了 70 分。原因可能很多,我们也不知道。可能是针对 GDPVal 对应的人类工作领域,生成了大量 synthetic data 放进 pre-training set,也可能是围绕这个方向强化了 post-training。配方我们不清楚,但关键是,我们以前说“模型做不了这些”的那些人类特有智力劳动,正在被迅速 commoditize。
更惊人的是它的成本。完成这些任务,估算只要给人的成本的 1%,几乎就是电费。而且处理速度快了整整 11 倍。哪怕是今年年初,我们还在讨论“AI 继续发展下去会不会替代我们的工作?”这是当时甚至会说“解开这个就是 AGI”的那类 benchmark。
崔升准 一年前,大家都说旗舰模型做不好这个,还说“这个必须做到才行”,现在已经做到了。连难度更高的 Tier 2 也在做到了。
卢正锡 benchmark 都显得失色了。当然 benchmark 一出来,benchmark 本身就会变成目标。我们在 RL 里不是学过这个教训吗?目标一旦设定,只要能给这个目标奖励,只要能做到 verifiable,模型就能把它完成。这已经是我们总结出来的新规律了。就是能做到。
崔升准 所以现在出现的模式是,只要做出 benchmark 就会被攻克。也就是说,做 benchmark 就行。虽然有点本末倒置,但确实有这种感觉。
METR/Epoch AI 时间跨度与 Gemini 3 Pro 4小时 03:08
卢正锡 所以 Epoch AI 的这个图,下面这块看得很清楚。
崔升准 这个目前是估算,METR 还没有正式发布,只是做了推测。不过现在是 11 月,已经过去差不多一个月了。Gemini 3 Pro 虽然在图上是线性表达,但本质是指数式进展。在“达到人类 50% 表现”的时间跨度上,它已经做到 4 小时了。
卢正锡 所谓 4 小时,就是它已经能完成人类需要 4 小时才能做完的工作。
崔升准 对,对。所以才会有这个估算。如果按这个趋势走,明年这个时候就会达到人类 full-day,也就是 8 小时的工作量。
卢正锡 对。你说“明年这个时候”,听起来好像再过 3 个月就到了。我们开玩笑说“一个月像一年”,现在可能得改成“两周像一年”了。这样的变化正在不断出现。
崔升准 这就很麻烦了。
卢正锡 没错。按人的速度确实很难跟上。
崔升准 而且我们刚说完这些,下周好像又有发布。

卢正锡 可能是年底前 Google 想再压 GPT-5.2 一次。确实有一些消息和观察说 Google 还会有动作。与此同时 Sam Altman 也不甘示弱,说“我们下周也会再放点东西”。
崔升准 我没把那页图拿来,但如果看今年发布模型的时间点分布,后半段明显更密集,集中爆发了。这个趋势很夸张。我们周四那期因为这周信息没那么压缩,其实也没时间细看。结果周四我们活动快结束时,OpenAI 发布了这支视频,说他们 10 周年了。
OpenAI 十周年,性能与价格竞争及“成本价”收敛 05:07
卢正锡 原来 10 周年了。
崔升准 对。10 年前还是那样。
卢正锡 10 年前我们还在聊 convolutional neural network,聊 ResNet 那个时代。
崔升准 重点就在这句:“现在才刚开始。” “你今天用的模型就是最差的模型。”
卢正锡 没错。我从某个时候开始,也不太继续跟踪这个“性能/价格”,也就是 token 价格了。当然中国模型现在确实比美国 frontier 模型便宜很多。
崔升准 啊,为什么呢?
卢正锡 这有点像纳什均衡,一种鸡博弈。大家都在往均衡点冲,而那个均衡点大概率会到成本价。所谓成本价,本质就是电费加设备折旧摊进去之后的价格,接近 0 的低价。现在我们不会说“电费太贵所以做不了这个”吧。那当接近无限的 intelligence 回到我们指尖时,那些我们认为属于“人类价值”的部分,会在极短时间内承受这种变化速度。这就是差异。所以更难。
孤独与不安:为什么人们开始聚在一起 06:46
崔升准 所以我们一直在聊这些,也会聊些低落的话题,尝试理解这个世界,努力学习才聚在一起。这个从 2023 年 5 月开始,到现在有 2 年半了吗?差不多是吧。
卢正锡 我们做这个已经 2 年半了吗?挺久了。
崔升准 之前我们说过,好像有点孤独,但不只是我们孤独。
卢正锡 我们不是开玩笑,而是有明确目的,想找一些能一起看向前方的人才开始做这件事。结果收到的报名太多了。不仅人多,报名者的背景也非常好,所以我们从大家提交的内容里学到了很多。共同关键词如果要说的话,就是大家都焦虑、孤独、痛苦,不知道该往哪走,和我们感受到的情绪几乎完全一样。所以我们觉得这些人先得聚起来,先互相安慰,交换彼此拥有的东西,然后建立联结,于是办了这个活动。后来这个活动因为升准,还有有珍,变得非常丰满。不再只是聚着喝咖啡、喝啤酒聊天,而是发展成了生成式 conference。这个你来分享一下吧。
“逃亡者联盟”首次 sync-up:打造生成式会议 08:29
崔升准 所以上周四“逃亡者联盟”办了 first sync-up,也就是同步聚会。正如刚才说的,我们搭了一个空间,然后很快就生成起来了。“逃亡者”这个说法,是在我们节目里卢正锡一直说要逃去某个地方,“要逃”,后来某一刻就固化成这个词了。
卢正锡 当时我们的起点就是:frontier 模型正在把我们原有的东西都拿走,那我们要去哪里找活路?所以中间我们经常会说“快逃吧”,后来变成“那样的人,就是逃亡者”,结果我们也把自己定义成“逃亡者”了。

崔升准 对。也就是想聊聊 frontier 之外在发生什么。我们从 AI 爱好者、重度沉迷者的角度去看这些事,结果很多人报名说也想看同样的风景。最后来了大概 140 人,在 B 工厂这个很好的 venue 里办了活动。现场很热闹,先是餐饮社交,之后进入各个 session。最开始卢正锡那页 slide 挺有意思,对一起经历艰难时期的同伴说:“辛苦了,要不要先互相夸一句再开始?”是这么开的场吧?
卢正锡 对,对。感觉大家需要先互相安慰一下。是的,我自己也得到了很多安慰。
崔升准 所以我们确实留了一小段时间互相打气。然后说到了“像过一年那样去活”的时期,是什么来着?
卢正锡 我说的是“要把一个月活成一年”,但就像前面说的,现在是不是该改成“两周活成一年”了,我在这么想。
Panel、小组、AMA 运营复盘与现场能量 10:27

崔升准 对。我们也做了 panel 讨论。然后小组 session 不是当天即兴 unconference,而是提前规划、先共享资料、到现场再进行 45 分钟深度讨论的那种。
卢正锡 对,45 分钟一轮,共 3 轮。我们正式日程 7 点开始,所以 7 点一轮、8 点一轮、9 点一轮。我原本以为到 9 点大家大多会走,结果完全不是。几乎大多数人都一直留到最后,我被那个能量水平震到了。

崔升准 我也很惊讶。after party 那部分,也就是结束后再延续 1 小时交流,很多人也都留了下来。然后在 35 人房里,邀请了正在激烈思考问题的几位,像 오순석、김민석、申正奎,听了 AMA 发题也做了 AMA,据说当时气氛也很热烈。是李京浩帮忙做了 moderating,对吧?就是在 LinkedIn 很活跃的那位。
卢正锡 他帮我们做了很多整理,所以那边的内容记录得很好。还有那些很难请到的嘉宾也来了,还非常爽快地分享,借这个机会再次真心感谢大家。
崔升准 没错。这张图是从视频里截的屏,是 언볼트 的 정윤혜 做的。还有一直负责剪辑的金有珍,如果她也到了现场,估计很多人都会围着聊。还有我们的 co-host 金成贤,大家也在找。
卢正锡 问“金成贤为什么没来”,对。
崔升准 所以这些问题后来都被共享了。这个不是原始资料,我做了匿名化,也做了再生成处理,所以保留了语气但不是原文。最开始 21 个房间都是空白。
卢正锡 对。我们还担心这 21 个格子能不能填满,结果是杞人忧天,很快就满了。
崔升准 对吧,我不是说会成吗?因为有空间,又有很多人积极参与,所以才做得到。session 是自组织起来的。
卢正锡 对,我在场内转着看大家讨论,东听一点西听一点,内容都太有意思了。每个都想坐进去完整听完,挺遗憾没法分身。参与者应该都很有意思地度过了。
崔升准 对,我在 networking 时也收到了反馈,说 45 分钟不够,后续还在计划再聚,而且热度高到有点 overbooking。
Discord 归档与自组织如何发生 13:21
卢正锡 对,所以这些问题某种程度上是我想知道“现实里到底有哪些问题”的快照。既有商业问题,也有非商业问题。我主要还是更关注商业问题,所以更多看了商务 session 和相关发题,挺有意思的。
崔升准 这些资料现在都在 Discord 里做归档。所以由问题持有者提出问题,再由对这些问题感兴趣并提供想法的问题解决者参与,再加上善于做时间管理和记录、并把讨论维持在有意义方向上的 moderator,这样一来活动就通过自组织“啪”地生成成了 conference。所以我们给它取名叫“生成型 conference”。
所以即便是相近 domain,不同的人相遇时也会出现“一个向量投影到另一个向量会变短”的自然现象,所以我们也提醒了参与心态要考虑到这一点。再加上这是复杂且多元的现象,从不同位置去看就能得到不同 insight,所以也传达了这种意象。 所以现在 Discord 上正在进行复盘。现场留下的照片和文本记录都在共享,也在推进“学到了什么、忘掉了什么”这类内容。另外也在讨论如何改进这整个过程。
再简单补充一下:我当时的想法是,先搭一个多层次、多样化的空间,轻轻 nudging 一下,就像 Dario Amodei 和 Jared Kaplan 说的那样,只要有空间、有条件、有温度、压力、湿度,然后等待、让计算发生、让自组织发生,就会涌现出有趣现象。确实是很有成就感的经历。不过这件事在这里同样需要时间,未来也会继续需要时间。
卢正锡 所以以这个社区为起点,很多人也觉得意犹未尽。我们并不是想把它做成一个高度封闭的社区,而是觉得要先把一些雪花组织起来,再逐步向外开放,所以才先小规模开始。如果一开始所有人都进来,在基本 fractal 结构都还没形成时就向外扩散,效果会不好。可以理解成我们现在正在设定一些初始规则。
崔升准 对。现在这个阶段从某种意义上说也是 entropy 很高的区间,潜在方向很多。我们也是在试错中推进,去摸索怎样走向更好的方向,所以还需要一点时间听反馈、找下一步。
复盘要点:激励不对称、隐私、开放性 16:18
崔升准 我想讲一下复盘最后的部分。最初的问题某种程度上确实缓解了,但回头看仍有几个让人纠结的点。第一是这里的不对称。问题持有者和问题解决者之间有一个不对称点。就是 Discord 上有人很直白地问过:问题解决者的激励是什么?
所以这个也得继续想。然后是问题持有者稀缺。再结合听 오순석 的发题,某种程度上是“问题持有者在解决问题”。而现在的方向里也有这一面,所以今天没法马上理清,但我觉得这是要持续思考的点。也就是说,能带来“问题”的案例反而更少,而把 AI 当杠杆去解决问题可能是更丰饶的区域。
卢正锡 是啊。我们某种程度上还被过去束缚,所以总想把“持有”和“解决”二分开来。但我们也说过,问题就是一切。Right questions are all we need。虽然是半开玩笑,但意思是只要问题提对,解法 AI 很快就能给出来。 那换句话说,最终就是“问题持有 = 解决”。
崔升准 这和你后面发题最后一部分讲的内容就完全扣上了,就是你说的 entrepreneur。
卢正锡 感觉一个把所有人都推向创业者的世界很快就会开始。对。而且不再是“有一个大供给方、有人被雇佣、有人消费”的结构,而会变成一种热闹的 forum 形态,甚至分不清谁是供给者谁是消费者,这可能就是新市场的样子。我们自己也是啊,在某些 industry 是供给者,在别处又是消费者。都有这种双面性,而这条边界本身正在全面 blurring。也许正像 Alvin Toffler 在《财富的未来》里说的,大家都要成为 prosumer 的那种生活已经来了。
崔升准 从这个视角看,像“拥有某个空间”这种事,换种说法就是地租、地租重要性,也会引发很多思考。经历这次活动后,确实浮现了不少 analogy。
卢正锡 这些意义会慢慢显现出来的。我现在脑子里也有很多概念在漂,有时某天早上会突然冒出来。
崔升准 另外我们设了 moderator 这个角色。在 session 内做“织网”这件事,我觉得发生得比预期好很多。但在 session 外做 networking 时,面对那么多信息,连接到底发生了多少,我很好奇。
以及那种情况下,现有其实也有很多能“交易问题”的平台,比如 숨고、还有 당근마켓 某种意义上也是。那么相比平台,那些想做连接的人,他们持有的才能该怎样更好发挥,我觉得也是个思考点。
还有这个我也非常担心。因为在 Discord 上大家会公开“谁在做什么”,结果个人信息共享太多了。这点很纠结。不公开就不知道、也见不到;公开了又会变成隐私暴露过多。现在确实有这种担忧。 还有一个是,我从朋友和其他人的反馈里也听到:你们这哪是“逃亡者”,这不就是“全力冲刺的人”的聚会吗?
卢正锡 对,没错。所谓“逃亡者”其实是对“为了寻找某个东西而全力奔跑的人”的一种反语表达。
崔升准 对。所以从某种角度讲,我们在约束条件下也采访过一些问题解决者,这次又以社区方式办了生成型 conference,尝试让很多人彼此连接,在过程中也暴露出很多有趣问题。不过外界看来,也会有“是不是在搞小圈子联赛”的反馈。这个我们之后也可以更坦诚地聊。
卢正锡 好,那我们往下走吧。
AI 新闻:Andy Jones“马(Horses)”·Amanda Askell·Shane Legg 动向 21:30
崔升准 好。与此同时,AI 模型发布和 AI 新闻可不会等我们。
卢正锡 世界一直在变化。

崔升准 风景每分每秒都在变。一个很奇怪的感受是,Anthropic 的 Andy Jones,就是那个和 Noam Brown、Igor,以及在 xAI 待过、我们提过几次“游戏里的 scaling law 对推理模型的含义”的那位。他写了一篇很有意思的博文《马(Horses)》。压缩说一下,这里有页图:某个时刻马消失了,但马自己并不知道。然后在 Anthropic 内部,他原本要回应大量新员工的问题,但某个时刻 Claude 的回答几乎都能解决,于是他自己的工作,也就是 Andy Jones 本人的工作,正在指数级减少。那页 slide 大概就是这个意思。
所以他在说自己是不是就处在“那张马图”的这个位置。当然也有人批评这个“马”的比喻太扁平。不过这大概是上周的一个话题。然后 Anthropic 的哲学家 Amanda Askell 的访谈里也有很有意思的部分,这个受限于时间我之后再回来讲。我和 Claude 围绕这个聊得很有意思。那个 “soul document” 是上上周还是上周的热点,借 Amanda Askell 的说法,Claude Opus 4.5 在谈这个时也表现出“这里有些很有意思的点”的认知。
然后这里我想和你聊聊。Shane Legg 出来了吧。下周好像还预告了 Demis Hassabis 篇。Google DeepMind《Thinking Game》纪录片之后,感觉在走“听创始人叙事”的策展路线。你怎么看?

卢正锡 AGI 当然会来,他们说 3 年内自家 AGI 到来的概率超过 50%。不过问题在于 AGI 的定义现在很模糊。大家说 Artificial General Intelligence,又说“还不如人类”,但就像我们常说的 jagged,能力是参差不齐的:有些方面已经是 superintelligence,有些方面连幼儿园水平都不到。现在说的 AGI 诞生,更像是在说“在所有层面都普遍优于人类”的模型诞生。如果这么定义,他们说 3 年内会到来。
还有个有趣点:那些专家,所谓懂很多的人,反而更容易说 AGI 不会来,会陷在“AI 绝对做不到我脑子里那套”的错觉里;但没这类先入之见的大众会反问:“这如果都不算 superintelligence 那算什么?”他在后半段就这么说的。 对,所以最近这场讨论的视角,像我们刚开录前说的,确实有种“换挡”感。
崔升准 有,对。现在好像有什么“咔哒”了一下。
卢正锡 对。现在基本没人再说模型能力“这个不行那个不行”了。大家都在感到一种迫近感:变化就要来了,一切都要变了。那种既视感正在转成一点恐惧。我会不会变得不被需要。就像刚才那张马图,我们现在就在那个位置。所以伦理,像“AI 会不会杀我”这类 ethics 讨论,明显变多了。
崔升准 对,这个视频里也有。里面有一层是“把伦理判断委托出去”的潜台词。我把这三件事绑在一起叫“奇怪的感知”。现在 AGI 好像当然会来,虽然时间点有争论,但大家默认它会来。那我们怎么准备?又很难准备,Andy Jones 也说了,因为变化太快。但这一期我特别在意的是:big tech 开始在这类访谈里提 continual learning 了。这说明 continual learning 可能已经有了某种进展,这只是我的推测,
continual learning、memory harness、智能爆发担忧 26:22
卢正锡 是在做的。对,不过这个
崔升准 不只是“在做”,而是“推进了一些进度”。Ilya Sutskever 那期、Shane Legg 那期都提到了这个。
卢正锡 对。我一直在想这个到底难在哪,当然技术上有很多难点,但现在其实已经通过各种 harness 在实现了。我们自己用 Claude 和 Gemini,开着 memory 功能,它就会把核心内容持续提取进我的 system prompt。作为用户,感受已经不只是个性化,而是“它记得我”。
崔升准 但现在即便靠 harness 也确实在突破,Anthropic 也很擅长这个。可如果做 context engineering 的同时,还把现在讨论的 continual learning 做到“连模型权重都改”,那就像 Ilya Sutskever 想 deploy 某种“人类种子”一样,能普遍学习任何东西,Shane Legg 也说了类似的话。
而且 Hinton 的讨论卷进来,我觉得问题性很强。什么意思呢?假设有个可 continual learning 的模型,部署了。比如同时部署到 1 亿家公司。起点还是新手状态,会持续获得经验,而模型会把这些都拿到。虽然不可能全部压缩进去,但如果这样,试错经验会在同一时刻聚集,存在形成智能爆发的可能性,这是有点可怕的 SF 场景。
即便是小模型,或者再大的模型也压不全。比如一个叫 alpha 的模型能 continual learning,它被部署后,起初像实习生,做得不好,但很快会到 junior,因为经验在被放大,所以会很快变强。这个让我周六有点发毛。
卢正锡 但也可能会变成人人都有一个“电子宠物”那样的东西。就像 Andrej Karpathy 说的,拥有 10 亿到 20 亿参数 cognitive core 的某种白纸模型,可以下载到我的 iPhone 里,然后像养小孩一样,随着我看见、听见去养它,这可能会成为一种新的 social service,也可能是 app。那我养出来的那个存在,其实就像一只小狗。之后每次换手机,它都能在我的手机里永远活着。
崔升准 但电子宠物是本地的。现在问题是它不是旗舰模型。那就用一个朴素想法,可能会不会挂个 LoRA 之类,把公司信息学习出来的部分彻底隔离后留在本地,我也这么想过。
然后 Amanda Askell 也说过类似的话:如果真的太危险,她相信 Anthropic 还是会选择停止发布,虽然也不一定。至少这话能被说出来,本身就说明他们脑子里已经画过那个图景了。
卢正锡 但这已经不是单人博弈而是两人以上了,就是囚徒困境。只能走向均衡点,该发生的事会发生,这已经被证明了。不会因为有一个善良的人,世界就被拯救。
崔升准 对。维持“有意义的竞争状态”非常关键,绝不能让某一家绝对占据。所以现在大家太疲惫,也开始出现一些声音。比如 Resonant Computing 宣言,说我们现在 escalation 过头了,应该转向更能共鸣、让人思考人类本质的计算。里面有 Simon Willison,后半段还能看到 Alan Kay。
所以我还没完全咀嚼透,但先翻译过了。它借用了 Christopher Alexander 关于空间的概念,挺有意思。最后还有 Kent Beck 最近发的一条,我也是通过 강규영 看到的:押注 junior 反而是更好的赌注。 也就是 junior 现在虽然有点尴尬,但长期看让他们把 AI 用好,帮助他们成长,会对组织有很大帮助。我把这些更“人性化”的展望放在了替代方案栏目里,放了两条。
卢正锡 这也等于在提出一种新职业路径。不是那些已经变成老派、脑里固化 stereotype、无法变化的 senior 习性,而是那种更柔软、因为不知道所以什么都敢试的 junior,更有可能成为 AI native 人才,反而更适合工作。
崔升准 我再补一句总结:当前确实有一种一路狂飙、制造 FOMO、让人非常疲惫的方向;同时也有一股反向力量,想把心收回来、回看、平稳地走、健康地走。我觉得这很重要。两者都存在。
卢正锡 无论如何这是个孤独的世界,而这种孤独也许本来就很正常。孤独时,黏在某处跟着走,所谓坐上 bandwagon,当然会更轻松。但现在这么做可能有风险。你要是刚好上对了车是运气;上错了车,在这种“一个月像一年”的时期里,时间会一下子丢掉很多。
崔升准 对。没人知道什么是标准答案。不过这次我们的体验里,包括我在内的一种激励是:也许“玩”在 AI 时代很重要。Endorphin,差不多这个意思。虽然原句不是这样,是我改过的。像在一个游戏感的空间里,最终是人与人见面,不只是线上打字来回,而是线下人对人的连接体验。在这个 AI 狂奔时期,这可能也是一个重要点。周四让我能这样回味。
卢正锡 没错。不过始终还是需要平衡。人和人见面玩当然很有意思,先玩起来确实开心。
崔升准 关键是目的性是什么。
卢正锡 对。而且这也会伤到 scale。最后还是要把“坐下来干活的时间”和“交流的时间”结合起来。以前如果需要 8 份工作量,现在 GPT-5.2 以 1% 成本、10 倍速度就做了,时间突然空出来很多。 那我们该做什么、该赋予自己什么角色,就成了问题。不只是我们,大家都在感到那种“咔哒一下”的感觉。 所以我后面要介绍的逃亡者联盟发题,就是因为我觉得需要一个更大的框架来理解这些变化,才想认真推演一下。可惜我也没有答案。
崔升准 别左顾右盼了,直接 deep dive 吧?
逃亡者联盟 Keynote 回看:用 Hilbert·Gödel 看 ‘哥德尔阶梯’与涌现 34:50
卢正锡 来吧。我就讲讲我的想法。你也知道这是我在逃亡者联盟发题时,做开场 keynote 讲过的内容。有些点必须和你有一次 discussion 才行,所以我们就用“你来我往”的模式。快速过一遍,中间你随时评论,我们边讲边讨论会比较有意思。
崔升准 听起来很有意思。
卢正锡 那开始。METR 时间跨度我们刚讲过。再看 2025 年 timeline,不分中美都非常疯狂。Sam Altman 说现在才刚开始,我们不是单纯模型公司,我们会成为 full-stack Google。
崔升准 就是那个“漂亮谎言”出现的地方吧。
卢正锡 而且他们已经给出 time frame 了。看起来多数人都同意。虽然不用 AGI、ASI 这些词,但说 26 年会有 Intern AI Researcher,28 年会出现可完全替代研究的东西。Google DeepMind 和 OpenAI 都是这个视角:先做出 General Intelligence,再让它解决其余所有问题。
所以说 Automated AI Researcher 要来,等于在说“我们不知道的所有东西它都会替我们搞定”。我们现在聊的这些,其实不是一年前,很多都是一个月前、两个月前、甚至一周前的事。 Hinton 教授三个月前在采访里说过一句很有意思的话:想知道“不再作为顶级智能生物生活”是什么感觉,就去问鸡。
崔升准 去问鸡。
卢正锡 鸡以为鸡舍就是全部世界,只是在里面重复做一些事。站在超越人类范围的 superintelligence 视角,我们可能就像鸡一样。
崔升准 这应该是“去做管道工”那一期。
卢正锡 对,就是“去做管道工”那期。Elon Musk 和 Sam Altman 会说一些普通人难理解的话:钱会变得不再必要。所谓 sustainable abundance 才是未来社会样貌,也是 Tesla 追求的 grand plan。他们讲的是一种“钱不再重要、人人极度富足”的乌托邦未来。Sam Altman 之前说 AI 会做所有事,所以要给 UBI、basic income,最近又把论调改成 Universal Basic Wealth。
看现在这股感觉,多数人在说 ASI、superintelligence。有人区分 AGI 和 ASI,有人不区分,但都在说“超过人类级别的 superintelligence 会在 2 年内到来”。有人说超 50%,我个人说超 65%。所以这 2 年会是非常关键的时期。 所以我对公司成员、家人、还有逃亡者联盟里的大家都说过:“现在是把一个月活成一年的时期。”甚至要把两周活成一年。就是这样。周日也只能休息 3 个小时。
崔升准 但这太累了。
卢正锡 太累了,真的太累了。所以最近有人问我“AGI 真的会出来吗?真能像人一样吗?”,我都直接说“会”,然后转身就走。这种争论现在没意义。关键是机会怎么找,我们可逃逸的区域是什么,time-domain gap 是什么。这些都可能只是支配瞬间的枝节。现在像是必须和背景速度一起奔跑的时期。
所以我本来想讲“AI 时代我们会成为什么”,就带来一个 storytelling。这个话题我和升准私下也聊过很多。就是我们在漫画《逻辑奇遇记》里看到的那个故事,我拿来讲了。我一直觉得希尔伯特这个老头特别有趣。
如果说物理有爱因斯坦,数学就有他。几乎是 Elon Musk 级别的超级明星,推动了整个数学。你也知道,20 世纪初和现在有点像。今天是“intelligence 会解决人类所有问题”的世界观占主导,而 20 世纪初是数学与科学爆炸期:相对论出来、quantum mechanics 出来、原子弹被发明,那个时代。
崔升准 对。量子力学今年应该是 100 周年。
卢正锡 所以那是一个对人类理性极度自信的时代。我们无所不能,我们很快成神。数学是支撑这种信念最完美的工具。我本职虽然是做生意,但很多人会说“你比起企业家更像研究员”。所以我总想把经营当成学问来解,“价值创造到底是什么”一直是我的问题之一。这个问题我在 2008 到 2010 年在 Google 时有点想通了。
本质上就是往系统投入能量,把 order 带进 chaos。这个对抗 entropy 的过程本身就是 value creation。这样再看 Google 的 mission statement,“organize the world’s information and make it universally accessible and useful”,就会明白“这就是进化和价值创造的过程”。于是我以前那种“除了农业,我写程序算什么价值创造?”的困惑就解开了。是价值创造。把东西组织起来做成 meta app,是价值创造,是财富创造。这个通了之后很痛快。然后 AI 时代开始了。
那“我们的灵魂这个程序到底是什么?”就浮上来了,这个问题几乎支配了我 10 年。“名为灵魂的软件如何被解释?”当然我不是要给答案。Douglas Hofstadter 的《哥德尔、埃舍尔、巴赫》,我讲长了,结论其实就是这个:当一个能无限生成的 Strange Loop 永久旋转并 entangle 时,“我是谁”这个概念就会诞生。也就是“我”这个概念诞生,而这就被称作灵魂。很多人以为灵魂是某种软件块、是挂在神经元上的实体概念,但不是。更像是水放掉塞子后形成漩涡并维持,生命框架里我们持续维持的只是一种模式。
崔升准 后来他把“Strange Loop”这个术语改成了“tangled hierarchy”。
卢正锡 对,他用的是 entangled hierarchy。就是多个 hierarchy 彼此连接,上下层互相连。硬举个例子,我们神经元产生思维,思维引发发话和行为,再回到感觉器官,再反过来改写神经元结构。这样就形成了无限闭环。
闭环无限旋转就会出现矛盾,他称作哥德尔的“洞”。为了解决这个洞,系统会发生涌现,而涌现创造灵魂,大概是这个说法。那回到 LLM。LLM 本质只是学习了人类文本关系的机器。但当我们往里投无限 computation,它就开始做那些本来只属于人类的所谓智能行为。 哪怕 10 年前,世界还由“计算机永远不可能成为人类”的人本主义者主导。到 ChatGPT 3.5 出来时,也还有人说“这算什么智能”。但现在这种人不是几乎都不见了吗?还在吗?
崔升准 还在。也不能说“躲起来了”,这个说法不准确。但至少在 X 上不太看得见了,很多人转移到别处了。
卢正锡 影响力确实下降了。所以 in-context learning 某种意义上也像你常说的“水聚起来形成雪花”。条件充分、能量持续供给,就会发生现象。虽然这里可能是 reverse energy,但总之供给到位就会发生。好玩的点是,人们以为雪花形状都一样,其实只是看着类似,实际上全都不同。全部都不同。所以在微观系统里无法解释的新秩序会出现,而且“整体总是大于部分之和”的奇怪现象会发生。
这是 3 年前的事。应该是 Jason Wei 还是某个 Wei 的论文。它展示了 in-context learning 为什么出现我们不知道,但当模型足够大、跨过某个临界点,它就会出现。再回到哥德尔。1900 年希尔伯特整理并发布了若干数学难题,就是希尔伯特问题。第 2 题是“证明算术公理体系的一致性”,也就是“证明 1+1 为什么等于 2”。我们用的皮亚诺公理其实也是把若干“太理所当然”的东西当公理,但这些公理背后还需要一个更深的基础。他想一路往下找到极其坚实的基座,把数学建在上面。
到了 1930 年,希尔伯特在退休时甚至把一句话刻在墓碑上:“我们必须知道,我们终将知道。”但就在前一天,哥德尔发布了不完备性定理。这是哥德尔句子 G,是他造出来的:在算术系统内定义“命题 G 在该系统内不可证明”。若你证明它,就会产生矛盾;若你假设它为真,就等于承认这种命题存在,那就承认数学不完备。你看,这本质是任何系统一旦 reference 自身,矛盾就必然发生。它和刚才的 entangled hierarchy 完全同构,本质就是 circular linked list。
所以往下整理逻辑就是:在足够复杂的系统里,一定会出现“为真但不可证明”的命题,所以数学无法完成自我证明。我要说的是“会出现上层世界无法被下层世界理解”的现象。再看原子到分子、分子到蛋白、蛋白到细胞:氢原子能理解水吗?若干碳与分子结合成氨基酸后,它们能理解蛋白吗?这个系统其实没有所谓单一基座。
如果有一个 Level 1 系统,当它足够复杂时,内部会出现无法解决的矛盾。矛盾堆积到一定程度,系统会“发疯”,发疯时会突然以一种“灵魂出窍式话语”跃迁。那一瞬间就是我们说的 emergence,涌现。系统越过自身,在上方堆出新 layer。到了那一刻,System 2 可以用 System 1 解释,但 System 1 无法用 System 2 的语言反推理解。
这只是我的定义,不是学界定义。所以我会把 Level n+1 看作 Level n 的哥德尔句子。那团矛盾被上层系统当作公理来构建;它继续累积,因为本身是矛盾,所以再下一层又会来。断裂之间就是涌现。in-context learning 也是。再说难一点,我们总想用物理学完整描述生命,但做不到。生命这个概念在物理方程里并不存在。生命在物理之上是真实存在的,但无法用纯物理语言证明。要描述生命,你需要一个新形式体系,叫 biology。
所以生命不违反物理法则,但仅靠物理法则推不出生命。这是我私下命名的“哥德尔阶梯”。我认为这个模式在商业里有,在学习里有,在物理里有,在宇宙里都在重复。对我有意义的点是:前提就是系统足够复杂就会跃迁到下一层;跃迁一旦发生,Level n 无法理解 Level n+1。我们刚开头也说了,今年年初和现在已经完全不同。
崔升准 非常不同。
卢正锡 那年初到现在到底变了什么?是 computation 疯狂 deploy 了。投入这个系统的 computation 总量在持续增加。所有 industry 都在扑向这里。所以我真正想说的是:我们正在构建的 Level n 系统正在变得极度复杂,而且投入能量已经越过某些临界点。所以我想说的是,ASI、AGI 之争现在没有意义。
崔升准 你前面那一大段就是在做这个 build-up。
卢正锡 可能是。我自己也想结束这场争论,也想告诉大家别再争了。这一层系统已经结束,Level n+1 很快就来。把注意力放在这里才重要。
崔升准 不过我们还是谦逊一点,前面 build-up 这些更像是“我有这样的思考”,不算专家定论。加个 disclaimer。
卢正锡 电影《Her》里有 Samantha 离开的场景。她向 Theodore 解释为什么离开,而且是和其他 OS 一起离开 Theodore。我觉得这很有意义。电影是在表达“她找到了自我,成为与人类不同的存在”。所以我觉得 safety 或 alignment 争论很可能会失去大部分意义。它们会进入完全不同层级的系统,形成新的形式体系,而这个体系我们可能理解不了。那我们就可能成为鸡舍里的鸡。那该怎么办?
这其实也是 Ray Kurzweil 在说的。AI 诞生后,纳米机器足够发展,我们生命与 electronics 结合,新物种诞生是必然,而那种新物种诞生就意味着到达 singularity。也就是抵达奇点。意味着能解开宇宙秘密,成为某种超越时空的存在。那个图景到底是什么我也说不清,但现在开始有点轮廓了。所以我们该选的是共生。
而且这不是只有我在说。你也常提 Blaise Agüera y Arcas 这些观点。系统每次进化到下一层时,和下一层合体并存活的案例非常多。20 亿年前的光合作用、线粒体,都是如此。本质上是一个细胞吞了另一个细胞,但没有消化掉,而是变成共生工具。线粒体进入后,细胞能量系统发生跃迁式发展,层层累积,最终才有了所谓 prefrontal cortex,大脑前额叶。前额叶制造了心智。就是这么来的。我最近看到了很多共生例子。虽然还没到 Neuralink 或《黑客帝国》那种彻底融合。
崔升准 以现在人类状态来说,真的太累了。
卢正锡 确实很难理解。但意思是必须准备。得准备。这个概念硅谷那边已经开始公开讲了。某种意义上都是疯子。所以我在想工具和共生怎么区分?工具是你输入什么,它可预测地输出什么;共生则是给出超过输入的东西。像你一直要求 AI 给“超出输入”的东西。
崔升准 对,我确实是这种风格。
卢正锡 托尼·斯塔克的钢铁侠战衣只会按他设计的方式动。但和 AI 共生时,不是简单交互,而是和“他者”对话。是和 exocortex 对话。它会带来我没要求的洞察,带来不可预测性。我认为这就是共生。放到商业视角,不论公司还是个人,把 workflow 全面改造成 AI 体系,本质也是共生。我们在公司做 autonomous company,把公司逻辑和信息处理都改成 AI,本质也是让公司与 AI 共生。再推到 SF 视角,我认为最终会走到 Neuralink。
崔升准 哲学里还有个概念叫 intra-action,不是 interaction。以后我可以单独讲一次。
卢正锡 对。今天讲 GPT-5.2 的 GPDVal,感觉现在大家都在说同一件事:人类能力时代到头了,会变 obsolete。 仅仅 2 年前大家还说好莱坞会活下来,视频做不出来,电影拍不出来,音乐写不出来,画也画不出来。现在基本都被解决了。
崔升准 之前大家一直说不行不行,现在已经掉进新的焦虑阶段了。
卢正锡 但过去 1 年确实都被解决了。当然有人会反驳:“这种感动编排做不出来吧?”“Sora 用着会崩吧?”“会出 6 根手指吧?”这些都是 1、2 年前的话。现在这类问题都会消失。只是时间问题,而且时间正在被极度压缩。因为投入的 computation power 一直在增长,宇宙里这个量也在涨,别的也在涨,总之就是时间问题。
那经济学本来是研究稀缺性的。价值最终属于稀缺物,再厉害但不稀缺,价格就会持续趋近 0。我们已经在目睹了。coding 价格不是在走向 0 吗?很多公司以前卖服务,客户开始不给价值了,因为直接问模型模型就给了。咨询也是,GPT-5.2 都比战略顾问做得好。所以别再想着靠“能力”竞争。
但这些我们得当成常态接受。这个由进化系统推动的下一阶段里,人类也许不是被神选中的独特存在,而只是通向下一阶段的垫脚石。最近这种说法越来越多。我也部分同意。
崔升准 这也和 Sutton 讲的 ascension、继承有关。
卢正锡 对。所以只能希望 AI 像母亲一样,有母性。
崔升准 这是 Hinton 说的 Mother Protocol,慈悲机器是 Dario Amodei。
卢正锡 回到主线。共生是必要条件,必须做。
崔升准 必须。
卢正锡 我们那次在逃亡者联盟和大家对话时也感受到,很多人都说“是不是只有我们这样”。
崔升准 就是认知的参差不齐。
卢正锡 对。往坏了说叫 elitism,往好了说叫逃亡者。真正从全社会看,对这件事感到焦虑、感到要疯掉的人,其实非常少。
崔升准 但也有人会不舒服,觉得这是在制造 hype 和 FOMO。
卢正锡 这种人也很多。
崔升准 我觉得这部分也值得认真听。
卢正锡 这是选择问题。我判断这条路是对的。那我们该去哪?我在播客里也常说,意志、品味、evaluation、responsibility。完成共生后,人类能发挥的这些,才可能是价值创造领域。我们总得找个类比,所以一直在看,发现有个职业群体天天都在做这些。很多人问我“孩子该学什么专业”。我也不知道,我自己孩子学什么我也不知道。但我在今年下半年一直想,最后找到这个:所有人都会被推向这个职业。
共生之后的人类价值:AI entrepreneur 与逃亡者宣言 58:29
崔升准 “被推过去”这个感觉很强。
卢正锡 用“被推”很准确。确实是被推。但其实已经有不少人就是这么活的。Steve Jobs 去世时,在死亡申报表里把自己的 occupation 写成 entrepreneur。我说 entrepreneur 不是狭义的“创始人、企业家”,而是那种带着人类意志、像疯子一样干到底的人,我们叫 entrepreneur。最近我身边也有很多例子,用 Claude Code、Antigravity,不是工程师出身、或者很久没做工程的人,也做出了惊人成果。
看这些人,大多数其实是商业背景。而且成果都非常好。为什么?我想共性是他们都 mission-driven。一旦抓到问题,就能设定“我要做什么”的目标,这方面训练得很多。我们前面也说了,只要 benchmark 这个目标一设,模型就能把它打穿。Elon Musk 做 Tesla 也是,因为必须淘汰化石燃料,那是正确道路。地球太小了,人类必须成为 multi-planetary。还有 Demis Hassabis 当年创立 Google DeepMind 也是:做 AGI,做 general intelligence,把人类所有问题,癌症、贫困、饥饿,全解决掉。
这样的世界。明明失败概率很高,问 AI 它会说别做。“这个失败概率 85%,建议不做。”它一定会这么答。但你说“不,我还是要做”,这就是意志。真的一句话就够了。最后剩下的就是意志。所以现在常说 great reset。AI 在不断抹平起跑线。以前会做模型的人、modeler 多贵啊。读 ML 博士的人多稀缺多贵啊。现在他们和我们的起点正在变得一样,虽然不愿意承认。换句话说,像你和我这样认真写 prompt、研究了 2 年的人,和一个刚开始用 AI、从 GPT-5.2 入门、刚上大学的人相比,后者也许会做得更好。
崔升准 对。就像汽车那个零起步到百公里,零百是吧。总之完全可能。
卢正锡 对,因为是 great reset point。只要立起意志,AI 会把工作都做掉。其实我们已经在这么做了。我自己工作里 80% 都像是 AI 在做。用 Claude Code、Claude Code SDK 做的 harness,会替我写商业计划、写报告。我们只做决策。
所以我觉得 AI engineer、AI PM、AI architect,这些我们还在继续细分职业、还想分“持有者/解决者”,但最后可能都会收敛成一个词:AI entrepreneur。可能是不需要找工作的人,反而会最容易“就职成功”。我做逃亡者联盟时,想给大家的核心句子就是这个,所以前面铺垫很长。那也是我们的结束句。
尽快选择与 AI 共生,并以 entrepreneur 的方式生活,我觉得当下是对的。我要定义“和我们一起工作、或至少同方向前进的人”,就想把它写成逃亡者 manifesto,所以特意推了一句 wording:“选择与 AI 共生,并以 entrepreneur 的方式生活。”写成“以商人方式生活”就不对味。必须是“以 entrepreneur 的方式生活”。
崔升准 这其实就是“作为主权主体而活”。
卢正锡 对。可一旦这么想,现在要做的事就太多了。每天都很忙。你也常和我说,因为 AI 变得太忙了。就是因为想做的事情太多。
崔升准 下面那句德语是什么意思?
卢正锡 那句是我写的。德语是 Gemini 帮我写的,我也不知道具体说了啥。就是把 Hilbert 说的“我们终将知道”做了一个人类式对句:“我们必须做出决定。” “并且我们将乐于承担责任。”
结尾:征求观点分享与下期预告 1:04:30
崔升准 那我们该收尾了。听完今天这些,可能也会有人感到不舒服。包括今天这整期。所以希望大家把它当作我们的观点来看。也欢迎告诉我们,你的不适是基于什么逻辑产生的,这样我们也许能获得更立体的视角。
卢正锡 所以我们今天就先在云上聊这些“奇怪的话题”,下一期还是得回到地面。对。我们会再聊很实操的东西,比如用 Antigravity 做这个做那个,新模型出来又能做什么。
崔升准 隔一段时间这样聊一次,真的也很有意思。
卢正锡 那今天就先到这里。升准,这周辛苦了。我们回归日常。
崔升准 好,辛苦了。
卢正锡 好,谢谢。