EP 93
Claude Code源代码泄露之后
Claude Code 源代码泄露事件 00:00
卢正石 今天录制的时候是2026年4月3日, 星期五晚上。 大概是3天前吧。
3月31日,在愚人节前一天, 发生了一件像愚人节一样的事。 Claude Code 的源代码 整个被泄露了,发生了那样的事件。 是模型的失误,还是人的失误, 也有很多这样的讨论, 但官方说法是人的失误。 毕竟多亏了 Claude Code, Anthropic 在过去一年里取得了巨大的跃进。 所以也正因为这些, 这本来就是一个更受人们关注的领域, 泄露之后发生了什么呢, 有位人士把那个源码整理得很干净, 上传到了 GitHub 仓库,对吧?
高石贤 对我来说其实也是一件非常慌张的事。 那么大的源码就这样被上传上来, 是件很神奇的事,而且其实语言本身的特性 也不能不考虑。 毕竟像 Claude Code 这种情况, 是 JavaScript,更准确地说是 TypeScript 这一系的语言, 如果存在编译时留下的 map, 就能把源代码完美地恢复出来, 而通常所说的 CI/CD 部署和某种集成过程中 竟然把这些一起包含进去了,这就相当严重。
卢正石 是重大事故。 而且对 Anthropic 来说, 这真的是非常痛的一件事, 会对公司价值造成很大影响, 这绝对是一起非常重大的事故。 一位曾在区块链领域做安全的 华裔工程师 最先把这些东西的存在 发到了推特上, 然后很多人又去找那个, 试图做各种接触和访问, 而巧合的是,做这件事的人 是朴镇亨,也就是 Sigrid Jin。 这位在官方身份上是 Sionic 这家公司的员工。
Sigrid Jin 与 Oh-My 系列 01:46
高石贤 我们早期,我是 Sionic 的代表 石贤。 他也是我们的早期成员, 目前则是在公司休职中的状态。
卢正石 所以这个故事继续展开, 而这个故事的中心人物 正是 Sigrid Jin 朴镇亨,没错。 还有制作了 Oh-My-Opencode 的 연규,以及还有 Oh-My-Claude-Code 和 Oh-My-Codex 的作者(예찬) 现在 Oh-My 系列的作者们 这场争议的最中心站着三位, 而这三位之中有两位其实 正式来说就是 Sionic 的员工,没错。 还有 예찬、연규, 以及镇亨,彼此关系都非常近, 我把他们俗称为年轻神仙组, 他们就是那个圈子的朋友嘛。
崔胜准 所以我们今天为什么会来到这里呢?
卢正石 因为你们进行了最紧密的沟通, 从这件事到底对不对、是不是错开始, 跟 Sionic 的代表一起讨论这些,应该很有意义。
崔胜准 有点不知道这是命运,还是命运在开玩笑, 其实代表您第一次出演的第40期里, 不是说过有个特别会用很多 token 的员工吗, 然后在第70期镇亨也一起出场, 说什么 Ultra 100倍工程师, 不是也聊过这个吗? 还有最近 正石 提到的, 在 OpenClaw meetup 上很令人印象深刻的部分, 这些东西一路都像是连起来了一样, 我觉得我们是靠某种缘分的力量走到了这里。
去找 Sionic 的原因 03:14
卢正石 所以我们现在录制的地点是 和我们平时的 setup 不一样, 就是我们直接闯进了 Sionic。 对。所以把代表放在中间, 我们想非常直白地问问各种意见, 而且围绕这件事也有非常多的争议点。 这显然是一件错事, 但这些错误的事情,是不是因为做错了 就必须无条件地责怪, 还是说这会成为某种新的起点, 今后如果 AI 世界普及开来, 那些会发生在所有人身上的事 只是提前成了一个案例,我是这么想的。
崔胜准 错就是错, 但是它现在所象征、想传达的信息, 是我们讨论着讨论着才逐渐浮现出来的。
高石贤 我觉得把这个情况准确地告诉大家 是非常重要的。 刚才正石代表说 是“闯进来”,其实真的是这样。 这件事好像确实紧急而且重要到那种程度, 其实我们也是,我也是有很多话想说, 我会慢慢把这些展开来说。
卢正石 所以请最接近这件事的人 石贤 从官方和非官方两个角度来跟我们聊聊, 我们就把这次当作这样一个场合。 那么毕竟 只能先问最敏感的问题了。 我们在一个认真讨论的 群聊里,正圭代表也在,진원也在, 还有很多非常有名的人在里面, 关于这件事,大家的意见分得非常尖锐。 但所有人共同同意的是, 这是员工的失误 导致公司某种核心 IP 被泄露, 然后又积极地加以利用、传播、再利用这件事 是不是在道德上有问题, 这样的指摘是成立的。
利用泄露的 IP 是否正当 04:25
高石贤 所以在这个议题里, 最大的两条主轴首先是它是否正当, 以及它是否合法,我觉得会分成这两个。 一个是道德问题。 另一个则确实是法律问题。 不过这次的事情在我看来, 这两个方面有一点 被呈现得非常立体。 但其实这里面也有不言自明的部分。 在“是否正当”这个问题上, 如果只是表面来看某家公司, 其核心 IP 被泄露了, 再通过这个去获取某种利益,这正当吗, 其实无论是谁 大概都会说这并不正当。
卢正石 而且 Anthropic 那边 现在也是因为事情来得太突然、太大, 处理步骤来来回回在变。 一开始还说要用 DMCA 把源码全都下架, 接着又全部恢复原样, 在这期间那家公司 看起来也有非常多的 고민。 但他们现在 也确实有可能采取某种 法律程序。 而且对此 镇亨,或者推进这件事的人们, 也可能会产生责任点。关于这一点, 我也没有什么能断言的。
崔胜准 OpenClaw 的 Peter Steinberger 也因为那个 Claw 听说收到了类似律师函的东西。
AI 原生一代的版权认知 06:13
卢正石 那么问题就从这里开始了。 不管是我还是 胜准, 一边做着这种 AI 播客, 一边都在进入这个 AI 一键生成的时代, 我们为什么会进入这个时代? 因为模型太优秀了。 只要看到结果物,哪怕看不到它的规格, 其实也可以说 它已经算某种程度上完成了,胜准是这么说的。
而且其实现在 这些年轻人,把 AI 用到极致的 AI native 们, 对版权的概念其实非常模糊。 因为 AI 会把那些东西 就那样咔哒咔哒全都复制出来, 从别人做好的 IP 里 强力制造杠杆的工具。
所以如果有某个网站,是他们的目标网站, 就会从那个网站里只提取所谓的 juice, 再重新组合成某种新的服务, 这些已经成了他们一种新的、非常非常
高石贤 倒不如说是很一般的 payload。
卢正石 正因为是这样的时代, 现在 Anthropic 的源代码泄露了, 也不是只有镇亨那一组人在利用这个。 现在有非常多的人贴上来加以再利用, 或者上传他们解读后的解读本,非常多。 在我开始这期节目之前, 我稍微看了一下那个 Claw Code, 发现光是 fork 就已经超过10万次了。 已经传播得非常广了, 现在是所有人都在再利用它的那种状况,
那么先利用的人就是错的, 后面利用的人就是可以的, 直接利用问题就很大, 暗中利用就有问题吗? Gemini 也好,Grok 也好,隔着时间差 用现在所谓流行的说法来说, 各种 harness 们都会把这个最领先的 Claude Code 所拥有的那些东西, 也就是 Claude Code 的 juice, 精华、核心基因抽取出来, 植入到他们自己的工具里,植入到他们自己的 某种服务里。
但这也不只是 AI 才会发生的事, 在我们原有的开源社区里 这也是司空见惯的事情。
崔胜准 最近还把这叫作 whitewashing。大家都那样 用 AI 重新构建一遍, 再把许可证换一次, 不是有这种尝试吗。
卢正石 要向两位 在这里提个问题了。我觉得这 其实人去做的话,会觉得那份努力很可贵, 觉得做到这个程度也应该了, 但现在因为全都是 AI 咔哒咔哒帮你做, 谁早了5分钟,谁早了3小时, 就变成了五十步笑百步之类的问题。 现在正在出现。 所以那么,两位在这个时间点上 对于这件事,我也是以开放式的方式 向两位提问,所以想听听两位有什么看法。
崔胜准 首先就我个人而言, 我觉得,刚才我们在聊的时候 还是有很多遗憾。 正圭也说了类似的话, 其实还有其他能够展现实力的问题, 但这个恰好抓住了一个很有意思的时机, 才成了话题, 从某种角度看,在让我觉得“哇”的同时, 也让我觉得这件事真的有很多值得思考的地方。 我算是有点偏向产生负面情绪的那一边。 今天一边聊一聊, 也一边谈谈 那种情绪究竟是从哪里来的。
从 npm 泄露到 DMCA 09:34
高石贤 那如果把这件事按时间线稍微梳理一下的话, 就像我们刚才开头提到的那样, 它确实是被公开了。 在一个叫 npm 的包仓库里,这是失误。 通过这个失误而被公开的内容 又转移到了 GitHub, 据我记得,大概有 8 千个左右 被大批量地复制了出来, Anthropic 也非常迅速地采取了措施, 发出了与 DMCA 登记相关的、也就是著作权相关的撤回请求, 以及删除请求,如果按我记得的时间线来说, 在韩国时间凌晨 4 点到 5 点之间, 大部分仓库都被删除了。 当时也有点,该怎么说呢? 也出现了一些误删之类的问题。 比如自家的仓库被删掉了, 或者一些毫无关系的仓库 也只是因为名字相同就被删掉了, 这些都算是存在一些问题。 我知道 Anthropic 似乎也意识到了这一点, 所以对于除最初仓库和部分 fork 之外的大多数仓库, 撤回了删除请求,不过这其实并不意味着 他们放弃了著作权。 因为一开始的应对实在过于大范围了, 为了防止由此造成的损害, 对其中一部分关于著作权的请求,我就称之为 DMCA 吧, 他们撤回了这个 DMCA 删除请求, 这就是我所了解的截至目前的情况。
但问题是,明明有几千个仓库, 为什么偏偏振亨哥上传的那个 repo 会有那么多问题, 或者说,会受到那么集中的关注呢? 其实这个就是刚才提到的, 我们团队里其实也有那两位。 然后又很巧的是,那个小组 当时正好一起在旧金山。 我稍微推测一下, 他们应该是意气相投之后一起做了这件事, 而且那个小组 是以 Anthropic 公开出来的代码为基础, 对外说明说, 我们用别的 AI 模型 用 Python 和 Rust 重新构建了这份代码。 那么如果从外部单纯来看, 在传统法律意义上,很难说它构成了著作权侵害, 因为根本不存在一模一样的代码语句。 但其实大家心里都明白吧。 这是把核心想法这样重新编排了出来。 也许正因为这些,这部分才会非常敏感, 而在刚才提到的那个 DMCA 删除请求里, 这个仓库后来被排除出去了。
但我觉得之所以会那样,其中一个原因就是 速度实在太快了。 这可是一个相当于 50 万行代码的庞大代码库, 而这样的东西几乎在 2 个小时之内 就被完整地移植完毕, 然后公开了出来, 这一点让我相当震惊, 而且在这个过程中,那些对 Anthropic 不管是持某种方向上的支持也好, 还是对 Claude Code 非常感兴趣的工程师们, 来自全世界的这些人 都给了它非常多的 star, 总之 star 数增长得非常快, 从某种意义上说,这大概也让它一下子出了名。
2 小时内重写,病毒传播与梗的语法 11:49
崔胜准 现在 star 的语法不是已经变了吗? 比起代码质量,现在在更病毒式传播的部分上, star 的权重已经转移过去了。
高石贤 这是一个非常大的点。 其实我也确实和振亨哥聊过。 我问他,你怎么看这件事? 但我听到的回答比想象中更让人意外。 他说他自己觉得这就是个梗。 我问他为什么这么想, 他说实际上代码几乎跑不起来。 只是有个概念图而已, 他说那基本上就是一些垃圾内容。
即便如此,人们几乎也没去真正跑它, 只是因为它所代表的意义就直接点了 star, 而且,比起现在这个项目, star 更少的知名项目其实多得很。 比如 Kubernetes、Node.js、Go、Rust, 这些不都是非常伟大、非常知名的项目吗?
可是现在我们觉得有问题的这个 Claude Code 比所有这些 repo 的 star 都还多。 但人们真的跑过它吗, 这会不会成了一种不是代码先被认可,而是先有 star 的 另一套语法呢, 我记得当时好像聊过这样的话题。
崔胜准 按我的记忆,我也是这样 因为产生了兴趣就去看了看, 结果看到是中国那边有人上传的 把那个源码解压 ZIP 之后在 GitHub 上建了个 repo, 然后在旧金山那边,我想那大概就是那个故事, 好像当时确实存在那样一种信念。
所以睡了一觉,又 Ralphthon 完之后 再睡一觉起来,发现那东西已经变得非常病毒式传播了, 然后接着又有人说,啊,这个 好像是有点问题, 于是就做了 hard push, 这不也是现在再次存在争议的部分嘛。
当 Python 版本改一轮、Rust 版本也改一轮的时候, 因为模型上,这些人本来就是 harness 专家, 所以他们会大量跑那种像子代理一样的东西, 最终这次也是在大约 2 个小时内 把那件事做成了, 而且那件事大概在韩国的 GeekNews 上 也成了话题。
卢正石 对,对。 我的感觉是, 现在如果说我们很会用 Claude Code 或 Codex, 那其实依然只是我们所谓会用 Ralph 或者说并不是这类其他元 harness, 而只是在厂商提供的 Claude Code 或 Codex 已经存在的情况下, 很会做人类参与回路这件事, 这样的人现在就已经算是非常会用 AI 的人了, 而我之所以会关注比如艺赞、延圭, 还有振亨他们这一类人, 是因为他们在这之上又非常积极地 叠加了一层元 harness。
Meta harness 与极限 token 利用 14:11
他们在思考这东西还能怎么进一步扩展规模, 一开始就展示了极端的 token 消耗, 然后随着这种极端 token 消耗逐渐稳定下来, 又出现了几个,比如 UltraWork、Ralph loop 之类的, 甚至还有 Autoresearch,这些东西也很有意思。
其实所谓著作权这个东西, 艺赞把 Oh-My-Opencode 直接原样写成了 Oh-My-Claude-Code, 基本上就是那样重新写了一遍。 但原作者延圭和艺赞之间 会觉得这就是好玩,彼此也熟,也会互相交流。 可是在这里其实著作权早就已经全都被打破了。
说实话,不过现在这些人 通过展示那样的方法论, 所呈现出来的生产力远远高于其他人展示的, 这已经成了一个新的关注点, 而这次他们又把那种高生产力应用到了这里, 于是 Claude Code 这个本来就有 50 万行的东西, 也终究是通过拼命跑 Codex 把它改了出来, 现在就变成了一个叫 Claw Code 的形态。
崔胜准 但以那样的语气,振亨哥 大概还在推特上发了一篇长文, 说不要看手指,要看月亮。 这一切都发生在 Discord 里。 这件事现在到底意味着什么, 他确实是想传达类似这样的信息, 但对于那些听着这些、并且一路 追踪这个事件的人来说, 有相当多人会觉得现在重要的根本不是那个。
卢正石 但这些部分 我就说是我们这一代人的感受吧。 我们是一针一线地敲代码 并且会从中感受到某种同质感的 这样一群人所体会到的东西, 和那些刚开始接触 AI, 还在十几岁后半到二十岁出头的 AI 原住民们, 所呈现出来的视角似乎是根本不同的。
而且对他们来说,最初接触到的编程, 或者说代理式编程这种 AI 工具本身, 本来就是一种把著作权之类的东西统统无视掉, 然后全部“哒哒哒”点几下就给你做出来的机器。
崔胜准 虽然我们不能对此加以赞扬, 但我确实感觉到, 我们现在正在目睹某种时代的变化。
AI 编写的代码真相 16:53
高石贤 先来说一说吧。 那么在这里最大的点, 我觉得大概有两个。 一个是 Anthropic 最开始说过的, Anthropic 的大部分代码都是由 AI 写出来的, 那居然真的就是事实。 也就是说,那些代码 根本不能算是人写出来的, 而且说到代码的复杂度, 或者说所谓的美感呢? 其实所谓美感,最终大概就是可维护性。 人能够很好地理解,并且持续地继续构建下去, 也就是说 human interpretability 更高的代码, 过去我们其实把那样的代码称作好代码。
但这些完全没有被考虑进去, 只是那种适合喂给模型的代码, 以及那种像是模型会写出来的语法所写成的代码, 就那么赤裸裸地摆着,足足有 50 万行,
可如果这种代码要由人亲自去移植的话, 会花多久呢? 我觉得,动辄几十人、上百人的项目团队 几个月都是起步, 甚至有可能做了好几年。
崔胜准 观众们可能不太清楚, 就是说代码质量并不怎么好,对吧?
卢正石 对,因为 Claude Code 泄露了, 这种文章真的很多。 刚才非常厉害,对它的结构 也有很多解读文档, 但所以那些解读文档 偏偏大概一个都不是人写的, 应该全都是 AI 写的。
高石贤 会不会根本没人把它全部读完? 对啊。时间上来说。
卢正石 不过现在,代表님 随便挑了一个拿过来给我们看, 这些内容到底在说什么, 现在就稍微快速地过一遍, 毕竟我们也还是得学习一下。
高石贤 第一个说的是这个。 它说这是垃圾, 实际上我多次确认之后 也觉得,啊,原来如此,这真的只是为了产品写的, 写完就扔也有可能。 但其实最近在开发里 也经常这么说。 其实这和 clean room 在准确意义上也可能是一样的, 只要我们的规格足够准确,且实现满足它, 那实现方法本身是不是没那么重要。 所以某种意义上,这个叫代码的东西本身 是存在于产品之上的, 似乎被当成一种消费品, 而 Anthropic 在打造它这件事上 现在正拿出了最好的某种东西, Anthropic 实际上就是直接把这件事证明了, 也等于亲口说出来了。 我觉得这部分相当大。 我们一边往下看,一边聊聊吧。
这种部分似乎一直都存在。 这个是 Anthropic 在内部做某些贡献之类的时候, 有时会留下“Claude Code 参与了贡献”这样的记录。 但从某个时刻开始,这种记录不再留下, 或者说实际上看起来有减少的趋势, 在企业内部使用时也许有那样的目的, 但像这样被明确地挡住了。 或者被做成可以移除的规则。 这些看起来就更有意思了。 比想象中更简单,也更直观。 这种地方应该还有很多。
除此之外,还有非常多的东西 在分析技术文档里也有, 也被大量可视化并展示出来了, 但 Anthropic 真的就是把他们所说的东西 原样实现出来了, 也原样在用了,不是吗?
与此同时,相比其他竞争对手 虽然还不能说是压倒性的性能, 但可以说是很有“口味”吧? 是一个获得了那种支持的工具, 实际上内部也全都是这种事情。 并不是只有模型本身特别。 这一点也显得很特别。
卢正石 对,是这样。正圭님,正圭代表님也 说过如果把 Gemini 3 接到这个 Claude harness 上, 好像尤其更好, 也说过这样的话。 而且我们之前还在说,模型都已经发展到这个地步了, 还非得需要 harness 吗, 但像 Claude Code 这样的 harness 叠在上面的时候, 到底会发生什么事,会出现什么像魔法一样的事, 这一年里我们算是切身体会过了。
崔胜准 其实截至 4 月,也就是现在,3 月时所谓 harness engineering 已经变得极其病毒式传播了, 而它的触发点其实应该就是 Claude Code。
卢正石 所以现在模型和 harness 已经像 CPU 和操作系统 那样成了绑定在一起的概念。 模型现在就是 semantic CPU, harness 则是关于该如何处理它的 操作系统,而在这个操作系统之上 再叠加别的 harness, 就会变成各家公司的业务逻辑, 这样的概念正在逐渐成形, 而以最快速度在做这件事的 就是 Anthropic。
崔胜准 听你这么一说,感觉它就是写出了能运行的代码, 不是漂亮的代码, 但总之是把能跑起来的东西很好地打包了的那种感觉。
高石贤 这样看起来的地方确实很多。 我觉得里面也有艺术的部分。 但那个“艺术”,在我看来 好像并不在模型性能上。
这个 Claude Code 在内部集中关注的部分之一 似乎是极大的 token 消耗量, 以及和钱有关的部分。
看这次 Claude Code 泄露出来的内容, 它会调用各种工具,也会编写查询, 有很多这种一般 harness 会做的事。
但其中做得特别彻底的 有一个部分, 就是这个叫 prompt 的输入。 它会把 harness 的结果整理好, 尽量排得漂亮, 可以说是保持和以前一样的顺序缓存。 也就是让缓存生效的部分。
所以这个 Claude Code 当然也许确实有性能, 但它似乎也为了降低 Anthropic 内部的 GPU 使用量 并尽可能把 token 使用量做缓存, 下了很多功夫, 而其实这一点我也觉得 很可能正是 Anthropic 的核心资产之一, 我越来越这么想。
崔胜准 感觉它重视价值的地方有点转移了。
高石贤 对,这种部分也很多。 其实我自己 虽然也不是全都确认过, 但从经验上看,实际使用时 如果看一些定性的表现, 在其他模型上似乎也做得相当好。 和常说的 Codex、Gemini 这些模型结合起来 使用 Claude Code, 好像也能很好地运行。
其实在我们团队里 有 Oh-My-Opencode、Open agent 的开发者, 所以我知道它和 Claude 之间曾有点问题。 所以现在大概是还 不能联动的, 但 OpenAI Codex 那边允许了这个, 所以我理解他们正在以某种方式 使用它。
不过其实从那里看也是, 它不是那种只在特定模型上才好用的 harness, 而是在往更通用的方向走,不是在往那类任务 更 specific 的形式走吗, 这些一直都是我的思考,而它似乎把这点展示出来了。 我确实会这么想,
卢正石 虽然我们会这么聊, 但其实我们多少都看过了嘛。 它确实做得很好。 在概念上也很优秀,我们去控制 agent 的 这种 agent OS, 也就是现在所谓的 harness,不过如果再往上一层, 我预计以后会被叫作 OS, 其中该有的那些法则全都有。 比如上下文该如何管理, 然后就像代表님刚才说的, 要怎样把它做得更高效。
崔胜准 其实不过像 Gemini CLI 或 Codex CLI 这种 已经是开源了, 但这件事还是稍微有一种 只属于 Anthropic 的特别感觉。
卢正石 这个嘛。比如说,我记得 Anthropic 这边 许艺灿님在做 Oh-My-Codex 的时候 为什么会专注于让它拿到 GitHub star、变得这么有名 这种话,他本人曾在那个场合 讲过一次, 因为对那个人来说,开始做事的出发点其实 经常会说是我们人类的意志, 如果把项目做得那么有名, 人们就会自己去修那些 issue 里 该修的东西,当作任务,许艺灿님의开发课题 就会在做这些的过程中自己成长、发展, 他说过这样的结构其实已经在运转了, 从 Anthropic 的立场来看也是, 我们也会半开玩笑地这么说嘛。
社区吸收与 OpenClaw 24:03
那些上市公司,就是股票上市的 上市公司,如果想知道它们的战略, 去股票论坛看看就行。 “啊,我们公司这样做就行了”, 会有这种东西。 但在公司内部 其实不会那样去苦恼。
实际上“特斯拉应该怎样”、 “Anthropic 应该怎样”、 “Meta 应该怎样”这种话, 往往都是外面那些所谓的评论者 讲得特别多, 但从 Anthropic 的立场、从 Claude Code 的立场来看, 他们需要创造的许多创新原型 其实早就在社区里先出现了。 Ralph loop 出现了,然后在 open code 里 也出现了 team 这种东西,对吧,那个
崔胜准 也有种混进了 OpenClaw 那种味道的感觉。
卢正石 对,而且 Claude Cowork 从某种意义上说 也是在从现在 Peter 做的 OpenClaw 里 把那些优点拿过来。 所以如果说创意是一种 像基因团块一样的东西,那就直接去把它
崔胜准 而且还有能帮你做到这件事的工具。
卢正石 其实现在那就是模型。 这不就是在持续发展吗。 所以就像刚才 石贤 说的, 他们也不是靠什么人的努力 一针一线地硬磨进去的。
崔胜准 这当然会变成一种“并不是那样”的表达。
卢正石 是啊,就是 AI 把那个叫作创意的基因吃进去, 然后会在它们内部把它实现出来。 这些东西现在就像证据一样全都显现出来了。这个真是
崔胜准 泄露出来的是 2.1.88 版本,但就在这几天里,2.1.90、 2.1.91 也在今天几小时前出来了,没错。还会 계속 나오다고说。
卢正石 所以现在人们在说的, 我现在说这些,并不是为了要说 진형 或者 예찬 还有 연규 很不错、做得很好, 才说这些话的。 但是现在讨论的议题 已经在移动了。
哎,一看,Anthropic 也不过是把外部 存在的这些东西用 AI 咔哒一下拿过来 全都塞进里面的一大团东西而已, 那么,他们把这些组合起来的这个东西, 是不是该看作百分之百就是他们的, 还是说,这只是整个人类某种知识共同体 把整体创造出来的东西,被他们蒸馏之后形成的某种
崔胜准 以前也确实存在那样的约定或者 协议嘛。
卢正石 用“版权”这个词来说的话。
高石贤 专利、版权好像又是更大的概念。 如果只拿专利举例的话, 其实追溯专利的根源, 这并不只是为了保护知识产权, 而是为了让这件事对人类更有帮助, 也就是说,在特定期间内给予保护, 但同时公开其内容,让那些对人类有帮助的知识 应该被共享,大概是带着这样的想法存在的。
洁净室之争,AI 重写是否构成版权侵权 27:02
是啊,其实那是非常好的事情, 但其中大概也会有这样的但书。 虽然不一定是法律上的但书,但人们看了这个专利, 也未必就能原样拿来使用。
或者说,我觉得开源也是这样。 开源也是这样全部公开着, 里面有非常厉害的技术。 但是这个,就算你看了代码, 你也没法原样做出来。 但使用这个开源 更好、更便宜、更稳定, 最终还能在经济上建立护城河, 这原本是某种被所有人容许的东西, 但这次它被彻底打破了。
其实“洁净室”这个词, 我觉得并不合适。 因为关于这个“洁净室”的说法, 我觉得正在制造出非常多的争议, 其实最近,好像是 진형 来着, 有一次晚上我们打过电话, 那么你怎么看这件事, 对这种重新实现怎么看。可对方给我的回答是, 这是个梗。
是啊,我就想,这可能根本是另一回事, 我当时有这么想。
卢正石 请稍微把这层意思展开讲一下。 因为 진형 虽然把它定义成了梗, 但也有另外一些人说这个 是侵犯版权。 也就是说,视角完全不同,
高石贤 首先我先梳理一下“洁净室”的定义。 其实洁净室是指对某个代码或对象 在完全不知道其内部的状态下,去理解其运作方式, 也就是说,把它当成黑箱。 从外部进行分析, 然后做出一个能产生完全相同行为的东西。 所以这个东西既有被不良使用的情况, 也有被滥用的案例。 比如被用于规避版权, 当然也有好的案例。 比如说,用洁净室方式重新做出来的项目 可能会拥有更高的性能,以及更宽松的许可, 也有这种情况。 所以在这个开源行业, 或者说在这个开发行业里, 这也是个比较敏感的问题。 但现在这个仓库到底算不算洁净室呢, 从实际来看,这个 OpenClaw, 现在应该叫 Claw Code 吧。 因为作为原本源头的 Claude Code 的 TypeScript 版本已经公开了, 如果还主张说我没看过这个, 而且又无法证明这一点,那它是洁净室的可能性就会非常低。 至少从非常严格的定义上来说是这样。
那么,从这里开始我会想到另一种 讨论脉络, 那如果我们说 AI 模型,
崔胜准 不看怎么可能做得到呢? 在现在这个语境里,当然就是 AI 看了之后做的。
卢正石 你说的就是这个吧?
崔胜准 就是说大家都会看。
卢正石 这是个合理的假设。
高石贤 其实看那个仓库的话, 上面写着看过代码。 而且还写着这也不是我们的代码, 也没有得到 Anthropic 的许可, 甚至还写着这是看了代码之后重写出来的, 就是这么写的。 那么与其说只是从洁净室的单纯定义来看, 从这个标题开始就已经写着“重写”了。 所以它本来就不成立。
但如果去想为什么会用了“洁净室”这个词, 以 Anthropic 为例, 它至今应该学习了无数人写过的代码 或者人类的某种知识。 而那些内容里,本来就有人 只允许公开用途, 却并没有允许用于 AI 训练,哪怕只有一个人,肯定也有。 那么,人类拥有的这些开源内容 都在被这个模型学习, 而从这些已学习的模型中的某一个 再用洁净室方式重写,AI 能做到吗, 那这不就不是洁净室了吗。 但直到现在,不管是 OpenAI 还是 我大概一直都是这么理解的, Anthropic 和 AI 行业一贯的主张是,经 AI 重写、 解释出来的东西属于推理 和那种基于学习的产物, 所以这不存在版权问题。 这原本一直就是主要的讨论脉络。
可是 Anthropic 当事方, 也就是位于这场争议中心的 Anthropic, 在自家代码泄露的时候, 却通过 DMCA 要求把这些全部删除, 但是其中又像这样, 对于那些通过 AI 重写出来的东西, 删除请求里却漏掉了。 所以在我看来,这到底算不算洁净室,不是那样, 这是不是标准答案?也不是。 但围绕它的情境是非常立体的, 为什么会这样呢,虽然也是我们团队成员, 年轻人会这样说。 年轻人会说这是个梗。 从那里开始,其实认知就已经完全不同了, 我觉得这才是核心。
崔胜准 到底哪里不一样? 对于“这是个梗”这种说法, 我其实还没完全理解,所以想问一下。
高石贤 为什么会说是个梗呢? 其实我之所以觉得这是个梗, 是因为一直以来对于这种方式的重写, Anthropic 一直主张 这不构成版权侵权,但当自家代码泄露时, 对于把那个重新改写, 甚至是对那些根本不能运行的代码, 它反而会主张 DMCA 吗? 而且它最初也漏掉了, 甚至在后来撤回其中一部分的时候, 也依然一直漏着,
看到这种情况时, 我就在想,Anthropic 的基本立场到底是什么, 所以我才会觉得这有点像个梗。就是自相矛盾。 从某种角度看是这样。
崔胜准 其实 Anthropic 是去年底吗?还是今年初? “巴拿马计划”那个吞书工厂、吃书工厂 被 WSJ 介绍之后,成了相当大的话题, 虽然它在法律上是合规的, 但也确实引发过一种情感上的不适。
卢正石 不过我们回头看过去这个行业的发展。 往好了说,站在巨人肩膀上的案例 非常多。 往坏了说,就是站在别人的 IP 之上 做出某种处于灰色地带的生意, 然后快速做大,成为既得利益者, 接着在成为既得利益者的状态下 再把世界变得更正义的案例也非常多。 比如 YouTube。 YouTube 说白了原本就是个非法电影分享网站。 它是在别人的 IP 之上聚集了所有用户, 但现在又在做完全不同的概念了。 但与其说它是逐一厘清那些法律问题之后才走过来的, 不如说是随着世界变化就这么过去了。 所以从某种角度看,现在这个议题也是, 正是因为“技术”这个工具, 那些事情才会发生, 而 AI 这件事最后也会就这么被埋过去。 因为以后所有人都会这么做。 所有人都会这样做。
源代码价值趋近于 0 的时代 33:05
那么到底是看着代码写出来的, 还是看着背后在运行的 某个工作中的原型, 或者只是看着一个 UX 已经成形的产品再去复制, 其实差别非常小。 这也意味着,实际上源码这种东西的 价值也已经降低了很多。 那段源码原本所承载的意义, 现在只要有几个 PRD, 连那个本身都能被做出来,大家现在就是这么认为的, 已经是那样的世界了。 之所以能做到,全都是因为模型。 因为模型就是超级智能。
所以现在我们其实并没有在谈这个, 而是用一种非常过去的视角 去解释未来,不,是解释现在, 如果站在 2028 年超级智能处理一切工作的 那样一个世界里,在那个时点再回头看这件事, 这些都太理所当然了。 就算 Claude Code 的源码没有泄露, 只要有 Claude Code, 再配上一个能和它你来我往的超级智能, 这也会变成一天之内就能做出来的事。 所以那个说法其实有点偏离了原本的讨论脉络。 确实有把它转移到我新的视角里的成分 不能说完全没有 但这件事会变成法律问题,或者 会变成别的什么问题,而不是就这样直接过去的概率 我觉得是非常高的。 所以在这里,人们 就会又产生非常强烈的矛盾情绪。 如果这些东西是某种新世界的发展方向, 那么合理的做法呢, 就像 진형님 做的那样 最快作出反应, 最快拿下某种品牌效应, 现在先不论那是 notorious 还是 famous, 去做这些事就会成为合理的选择。
高石贤 例如说 针对这次 Claude Code 泄露事件 假设有某个网站做了技术性的评测 我们来这样假设一下。 于是就知道了它有哪些功能。 而且用户因为知道有这些功能,比如说 干脆是另一个 harness 项目,也可能是 Codex。 也可能是别的 OpenClaw 系的某种东西, 假设有人提交了规格说明,说我需要这样的功能。 我们就这样假设。 但那个人并没有看过代码。 也不知道他到底有没有看过代码, 他收到的是某种解读性的技术文档。然后向那个开源项目 提出了“需要这个”的请求。 那 AI 无论如何都会把它做出来。
那这算是使用了 Claude Code 的想法吗? 还是不算呢? 事情就会变得非常困难。 我们所理解的几乎绝大多数版权 其实都是以代码的同一性为标准的,真要这么算的话 刚才 DMCA 里有问题的那一行,不一样, 这些问题就被绕开了, 就彻底变成另一个故事了。
那么,关于人的某种智力能力、认知水平, 资源以及某种资本相关的东西, 建立在这些基础上的 IP 这个概念 会以多快的速度崩塌, 会多么迅速且毫无意义地消失或被替代, 其实我觉得这才是非常重要的点。
卢正石 也就是说,这种版权之类的 这些东西也都是围绕着 人所独有的 某种努力投入 现在是以“要保障这个”的方式写出来的。 有一种“我们会认可这种 human intelligence 的价值” 的部分,但现在人的价值, human intelligence 的价值正在变得非常微弱, 而 AI 则强大得多, 所以现在我们还在说这该怎么办, 要怎么做,但我觉得这种讨论很快就会消失。
比如说我刚才提到了搜索 还有 YouTube 之类的话题, 现在马克·扎克伯格对 OpenAI 把那些掌握核心 recipe 的人才 花了几千亿挖走了嘛。
那么 OpenAI 呢 其实所谓训练模型这件事 从某种角度看也是关于几个设计方案的 某种隐性知识被谁掌握着,对吧。 超参数要这样设定, 展示这个的时候数据集要用这个, GPU 会报什么错之类的这些事, 对于那无数个例外情况 那种成团的隐性知识才是核心, 但实际上那个人一跳槽,这些就全带走了。
那扎克伯格既然付了钱 那算是把 OpenAI 的 IP 合法地花钱买下来了吗? 那也不是啊。
高石贤 也有人说过同样的话。 至少马斯克是付了钱买的,但是 这里没有付钱。 其实也带点玩笑性质, 但确实感觉这里面有很多值得思考的点。
卢正石 对。那如果再拿这个 来做辩护的话,好,那我虽然没付钱, 但我也没靠这个赚钱, 也可以这样来辩护。 但就算按照过去的法律体系 也追不上 AI 已经造出来的这个现实。
高石贤 其实现在所有 CLI 和 harness 工具 都会突然迎来变好的体验。 会感觉像是在哪个 Claude Code 里见过的功能, 会有种好像当时用过的体验, 大家都会去做这个,而如果说我就是这样 这样做出来的, 那公开说出来就算有问题,而不公开说 就又不算问题吗? 这似乎也是一个非常灰色的地带。 但显而易见的是,所有人都会使用这个。
不过其实,像我们 진형님 的情况 当时是从我们公司休职了, 在加拿大上学,一个大学生拿着这个 说我是因为这样那样的原因感到害怕, 我拿着这个做了这样的移植。 这不是我的代码, Anthropic 也没有获得许可。 如果他把这些都公开写出来然后发出来的话, 这件事到底该受到多大程度的谴责, 我会非常好奇。
崔胜准 现在我自己想法也有点复杂, 这件事其实就在我们一直不断谈到的“咔嗒”情绪 的附近。 所谓“咔嗒”到头来也是 看到了它是怎么运作的 然后再去复现它会变得容易。 意思就是复制变得容易了。 所以我现在也还是觉得 可能还得继续聊一聊, 还有什么部分是你想继续介绍的吗? 我自己现在也有点思绪复杂, 但去探测 这到底行不行,并不代表这样就可以吧。
高石贤 其实当然不行吧? 这是应该从道德上去看的问题, 事实上法律和道德不是不同的吗?
崔胜准 现在就我个人来说 还是有点遗憾。
卢正石 对。从某种角度看 这是件让人非常不舒服的事。 但从另一种角度看,这是不是也在展示未来的 一个例子呢,也会有这种想法。
崔胜准 不过刚才我们稍微 recap 一下的话, 正石 在前面说过时代正在变化, 之类的话 也许是在我们录制的时候说的, 或者也可能是在我们聊天时说的, 但现在确实是有什么东西变了。
卢正石 对。AI 这个东西,怎么说呢, 是一个非常巨大的杠杆。 对,现在是一个所有人都成了钢铁侠的世界, 对。只是飞不飞、会不会飞,还是有人飞得好, 有人飞不好, 现在大家都还是有个人差异, 但从某种意义上说,那些真的飞得很好的人 如果去他们的社区说这件事, 他们会对那种行为非常憧憬, 感觉也确实有这种憧憬。 也有人会说,我当时也该那样做的, 我错过了那个机会。 但如果去另一个社区的话, 就会有人愤怒地说 这根本是说不过去的事, 现在根据不同社区 这个光谱非常宽,反应也完全不同。
崔胜准 当时发生的事已经发生了, 所以关于这个,这个 在没有什么 类似不利后果的状态下,是产生了激励吗? 那意思就是这样做也可以,所谓 new normal 就是这个意思吗?
高石贤 这个我觉得 还是应该由 Anthropic 来回答吧, 对,虽然我觉得很难 但我也确实有这种想法。 不过现在我和好几个群体聊过 也在商量着开始谈这些事。 大家共同有一个都能共鸣并同意的点。 以后出来的所有 harness 和开源项目 都会突然变得非常好。 关于这一点,似乎大家都没有异议。
崔胜准 问题在于可见性。 也就是说,有的人是公开了去做, 有的人虽不公开,但它已经被吸收进去了,是这个意思吧。
高石贤 反而如果公开出来讲的话, 会被视为非常不好的事情。 而那些实际上不公开去做的 builder 实际上产品就会变好。
卢正石 优秀的基因已经被投放到市场上了 大家都得捡起来放进自己的东西里
崔胜准 哪怕只是停留在规格或者某种想法的层面 它也很有可能会被复现,是这个语气吧。
高石贤 我是这么看的。 实际上也正在朝这个方向发展。 这次据我所知,在这个实现中参与了很多代码的 像 예찬님 这种情况 之前有一次 meetup 我在线下的时候 他曾经说过这样的话。 现在做开源, 仅仅通过接收用户反馈 功能就会持续提升。 也就是说,最终把这个实现出来的 AI 本身 已经便宜得不得了,几乎接近于零成本, 真正只有使用它的用户生态和市场价值 似乎在无限上升。 他之前就跟我讲过这样的话。 但这不也是一样吗?
用过 Claude Code 之后 会说这个在 Claude Code 里很好用, 但在别的开源项目里 因为可以用别的模型, 或者因为许可证没有问题,所以我们在用那个。 但如果它能像 Claude Code 这样运行就好了, 当客户或者某个开源项目的 issue 被提交上来时, 难道就不能去做吗, 那么那个想法并不是来自代码这一点 某种主张,能够确信吗。 我认为绝对不是。 那么这就会变成越来越困难的事。
崔胜准 也会让人想到,能做并不代表就可以做。
高石贤 没错。 如果这适合的话, 我觉得企业甚至可以故意泄露自己的代码, 然后说,这个想法虽然因为我们代码泄露了很遗憾, 但希望别的地方不要使用。 这会不会也可能成为一种 获取极其强大的知识产权的手段呢。 也许这是过度的想法,不过我是这么想的。 可能发生的事终究一定会发生。
卢正石 这或许也是 OpenAI 把 Codex 维持为开源的原因。 其实现在 Claude Code 确实领先了一步, 但那也是因为社区里有很多 被提议出来的很新奇的实现体。 所谓 Claude Code 虽然也是大科技公司, 但它把这些做得非常快, 反而是 Claude Code 以那种有点像 alpha 版本的方式 不断吸收新功能的话, 其实 Codex 反而是在后面跟进, 从中只挑出那些非常精炼的核心功能 干净利落地拿过来, 就是以这样的形态一路发展过来的。
从某种意义上说,大家都是共生。 共生,是。因为一直是以那种方式在发展,所以,怎么说呢。
高石贤 所以我这次刚听到这件事的时候, 虽然那也是我们员工,也是很近的人, 但我最初说的话并不是玩笑, 也就是说,真到了那一步,出来时我去接你。 这首先肯定不是件好事, 但如果你说你要做这个,关于这一点, 我觉得我好像不是适合发言的立场, 我好像是这么说过,而且其实有非常多的讨论, 只有当我们把想法理清楚之后 我才觉得自己可以谈这个。
所以我假设 Anthropic 大概是无法回答的, 我是这样想的, 如果他们真的回答了,那我们也许真的能 迈向下一步的某种东西, 我也怀着一点这样的期待。
崔胜准 也就是说,这件事,这件事有什么问题, 你们是在知道的情况下做的。
高石贤 我觉得它全部的含义都在于,“这只是个梗。 我把一段跑不起来的代码通过 AI 发上去了, 结果就达成了 100K,而且甚至超过了 GitHub 上 那些真正重要仓库的所有 star。 我的手机还关着,结果第二天发生的事是, 我明明还是原来的我, 但全世界的人都在找我。” 我没法只是笑着把这件事带过去。 这是多么赤裸裸的一个故事啊, 你说这是我们某种状态的些微变质, 也说这是另一种性质, 我觉得那一点似乎被看得太鲜明了。
卢正石 所以现在好像该把这个话题整理一下了, 我们没法对此做价值判断。 借用别人的不幸并积极加以利用, 在道德上是错误的。 但是从法律上,或者说 Anthropic 现在要如何行使自己的权利, 在这些部分上,因为牵涉到 AI, 可能会引发非常复杂的讨论。
崔胜准 现在正在发生的这些事, 或者今后将要发生的事, 也许会成为某种引水的象征, 这就是我现在有点想说的部分。
卢正石 我们在这里应该提出的 正确问题是,AI 就这样咔嗒咔嗒地 把我们所谓的知识 IP, 也就是知识产权这样的 IP 全都越过去了, 那么在这样的时代里, 我们该问的问题就是,附加价值到底是什么。
高石贤 看看我刚才一开始展示出来的这段 内容的话, 如果只从经济上看,也就是 PMF。 归根结底,市场是否需要这个, 在市场上能不能赚钱才重要, 想法当然重要。 代码本身的价值是不是正在变得非常低。 事实上,作为世界上最成功的 软件项目之一的 Claude Code,实际看来 几乎也是靠 AI 写的,而且不只是由 AI 来写, 代码质量当然也会有问题。 归根结底,客户需要的东西 似乎才是唯一重要的, 可是 AI 不是还处在非常早期的阶段吗? 那么这会越来越加速, 最终会不会走到这一步,代码的价值 常常说会变成 0, 虽然不可能完全变成 0, 但会不会更快地逼近 0, 我好像经常会这样想。
卢正石 也就是说,看起来 OpenAI 或者 Anthropic 好像凭借这些巨大模型 占据了很大的优势在做些什么, 但其实按 Peter Diamandis 或者 Elon Musk,或者比我们 思想还要激进得多的人来说, 这在 AGI 出现的瞬间 其实就已经不是源代码知识产权、 这些问题了。 只是人类所拥有的 一切智力能力的价值都会变成 0。 因为它会比我们做得好得多, 也会快得多。 到了那样的时代, 所谓附加价值是什么, 就是我们现在必须去思考的。 那么归根结底,像我们说的 PMF, 虽然说是 market fit, 最后还是会回到真正单纯的问题解决市场。
崔胜준 不过现在如果我听今天这个语境的话, 稍微这样听下来, 不管是我们的听众也好, 还是背景也好,毕竟都处在和技术相关的语境里。 这样一来,我们也可能会想不出框外的思路。
这也可能是在完全不同的领域里, 能以截然不同的视角去看待的 一件事件。 这一部分我们也并不清楚。 只是暂时会觉得有点不太舒服。 也不只是有点。
AI 代码生成与供应链攻击 48:37
先把这种可能性打开, 我还想再抛出一个话题, 不管是这周还是上周, 这次 AI 生成出来的代码 和安全方面的问题纠缠在一起运转,信号相当多。 有 LiteLLM,也有和 Axios 相关的事。
所以 Andrej Karpathy 也发过几次推文, 那些东西就是所谓的供应链,supply chain attack, 那是什么来着?
卢正石 有些库非常流行, 但有人会在那个库本身的代码里植入某种恶意的 东西,或者针对那个库所依赖的 更下层的库, 其实它们都有 maintainer, 也会依据某种开源社区的共识机制 来决定是否接收 那个 commit,像这样的事情会发生,
但事实上,在底层那种低层级的 库那一类情况下, 可能没有 maintainer, 或者只要稍微做一点贡献 就能取得 maintainer 权限的情况 也非常多,因为这是个很民主的系统, 所以在那种最底下没人关心的部分, 以修一些零碎小东西的方式, 因为所有东西都有 dependency, 所以会全部一路向上传播。因为都得改。 于是就会诱导出想要的行动, 这是一种社会工程。
崔胜准 但像这些东西,因为是通过 AI 来写代码, 如果是真正合格的开发者,本来应该会 lock down 好, 或者做类似处理,但只是咔嗒咔嗒跑一跑, 就直接用了那些有漏洞的库, 从而暴露在 zero-day 之类的风险中,对这些是有担忧的, 也确实出现了一些那样的影响, 另一方面,
然后这又像是另一种 我们常说的“技术债”那种表达, 现在是在批量制造另一种债, 太多代码、无法管理的代码、虽然能运行但 对那些无法细致审视的东西, 也就是某种生成速度和管理能力不匹配的 那种非对称性的信号, 现在在时间线上出现得相当多。
卢正石 但那个其实我们已经 在电子邮件时代经历过一次了。 当电子邮件只有少数某种先驱者使用时, 它曾是非常干净利落的手段,但等到所有人都涌上来, 并开始承载商业价值之后, 现在其实你们打开 Gmail 或 Naver Mail 看看。 90% 都是垃圾邮件。 这样的事如今在这个代码空间里 也应该会发生。 是,所以品牌会变得更加重要, 或者会出现把那些东西 做成商业模式的事物。 所以明明是同样的 LLM, 我们实际上却似乎会比起中国模型, 更偏好使用 Anthropic 模型或 OpenAI 模型的那种时代,不是也会再次到来吗? 正圭 之前也又一次 说过,会不会重新变成 品牌时代,这一点也和那个说法很相通。
崔胜准 再稍微回到 Claude Code 这边的话, 接着那个话题, 其实在 Boris Cherny 确认之前, 我们不是也在说,这明显是不是 AI 搞错了, 之类的话吗。
因为这个没有管理好, 而那其实是在去年年底, Anthropic 不是收购了 Bun 吗。 会不会是和那次收购案有关的 某种漏洞起作用了, 而且再打开代码一看, Axios 那边有那个东西, 会不会是从那里发生了某种窃取, 类似这样的意见曾经很多。
在公开是 Boris Cherny 之前, 大家不是还说过, 这不是人为因素的问题, 而是 AI 生成的代码没有被管理所导致的现象吗。
卢正石 对,那些现在都算是某种阴谋论,但也不好说。 其实像 Anthropic 这种情况, 是通过向模型委派更多工作的方式 来运作的。好,这次如果 说是人的失误, 但哪怕那其实是模型的失误, Anthropic 也绝对不会干出 说“这是模型的失误”这种蠢事。
崔胜准 是这样。因为那样打击会更大……
卢正石 说是人犯了错,反而会更有利。
崔胜准 不过还有个有意思的点是,Anthropic 那边 是 2 月底还是 3 月初来着,总之那个 zero-day 漏洞,Claude Opus 4.6 之类的程度是能找出来的, 他们是这么说的。 但如果做了自动化, 本来就应该很会找才对, 可结果又并不是那样。 对,所以现在这个事情有点 出现了一些对不上的地方。
高石贤 如果这真的是人的失误, 那会是个非常单纯的部署问题, 但其实在看到 zero-day 之前, 我也会想,他们一开始是不是就没在自家的某些流水线里 用 AI。 反而 AI 可能做得更好。 反而人可能才更有问题,
其实还有,这个是 稍微有点不同、也是刚才提到的内容, 关于供应链的某种安全攻击 我觉得原本就一直都存在。 只是虽然数量非常多, 但找出 zero-day 是一件非常需要 人力资源的事。 而且那一直都是以非常高的价格在交易。
但如果按照刚才提到的 Anthropic 关于 Claude Opus 4.6 那种说法, 能立刻找到 zero-day,再做出 exploit, 甚至还能实现逃逸,既然都这么说了, 其实安全就不是那么回事。 只要攻破最薄弱的一环,一切就都被攻破了, 而代码越是增加, 从概率上说就越不可能不出安全问题。 但改变的是,原本靠人的智力和 大量时间才能找到的安全漏洞, 现在几乎能被自动地实时找出来。 所以正因为这样, 我们是不是才正在经历 更多的安全问题,
崔胜准 这有点像在拼碎片, 感觉这个事件正变得立体起来。 这些东西就这样互相咬合着, 事情现在究竟要往哪里去, 所以哪怕是在资深开发者当中, 也会有人觉得现在跑得太快了, 应该稍微踩一下刹车, Mario Zechner 就这么说过。那个做 Pi 的。 所以现在似乎也需要某种认知上的变化, 以及在实际工作中能做到的事和无法管理的事之间, 也好像能感觉到一些落差。
卢正石 对,不过这有点像囚徒困境, 所以这个变化的方向是停不下来的。 哪怕我按兵不动,那么行动的人 就会踩着我获利, 而当这对彼此都产生同样影响的那一刻, 大家全都朝着那个方向奔去 才是最理性的做法。这是拦不住的。
高石贤 而且还会进一步加速。
崔胜准 那么加速的意思是,安全事故会继续不断爆发吗?
高石贤 对,刚才那种针对供应链的攻击 也可以通过用 AI 重新实现来解决。 如果能把整个代码库都内化的话, 既然有 AI,若是可行, 那反而会成为一种可控的手段。 至少虽然也有问题,但像知名开源 或库带来的问题, 是可以稍微挡住一些的,当然 AI 写出的代码 也可能更有问题。 但因为它不是攻击者关注的目标, 反而会藏得更好, 某种意义上有点像黑暗森林。 对,我有这种感觉。
但世界变化得太快了,而其中所谓的问题点也好, 门槛也好,似乎全都来自于人的思考能力、 人能够工作的时间、智力能力, 看起来都源自这些地方, 所以我觉得安全也是一样。
崔胜准 我们是不是只能就这么承受它, 然后继续迈向下一个阶段。
卢正石 如果我做个非常粗暴的概括,在那些一个个具体要素中, 去解释某些东西、去定义某些东西 这种工作本身, 也很有可能不再是人类的工作了。 也就是说,把所有问题都直接还原为 computation, 就可以处理。 所以与其花时间去担心和讨论那些事, 我们把时间用在 更努力跟上这个世界的变化上 才是对的,这算是我现在的一种,算是我个人的策略。
高石贤 最后不会只剩下人的品味和偏好吗? 人从根本上更喜欢的产品, 从根本上更喜欢的形式,这些东西留下来, 其余的会不会全都被 AI 做掉。 即使人不喜欢,但人在那样的环境里 我们还想做些什么, 我们明明还是 maker、还是 builder, 可如果 AI 做得过于完美, 那最后真的会不会只剩下那个。 我觉得那是反乌托邦。
卢正石 也可能是反乌托邦,也可能是乌托邦。 对,不过比如说, 如果来到一个拥有无限 computation 的时代, 于是像《黑客帝国》那样的世界来了, 我们身处的不是现实,而是理想化的虚拟现实之中, 却做着和现在生活一模一样的事, 那算是乌托邦吗?还是反乌托邦? 对某些人来说是反乌托邦,对另一些人来说是乌托邦。
高石贤 我之所以说是反乌托邦, 大概是因为我从根本上就有点 想要创造些什么,作为 builder 的 这种偏见存在吧。 但如果是真正出生在那个时代的人, 他们也可能会觉得,这本来就是理所当然的,世界本来 就是这样的。 就像现在这个事件一样,所以我们
卢正石 现在绕来绕去,终于要走到某种结论了, 但我们正在谈的这些结论 是否真的正确,多少还是有些疑问, 不过核心不是说这件事错了、对了, 而不是去谈 那些, 这个事件所展现的本质是,今后这种事会变得极其司空见惯。
崔胜准 将不再成为议题。
卢正石 还有,这些人,像 진형、 像 예찬、像 연규 他们向我们展示的, 他们是如何通过 computation 比别人制造出更大杠杆的方法论, 并以具备这种形态的方式获利的,这一部分。
崔胜准 不过说到底,那终究还是 正石 先生的领域 因为有很强的商业偏向, 所以也只能从那个角度来讲, 我是这么认为的。 但我自己其实也没法太好地 对这件事进行跳出框架的思考。
不过就像刚才提到的 Mario Zechner 所说的,生产性的摩擦 这种东西是不是还是应该握在手里? 在 builder 的语境里,我曾喜欢这件事, 并赋予了它意义、价值的那些东西, 不应该只是一路顺滑地过去, 我是有选择权的。 我觉得这句话也有被尊重的必要。
但如果拿着这个 去做事业、去往前冲的话, 从某种角度看,那也可能只是种悠闲的说法。 我也是这么想,但即便如此, 我还是觉得,围绕这件事会有各种不同的意见。 会有不同的态度,而那同时也是价值, 也可能是品味。
卢正石 对,没错。 其实我们今天原本的计划是 也想看看 Claude Code 的结构, 以及它们的 agent loop 是怎么写的, tool 是怎么调用的,又是如何做 memory 管理, 还有它到底是不是真的做得很好, 这些我们其实也想聊一聊,
不过这些都已经变成了,大家把各自的仓库 和 Claude Code、Codex 一起放进去, 然后咔哒咔哒自己学习就行的世界。 现在还有不跟着模型学习的人吗?
那我最后在结束之前 想问一个问题。 看看现在这些正在发生的情况, 感觉这个 harness 和 LLM 之类的结合起来之后, 好像成了一种新的单位, 也让人觉得它将会如此, 而且这对商业也有相当多的含义。
harness 工程与商业的未来 59:52
我想再稍微请教一点商业上的问题。
高石贤 我越来越强烈地感觉到 harness engineering 也正在变得非常领域专用化。 其实连 harness 这个词本身出现, 我想都会让很多人觉得陌生。 但它真的非常重要,而且被广泛使用, 也确实正在解决某些问题, 所以如果只是把它当成一种新的流行词, 我觉得它其实更沉重也更重要, 事实上我们也是一家在做这种 harness engineering, 或者说更早以前做 prompt engineering 的公司。 还有和 context 相关的语境管理, 也是做这类产品的公司。 所以自然而然地,身处其中的人 也就不可能不对这个产生很大的兴趣。
但比如说,这个如果说是这样的话。 最近最受欢迎的 harness, 或者做某种 core loop 的 像 Pi 这样的项目, 都非常简单。 只拥有大概三个功能, 用 Bash 之类的, 真的只是靠最基础的功能在运行, 而这些东西还在不断被细分、被做出来, 在我看来,有些点实在是太明确了。 OpenClaw 也是如此, 其实我们对于 AI 公司会有一种什么样的感觉呢? 就是那种很会做模型, 而说到模型,当然也包括把数据打磨好, 训练、评估, 我们一直以来都觉得, 它们的大部分能力应该都集中在这些事情上。 实际上我也确实这么认为。
但这次看 Claude Code 的内部实现, 那种把产品打磨到极致的感觉,如果把它看成 SaaS 的话, 就像是真的把用户可用性研究了 10 年、20 年一样, 这种感觉非常强烈, 代码不重要,代码结构也不重要, 客户会怎么感受,真正使用这个东西的用户 会得到什么样的感受,会取得什么样的成果, 我感受到的是,他们一直把注意力集中在这上面直到最后。
但问题是,这居然是一家 AI 公司。 那么 앞으로真正重要的是什么, 我觉得就是从这里 自然而然得出的一个点。 归根结底,重要的不是某个模型, 也不是某个 harness,而是客户想做的事, 以及我想做的那个领域, 能让人把能做的事真正做成, 以最优成本、最优方法 去完成设计的团队, 才不得不成为下一家成功的公司, 但对我的业务、对我想做的事情来说, 什么会对我的某种乐趣有帮助呢。
首先,这似乎会成为一个明确的标准, 而且 PMF 一直才是最重要的,代码也不重要, 这些话我一直在反复说, 其实我自己也是 一个写了很长时间代码来工作的人, 所以这让我觉得非常别扭,甚至有点不舒服, 但我认为这正在走向一个再明显不过的未来。
卢正石 说到底,我们好像可以 这样打个比方。 以前在 PC 时代刚开始的时候, 还会争论这是 7 位韩文还是 8 位韩文, 是完整型还是组合型之类的, 有过这些东西, 但现在已经毫无意义了。 电脑只是成了一个帮助我们的巨大工具, 托它的福,我们的工作反而变得更多、更复杂了, 但这个也是在扮演那样的角色, 成为一种新的工具。 是的,所以虽然我们现在还无法知道, 但人类大概又会变成追逐新价值的存在。
崔胜准 虽然也可能有一种在追逐的感觉, 但我最近也很常感觉像是被推着往前走。
高石贤 我也同意。是的。
崔胜准 总之,会生出各种各样这些想法的 好像就是 4 月 1 日前后那段时间。
新工具创造的新价值 1:03:25
卢正石 虽然还有很多想说的, 但这个话题就先说到这里, 我们在赛奥尼克的录制, 就到这里结束吧。 好,辛苦了。
高石贤 辛苦了。