首页 / 作品展示 / 作品详情
最新对话Claude Code负责人: 智能体时代的爆发, Anthropic重构

最新对话Claude Code负责人: 智能体时代的爆发, Anthropic重构

发布日期:2026-06-02 10:27 谷悦网络
最新对话Claude Code负责人: 智能体时代的爆发, Anthropic重构

Web3SkyCity.AI

Anthropic如何通过ClaudeCode重构生产力边界

在硅谷的技术版图中,Anthropic正处于一场风暴的中心。随着AI从简单的“对话框”向具备行动力的“智能体(Agent)”演进,其旗下的Claude Code正以一种令人咋舌的速度重塑着软件开发乃至整个知识工作的逻辑。在昨天上线的最新深度访谈中,Claude Code负责人Boris Cherny揭示了这一产品背后的指数级增长逻辑。据Anthropic首席执行官Dario Amodei透露,公司产品的需求量同比增长了约80倍,而ClaudeCode正是这一增长的核心引擎。

图片

目录


全局摘要与核心观点

指数级增长与技术范式转移

产品与 API 的双轮驱动

从聊天机器人到主动型智能体 (Agent)

组织变革与 Token Maxing 的迷思

生产力悖论与 AI 的“文件柜”时刻

智能水平、效率控制与技术局限

智能体的日常化与信任建立

速率限制、算力扩展与行业竞争

主动模式、并行处理与更长周期的任务

个人杠杆的爆炸式增长与未来全职工作

软件产业的护城河演变

终极对决:自我进化、世界模型与 AGI 路径

终极市场测试与早期采用者的未来

全局摘要

本次访谈深入探讨了 Anthropic 旗下 ClaudeCode 产品的指数级增长及其背后的技术范式转换。访谈嘉宾 Boris Cherny 分享了从传统聊天机器人向具备“工具使用”能力的智能体(Agent)转型的核心逻辑,讨论了 AI 如何真实地提升企业生产力,并对未来 AI 的自我改进、商业护城河的演变以及 AI 安全等前沿话题进行了深度剖析。

核心观点

  • 范式转移
    :ClaudeCode 的核心突破在于从简单的“对话预测”转变为能够使用工具、操作文件的“主动智能体”。
  • 生产力实证
    :Anthropic 内部数据显示,引入 AI 辅助后工程师代码产出量增长约 250%,且质量保持稳定。
  • 组织重构
    :要从 AI 中获得真正收益,企业需效仿 90 年代计算机普及期,围绕 AI 重新构思整个业务流程。
  • 护城河演变
    :AI 将显著降低软件间的转换成本,网络效应和规模经济在未来竞争中的地位将更加凸显。
  • 自我进化
    :模型已在实现“由自己编写自己”,未来将走向更深层的自我强化循环,安全始终是核心边界。
图片
01

指数级增长:从预测工具到行动智能体

在过去的一年里,AI工具的进化轨迹经历了从“自动补全”到“自主代理”的质变。Cherny指出,早期的AI主要是在预测下一个单词或代码片段,但ClaudeCode的出现打破了这一僵局。

在使用聊天机器人时,你是在进行来回的对话,而智能体——ClaudeCode就是一个智能体——它可以使用你的工具。”Cherny解释道,这种微小的差异彻底改变了产品的能力边界。现在的ClaudeCode不仅能编写代码,还能连接浏览器、操作本地文件、甚至登录Cloudflare等云平台进行系统设置

这种技术能力的跃迁直接反映在业务数据上。Cherny坦言:“我从未见过如此深度的增长,而且这种增长还在不断呈指数级攀升。ClaudeCode完全由ClaudeCode编写,这种自我驱动的开发模式正成为常态。”这种“用AI构建AI”的闭环,不仅缩短了开发周期,更证明了智能体在复杂系统构建中的成熟度

02

生产力悖论与250%的增长奇迹

尽管硅谷充斥着对AI的狂热,但质疑声也随之而来。有一种观点认为,目前的AI使用量中有一部分是由所谓的“Token Maxing(刷流量)”驱动的——即公司为了达成AI应用指标而强制消耗Token。

然而,Cherny通过他在Meta时期的经验对此进行了反驳。他指出,在传统模式下,工程师每年的生产力提升幅度通常仅为1%到3%,且极其难以达成。而ClaudeCode带来的变化是阶跃式的

自我们引入ClaudeCode以来,Anthropic每位工程师编写的代码量增长了约250%。同时,代码质量、可靠性都保持在稳定水平。”这种提升并非源于无谓的刷量,而是源于工作流程的根本改变。他建议企业不要过度纠结于早期的Token消耗,而应给予员工实验的心理安全感。“生产力的提升往往来自那些你意想不到的人。可能是一个会计实现了流程自动化,也可能是一个刚毕业的工程师构建了惊人的系统。”

图片
03

90年代的启示:扔掉“电子文件柜”

为了解释为何有些公司引入AI后未见成效,Cherny引用了90年代《哈佛商业评论》关于“计算机生产力悖论”的经典论述。当时计算机已普及,但生产力并未立刻飙升。

要想从计算机中获益,必须围绕计算机重构整个业务流程。如果你依然保留着实体文件柜,计算机只是边缘工具,你便无法获益。”他认为,现在的AI应用正处于同样的转折点。如果企业只是把Claude当作一个更高级的搜索引擎,而不在核心业务流中为AI代理预留位置,就无法释放其全部潜力

这种重构已经延伸到了非技术领域。Cherny分享了他使用Claude协作工具(Co-work)订购机票和酒店的经历:“它通过查看我的邮件和日历发现了我的行程错误,然后在一个小时内预订了8趟航班和5家酒店。”这种从“建议”到“执行”的跨越,正是AI从辅助工具进化为虚拟员工的关键标志

04

软件行业的“SaaS末日”与护城河重塑

当AI能够自主编写代码和集成API时,传统的软件商业模式正面临挑战。Cherny用经济学的视角剖析了未来商业护城河的演变。

他认为,转换成本(Switching Costs)作为一种护城河的重要性正在下降。“如果你想从供应商A切换到供应商B,你只需要让智能体去执行迁移即可。随着时间推移,智能体在这方面的表现会越来越好。”这意味着那些仅仅依靠“绑定客户”而生存的软件公司将面临危机

相反,网络效应和规模经济的价值将进一步放大。无论代码是谁写的,拥有庞大用户连接和底层基础设施规模优势的公司,依然能保持竞争优势。对于开发者而言,未来的核心竞争力将不再是写出某段特定的代码,而是如何利用AI代理作为杠杆,去撬动更大规模的业务

图片
05

通往AGI之路:自我强化与人类的最后岗位

访谈的最后,话题转向了AI的终极演化——自我改进。Anthropic的共同创始人Jack Clark曾预测模型可能在2028年前开始自我改进。Cherny对此并不感到惊讶,因为他正处于这个过程的中心。

虽然现在是ClaudeCode在编写自己,但进行提示词输入的仍然是人。在某个时间点,这种情况会发生改变,模型会演变成一个自我强化的循环。”为了应对这种演进带来的风险,Anthropic投入了巨大的精力开发“自动模式(Auto Mode)”,即通过一个模型去审计另一个模型的安全性

面对“AI是否会取代人类工作”的终极疑问,Cherny表现出一种乐观的审慎。他认为,即使AI能自动配置Salesforce、处理IPO文件甚至处理税务,最终仍然需要人类去提出“正确的问题”

关键在于个人所拥有的杠杆效应出现了爆炸式增长。”他总结道,“提出正确的问题所蕴含的影响力,将成为未来人类工作的核心价值。即使链条不断深化,最终你仍然需要有人来掌控这一切。”

这场由ClaudeCode引领的代码革命,或许只是智能体时代的序幕。

完整访谈

天空之城全文图解整理| 深度对话 ClaudeCode 负责人:Agent 时代的爆发式增长、生产力变革与技术未来

图片

指数级增长与技术范式转移

Boris Cherny

我从未见过如此深度的增长,而且这种增长还在不断呈指数级攀升。Claude Code 完全由 Claude Code 编写。Co-work 完全由 Claude Code 编写。在 Anthropic 和相关产品中,由 Claude Code 全程编写的功能正日益增多

Alex Kantrowitz

所以我很想听听你对 token maxing 的看法,以及你是否认为这占据了你们所构建产品使用量中的很大一部分

Boris Cherny

我不写代码。我提示 Claude。实际上现在我大部分时间都在做的是,让一个 Claude 去提示其他 Claude。所以我甚至都不直接与 Claude 对话。我有一个 Claude 专门与我的 Claude 进行交互

Alex Kantrowitz

让我们与 Claude Code 负责人 Boris Cherny 聊聊该产品爆发式增长的话题。接下来的路线图是什么,以及这一切是否具有可持续性?精彩内容,稍后即来。

欢迎收听 Big Technology Podcast,这是一个聚焦科技界及更广阔领域、探讨冷静且深入话题的节目。今天我们要为大家带来一期精彩的节目。Claude Code 负责人 Boris Cherny 今天来到了我们的演播室。我们将全方位探讨这一产品、它迅速崛起的原因、未来发展路线图,当然,还有它是否具备可持续性。我们将深入讨论 Token maxing、Token 低效问题,当然还有知识工作的未来

所以,我们需要探讨的话题非常丰富。Boris,很高兴见到你。欢迎来到本节目。

Boris Cherny

好的,感谢邀请。

Alex Kantrowitz

那么,我们首先来谈谈 Claude Code 的增长情况。它的增长非常巨大,我认为在最近的一次活动中,Anthropic 的首席执行官 Dario Amodei 谈到了 Anthropic 产品的需求量同比增长了约 80 倍。我记得去年这个时候曾与他交谈,当时他为 Anthropic 达到 40 亿美元的年度经常性收入(ARR)感到激动不已。现在看来,那个数字已经显得微不足道了。目前的数字显示可能已经达到了 450 亿美元,所以,那里增长了 10 倍,需求增长了 80 倍,问题在于公司能以多快的速度来满足这些需求。但请谈谈 Claude Code 在这部分需求中所占的比重,以及你在需求增长和使用人数方面所观察到的情况

Boris Cherny

对于世界上越来越多的人来说,我认为使用智能体和使用 AI 的方式,不仅仅局限于 Anthropic 的产品,尤其是 Claude Code。当然,对于 Anthropic 而言,有很多不同的产品。有 Claude Code,有 Claude AI 聊天,有 Claude Design,有 Claude 工作台,还有各种 API 产品。体验 Anthropic 的方式有很多种。但对许多人来说,Claude Code 是他们初次接触的切入点

没错,这种增长简直疯狂。当我们最初在内部发布它时,它立刻就呈火箭式增长。因此,在我们向 Anthropic 外部的任何人发布 Claude Code 之前,我们就觉得这很有可能会大获成功。大约在我们发布 Opus 4 和 Sonnet 4 的时候,也就是去年 5 月,增长直接呈指数级飙升。我从未见过如此陡峭的增长。而且它一直在持续走高。Opus 4.5 是在 11 月,然后是 4.6,那是今年 2 月,接着是 4.7,你只会看到它不断地出现转折式上升。

而且,我们团队中有很多在科技行业工作了很久的人。并且,我们参与过各种各样的超高速增长产品。这就像是你在科技界一直讨论的话题一样。这些就像是超速增长中的象限,但即使是在团队内部,我们也从未见过这样的增长速度。所以我们只是在设法弄清楚该如何实现这一点?这样每个人才能持续获得这种体验。我们要如何做,才能在未来继续以我们预期的空间和节奏增长,而这种增长速度甚至可能比今天还要快?我们正在深入研究如何做到这一点,以及如何持续扩展这些服务。


产品与 API 的双轮驱动

Alex Kantrowitz

一年前,很明显 Anthropic 的 AI 模型绝大部分的使用量都是通过 API 产生的,这就像是一家公司,比如一家咨询集团,将其投入实际应用。比如在一家银行,银行使用它来汇总一些计算结果。我只是随口举个例子。与 Claude Chatbot 相比,API 在使用量、收入以及所有这些方面都占据了绝对大头。如今情况依然如此吗,还是说 Claude Code 正在赶超这一态势?

Boris Cherny

我们目前是两者兼顾。正如你所知,相比一年前,产品对于 Anthropic 而言发挥着大得多的作用。情况确实如此。产品增长正在加速,发展非常迅速;API 也在同步加速并快速增长。而对于我们来说,我们正同时在两方面进行投入。

我们必须成为一家产品公司,因为对于一个实验室来说,构建产品有着诸多理由。其实在早期阶段,这一点并不明确。比如在 Anthropic 历史的极早期,也就是我加入之前,这实际上曾是一个热议话题。我们到底应不应该构建产品?就像这真的有实际用处吗?事实证明它非常有用,这不仅是为了提升公众影响力,也是为了安全。从根本上说,我们存在的目标就是研究 AI 安全。这为我们提供了更好的工具来实现这一目标

我们的人员规模也很小。因此,世界上大多数东西我们都不会去开发。这就是为什么我们必须提供一个平台。我们有托管智能体、API 和 SDK,所有这些产品。这样人们就可以基于此进行构建。成千上万的企业选择了这样做。

Alex Kantrowitz

听到你回答说这是一个混合体,这很有意思。所以我认为你现在不会透露哪一个规模更大。也许现在不会。好吧。但事实是,并没有明确的结论说 API 的规模更大。也许确实如此。但你甚至说这是一个混合体,这恰恰表明 Anthropic 自有并运营的产品正在飞速增长

现在,如你所知,我们已经奠定了基础,表明这是一个正在呈指数级增长的事物。显然,我们也看到了 Anthropic 的收入伴随着这一产品呈指数级增长。这是一个由你构想、构建并运营至今的产品。我想可能有一些观众会问,Claude Code 到底是什么?当然,我们的大多数观众都知道它是什么。当时我就在想,该如何用一个简单的单句定义来描述它?于是我写道,这是一种用简单英语构建网站和软件的方法。但在过来的路上,我又觉得这种说法稍微有点贬低它了。我是说,你会怎么描述它?


从聊天机器人到主动型智能体 (Agent)

Boris Cherny

我觉得这其实是一个相当不错的描述。那就这么定吧。我认为当许多人想到 AI 时,他们想到的都是聊天机器人。对于工程师而言,在大约一年半前我们创立 Claude Code 之前,AI 大抵就是这样。这对大多数人来说,AI 就是那回事。

后来我们在某个节点意识到,模型在编码方面实际上变得非常出色,而且在运用工具方面也表现得极其优秀。而这些一直以来都是我们训练模型去完成的事情。这在某种程度上一直是研究的方向,大约在一年半前,它开始具备了商业价值。因此,对于 Claude Code,我们押下了这一注。我们背离了当时每个人编写代码的方式。因为当时全世界编写代码的方式,本质上都是在使用一种高级文本编辑器。而我们认为,或许我们可以做得比这好得多。我们可以做一些与以往截然不同的事情。这确实是一次豪赌。

于是我们推出了 Claude Code。Claude Code 与当时聊天机器人的区别在于,Claude Code 可以使用工具。这就是关键所在。这就是区别所在。在使用聊天机器人时,你是在进行来回的对话,而智能体——Claude Code 就是一个智能体——它可以使用你的工具。

Alex Kantrowitz

好的。我们可以快速定义一下什么是工具吗?所以工具可以是任何东西,如果我说错了请纠正。比如使用浏览器,或者登录 Cloudflare 并以这种方式设置某个代理,所以重点不再是这个产品本身能做什么,而是这个产品可以登录到什么地方,以及它能如何利用你在网上使用的多种产品

Boris Cherny

没错。它可以连接你所有的不同工具,可以使用你的浏览器,还可以使用你的电脑。即使是像在电脑上编辑文件这样简单的事情,一年半以前,没有任何 AI 产品能真正做到这一点。但这却是 Claude Code 能够做到的第一件事。它可以编辑你桌面上的文件。如果你的桌面上有一堆文件,它可以对其进行整理。所以,如果你选择授予权限,Claude Code 和其同事就能获得这种访问权限。

Alex Kantrowitz

确实如此,你知道它能够做到这一点,这简直太神奇了。这种微小的差异完全改变了人们使用该产品的方式,也彻底改变了该产品能为你实现的功能。我认为这里需要深究的核心在于:AI 似乎已经从某种程度上擅长自动补全的功能中转型了。因为在基础层面,AI 只是在预测接下来会发生什么——如果你正在使用机器学习并将其应用于大型数据集,它是在预测你是否可能拖欠抵押贷款,以及银行是否应该批准贷款。

如果是处理句子,那就是预测下一个单词;如果是编写代码,那就是预测代码序列中的下一小段,所以我认为那是第一代,但你现在谈论的是机器在接收到你的自然语言提示后,能够自主去编写代码、接入工具,进而为你完成各项任务。如果我理解得没错,请帮我指正,这里的用例已经从开发者通过 Claude Code 接入并编写代码,演变为一种爆发式增长。我想这在很大程度上是由他们推动的,但随后又受到了一股次要力量的推动,即像我这样的非技术人员,可以指挥作为 Claude Code 的 AI 智能体,为自己构建工作流软件、网站,或者通过像 Claude Co-work 这样或许可以称为更简单姊妹产品的工具来接管电脑,对它说:‘你现在可以访问我的浏览器了,你知道我喜欢预订什么样的航班。我几周后需要在印度。帮我订机票。’

Boris Cherny

没错,正是这样。我其实刚刚用 Co-work 订了一堆机票。这个月我要飞很多地方,我们要举办 Code with Claude 活动,地点在伦敦和东京,沿途还有其他几站。我和 Co-work 来回沟通,我说,我需要在这些时间出现在这些地方。一共五个经停站。涉及很多城市。这就是大致的行程安排。查看我的电子邮件,查看我的日历,帮我仔细核对一下,确保我没有遗漏任何事情。它确实发现了两个我所遗漏的经停点。还有几个我告诉它错误的日期。在我要求它这样做之后,它通过查看我的电子邮件发现了这些问题。接着我让它预订机票。然后我就去忙着写代码了。我当时正在处理工作。一个小时后我回来时,它已经预订了8趟航班和5家酒店,其中有一家酒店不太对劲。它订在了错误的区域。我要求它重新预订并进行更改。事情就这样完成了。

事实上,这是我每次使用 Co-work 和 Claude Code 时都会尝试的事情。我有一些类似测试用例的东西。所以,这算是我会做的一种常见操作,我会用不同的模型反复测试,随着模型的不断改进。这是我得到过的最好的结果。而且 Co-work 结合 Opus 4.7 确实有些过人之处。它能够做到这一点。

我认为对我来说最困难的事情之一是,随着模型的进步,你必须不断调整对它能力上限的预期。如果你与其他人,特别是与一年前使用过该模型的工程师交谈,如果他们从那以后就没再用过,他们可能会说,它在编程方面表现并不好。而且,我不敢信任它一次写超过几行代码,因为那正是该模型一年前的水准。当时它还不够好。如果快进到今天,当你让这些人坐下来尝试新模型时。正如许多人以及越来越多的工程师所做的那样,这完全是另一种体验。其能力完全不同。

我认为这是我使用过的第一项具备这种特性的技术,它每个月在功能上都有阶跃式的变化。作为这项技术的使用者,这确实很困难,因为你必须不断地进行重新学习。你必须不断地尝试。你始终需要这种初学者心态,去重新尝试这项技术并将其用于它以前不擅长的领域,因为下一个模型可能就能完美地完成这些任务。没错。所以我认为这就是愿景。


组织变革与 Token Maxing 的迷思

Alex Kantrowitz

你所概述的方式正是如此。此前,当你使用技术时,你必须受限于其界面。软件公司会为了规模化而开发产品,但你往往会得到许多对你而言并不适用的功能。每当你试图预订某样东西时,即便你明确知道自己想要什么,也必须经历各种繁琐的操作,因为网站并不了解你的偏好。如今,范式发生了转变,因为你拥有了 Agent。它能够代你行事,并有潜力按照你的意愿重塑你的在线体验。我认为,这正是人们所关注的焦点。这也是我们所见到的,真正意义上爆炸式增长的原因。

但现在,我想对这一论点进行压力测试,提出一些让我好奇的问题:究竟有多少是真实的,又有多少仅仅是对潜力的盲目热情,或者说有些方面我们确实需要进行现实层面的审视。首先,目前确实存在巨大的需求。但问题在于,这些需求中有多少是纯粹的需求,又有多少是游戏化驱动的需求。在 Silicon Valley 内部及外部,有一种被称为 token maxing 的做法正在流行。我相信你一定听说过。这指的是一些公司有强制要求,让员工尽可能多地运行 AI agents,从而消耗大量的 AI tokens。那些消耗 tokens 最多的人会出现在排行榜上受到奖励,或者达成某种 AI 操作目标。这些目标指的是 AI 行为,而不是物理行为。所以,我想听听你对 token maxing 的看法,以及你是否认为这在你所构建产品的用户使用量中占据了很大比例。

Boris Cherny

我不认为 token maxing 占据了很大的比例。关于这一点,我的想法是,其实在加入 Anthropic 之前,我曾在一家大型科技公司工作。你在 Facebook 工作过。我是在 Facebook 工作过。它就是那些正在进行 token maxing 的公司之一。没错。没错。是的。而我的其中一项职责是负责 Meta 各款应用中所有代码的健康状况。这包括 Facebook、Instagram 和 WhatsApp。我们之所以关注代码的健康状况(这本质上指代码质量等问题),是因为如果代码质量很高,工程师的生产效率就会更高。我们有一个庞大的团队专门致力于提升生产力。

在模型出现之前,在 Claude 出现之前,你可能需要工作很长时间,而每位工程师一年的生产力提升幅度可能只有 1% 到 3% 左右,大概就是这样。那已经算是相当大的进步了。而且这非常来之不易。你本质上必须尝试大量的想法。最终你会发现某种能像这样提高生产力的方法。而 Claude 的情况是,现在许多公司,包括 Anthropic 以及我们所有的大客户,都报告称生产力提升了百分之几百。

我认为我们报告的最新数据是,自我们引入 Claude Code 以来,Anthropic 每位工程师编写的代码量增长了约 250%。同时,代码质量、可靠性以及所有这些方面都保持在稳定水平。因此,在这些指标没有退步的情况下,代码产出量有了巨大的增长。我认为,这种生产力影响是非常新颖的。我觉得人们正在试图弄清楚我们该如何实现这一点?有很多公司在问:我们该怎么做,怎么做,怎么做,怎么做?我们如何获得这种收益,因为许多公司已经看到了成效,而另一些公司仍在摸索之中。我认为我的建议几乎总是相同的。

首先是直接给每个人发放 token,让他们去进行实验。我未必会建议进行 token 最大化,但我建议让人们自由实验,这样他们就不必为每一个 token 的使用申请批准。其次是给予员工心理安全感。因为很多时候,当人们在进行创新并构建能提高生产力的工具时,他们也在改变自己的工作流程以实现更高的效率。他们会尝试各种想法,其中一些可能行不通,但另一些则会成功。因此,你需要给人们提供这种心理安全感,让他们能够放心地进行实验,并探索出这些新的流程。

许多公司观察到的情况是,生产力的提升和创新往往并非来自你预期中的那些人。在过去,每个人都能指出谁是最高产的工程师,但我认为在当今时代,许多改进正来自那些你意想不到的人。这可能是一个隐藏在组织角落里的会计,他以一种工程师从未想过的方式实现了会计工作的自动化。这可能是某个营销人员以一种你从未想过的方式实现了营销自动化。也可能是一名刚毕业的软件工程师构建了某种令人惊叹的东西。而这正是以前从未发生过的事情。挑战在于,你无法提前识别出这些工程师和这些人。你不知道他们是谁。而且这几乎总是会让你感到惊讶。

因此,你想做的事情就是让人们去实验,给予他们安全感。一旦出现了某种可以规模化的应用场景,那才是你考虑优化它的时候。但你不需要提前进行优化。所以我不知道,如果以竞争的方式行事适合某些公司的企业文化,那么我认为这很好。如果其他公司想要采取的方式仅仅是创造安全环境,并为工程师提供实验空间,就像我们在 Anthropic 所做的那样,那么我认为这也很棒。这确实取决于公司自身。


生产力悖论与 AI 的“文件柜”时刻

Alex Kantrowitz

是的。我想说,你看,我使用了很多 tokens。我一直都在使用这些工具。我认为 Claude 和 Claude Code 对我的业务都非常有帮助。我是一个独立运营者,虽然这样说有点低估了我的情况,因为我背后有一个协助我的团队,虽然他们大多是兼职,但那是另一个话题了。但我确实感到好奇,当阅读这些报道时,大型企业在这些预算中占据了很大很大一部分比例。还有激励机制,正如我在节目开头所说,这到底有多可持续?

在某些地方,激励机制是有问题的。这是最近来自 Financial Times 的报道。Amazon 员工使用 AI 工具执行不必要的任务以虚高使用评分。一些员工表示,同事们正在使用该软件自动执行额外且不必要的 AI 活动,以增加其 Token 的消耗量。他们表示,此举反映出在 Amazon 引入了要求超过 80% 的开发人员每周使用 AI 的目标后,内部所承受的技术应用压力。我向一名 Amazon 员工核实了这一情况。他们的反应是,没错,确实正在发生这种事。他们告诉我为了达到这些指标,我每天都会触发一个运行数小时后即被删除的自动化程序。所以你认为这种“刷 Token”的行为在需求中并不占很大比重。在你这边是否有任何迹象表明情况并非如此,即这只是个别现象而非大多数地方的常态?

Boris Cherny

我不知道有多少公司在进行这种“刷 Token”的操作。但我确实有所耳闻。这算是一种趋势吧,稍微有一点点。如果你看看 Claude Code 的客户,我们确实拥有非常、非常、非常、非常多的客户。所以并不是说只有一家公司在推动这种使用。情况并非如此。

我确实想退后一步,思考一下,这种变化究竟是如何发生的?因为我认为这些公司想要实现的目标——我不想替他们代言,建议你还是直接去问他们。是的。但我认为这些公司想要实现的目标,可能就是组织变革和业务流程变革。你该如何去做?你如何让你的公司从 AI 中获益?这一点通常是不明确的。这在很大程度上取决于公司本身,因为每家公司都有不同的业务、不同的文化、不同的组织架构以及不同的运作方式。

有一篇90年代发表在 Harvard Business Review 上的老文章,我非常喜欢,虽然忘了标题,但大意是:电脑已经普及了,为什么没人看到生产力的提升?这曾是一个重大的问题,对我们来说,电脑能提高生产力是显而易见的。在今天,这简直是不言而喻的。但在90年代,事实并非如此。当时的情况是个人电脑正在被广泛采用。它们正在取代大型机。而且现在它们的价格也变得可以负担了。所以普通公司、普通创业公司都能买得起一台。你再也不用花几百万美元去购买大型机了。但这里存在着挑战,也存在着悖论。各大公司都在采用它,却并未看到生产力的提升。这究竟是怎么回事?

因此,这篇 Harvard Business Review 文章提出,要想从计算机中获益,必须围绕计算机重构整个业务流程。计算机必须处于你做事方式的核心地位。如果你依然保留着文件柜,或者抽屉里塞满了各种材料,依然采用纸笔这种物理流程。而计算机只是被边缘化地摆在某个地方,那你真的无法从中获益。但如果你扔掉文件柜,扔掉堆满纸张的办公桌抽屉,将计算机置于核心位置,并将其作为处理所有业务流程的方式,那么你就能获益。

各公司之间因此出现了分歧。有些公司付诸实践,经历了相当痛苦的变革并从中获益,而另一些公司则没有。我认为现在的情况也大致如此。许多公司都在设法从 AI 带来的生产力提升中获益,目前正处于大量的实验阶段。每个人都在尝试不同的方法,以探寻如何从中获益。我不认为存在唯一正确的方法。


智能水平、效率控制与技术局限

Alex Kantrowitz

好的。你看,我认为当我们看到像 Claude Code 和 Anthropic 这样快速发展的项目时,进行交流探讨是有益的,听听你的见解也很有价值。那么,这就是 token 最大化。当然,token 是模型的输出,比如模型输出的单词或单词片段,以及输入其中的单词或单词片段,这就是这些公司的收费方式,而且你使用的越多,需要的计算中心就越多,诸如此类。随着这些模型变得越来越好,它们并没有——让我这样问你。有时我怀疑它们是否已经达到了最高效率。这些大型模型有时会处理大量任务,消耗大量 token。即使产出结果很棒,人们也会质疑,这是否仅仅是在推高 token 的需求,而本可以采用更简单的流程

模型消耗了大量 token,却没能以本应具备的最高效率完成任务。我举个例子。我一直在使用 Claude Co-work 来制作 PowerPoint 演示文稿。它在这方面表现得非常出色。我一直使用的是 Opus 4.7 模型。有几次我说,好了,你正在处理这个,把它作为 PDF 输出。然后它就开始失去逻辑了。它陷入了循环,并尽可能多地使用各种工具。而且,它似乎就是无法交付 PDF 文件。最后,我不断地告诉它,不,你现在做的是 PowerPoint。你知道它在哪里。交付它。然后它回应说,我欠你一个道歉。我陷入了死胡同,一直在担心一个实际上并没有阻碍我们获取文件的限制。接着它就交付了文件。谈谈这些模型的效率吧。

这是否是一个合理的担忧,正如我们所见,增长的部分原因就在于此。这些像 Opus 4.7 这样的模型在执行基础任务时可能会陷入的循环

Boris Cherny

通常当我们思考模型时,会涉及几个不同的方面。第一点是它究竟有多智能。另一点是它的速度有多快。还有一点是它的效率有多高。我们通常会尝试同步提升这三个方面。在这三者之间,我认为我们或许应该优先优化智能水平。这是最重要的事情。因此,即使效率稍微降低一点,但如果它更智能且能让你完成更多任务,那也是非常有价值的。因为效率优化是后续的工作。在我们提升了智能水平之后,我们才能进一步提高其效率。所以这更像是一种循序渐进的过程,我们先完成这一步,再处理下一步。

我们一直在进行大量实验,探索究竟该如何让用户对这些进行控制,因为我们并不总是清楚默认设置该如何设定才是最合适的。有时当你正在使用它时,你比我们更了解,你心里更有数。因此,我们为此设计的一种机制是选择模型。所以你可以选择 Opus、Sonnet 或 Haiku。我们一直在实验的另一种机制是——我不知道这是否就是 Sonnet 的大、中、小版本,没错,就是这样,确实如此。这仅仅是指模型的大小。

此外还有“努力程度”(effort)。我认为“努力程度”这个词本质上描述得非常贴切。它指的是你希望投入多少努力。你可以对其进行设置。我们有一项推荐的工作量设定。举例来说,若要最大化 Opus 4.7 的智能水平,你希望使用额外高或最大工作量。但如果你希望它消耗更少的 token,可以选择中等或较低的工作量。这是你可以掌控的一项设置。

Alex Kantrowitz

我最近在节目中谈到过这一点,有一位评论者参与了讨论。我当时认为,这些大型模型会找到某种方法,在诸如导出或 PDF 处理这类任务上变得更加高效。有一位评论者写道:Alex,它们无法解决像 PDF 这样的问题。这是 LLM 技术固有的缺陷,也是代理式 AI 实现广泛普及和应用的最大障碍。我想我得尝试解读一下这段话。他们想表达的是我们之前谈到的预测问题。即这一切本质上都是概率性的。即这一切本质上都是概率性的。这在某种程度上就是预测下一个词。你不会从一个 AI agent 那里得到两次完全相同的答案。因此,这种特性是它们工作方式的一部分,是无法修复的。你怎么看?

Boris Cherny

不,我不认为那是正确的。当你思考这个问题时,比如,让我们稍微宏观一点来看。没错。所以工程师是第一批采用者,就像工程师在大约一年半前就开始使用 Claude Code 一样。而且,这发生在非工程师群体开始使用之前。以一种有意义的方式使用 agents。这还是在 Co-work 等工具出现之前的情况。

回想一年半前,Claude Code 的表现并不理想。那时我可以用它编写少量代码,但如果真的指望它构建整个功能或完整产品,结果往往不尽如人意。它当时的情况大抵如此。它会在原地打转,代码质量不高,要么生成的代码很糟糕,要么根本无法运行。但到了某个节点,它突然开始好转了。随着模型的迭代和 Claude Code 的改进,产出结果变得越来越好。快进到今天,Claude Code 已经完全由 Claude Code 自身编写而成。Co-work 也是 100% 由 Claude Code 编写的。在 Anthropic 及各类产品中,越来越多的功能已完全由 Claude Code 编写。

这也是我们从客户那里听到的反馈。昨天我在创业孵化器 Y Combinator 做了一场演讲。我让大家举手示意,现在每个人都在使用代码生成工具。我问他们,如果你们今天 100% 的代码都是使用 AI 编写的,请举手,大约有一半的人举起了手。接着,我问大家,如果你们 0% 的代码是使用 AI 编写的,请举手。只有一个人举了手。这会排除掉几百个人。

Alex Kantrowitz

向那个人致敬。

Boris Cherny

没错。而且,显然这方面仍有发展的空间。而剩下的人则处于中间地带。他们大部分的代码都是用 Claude Code 编写的,但并非全部。但这正是该模型目前的水平。一年前它还做不到这一点。一年前,它的能力还不足以胜任这些工作。所以,这正是你所说的关于 Co-work 目前正在发生的情况。现在还处于早期阶段。我们发布它也就几个月的时间。它会持续改进。随着产品和模型的不断优化,它会越来越好,但这只是早期阶段。我认为今天使用 Co-work 的每个人仍然是早期采用者。即使是今天使用 AI 的每一个人,都属于早期采用者。世界上还有很多人,大多数人还没有真正意义上尝试过 AI。所以,这方面确实还有很大的改进空间。


智能体的日常化与信任建立

Alex Kantrowitz

没错,我们将于6月18日在 San Francisco 举办一场活动,其中很多营销材料都是我用 Co-work 生成的。现在,我会反复推敲。我不会只让它生成一次就定稿,我会审阅文案。但我会做一些操作,比如上传下载统计数据来展示播客的增长情况,并提供演讲者的名字,它在撰写说明书方面表现得非常出色。这是活动的内容概要。这是即将出席的观众群体。这是即将出席的观众群体。以下是演讲嘉宾名单。以下是你应该出席的内容。以下是联系方式。

Boris Cherny

太疯狂了。效果好得惊人。当你第一次使用它,以及第一次看到智能体使用你的工具时,你的感受是怎样的?

Alex Kantrowitz

嗯,很明显我几乎启用了所有功能。所以,我认为这是一种许多人都经历过的体验:你发现 Claude 有一个浏览器扩展程序,然后意识到只有让 Claude 接管你的浏览器并为你执行操作,才能获得最大的收益,或者说获得绝大部分的收益。这种体验和我乘坐 Waymo 时几乎一样,最初的那几次转弯,我紧张得手心冒汗,一直在观察,一直在想:我应该批准阅读所有内容吗?然后你开始慢慢信任它,接着就只会不断地点批准、批准、批准,Waymo 也是一样,你会觉得:看起来它不会害死我。五分钟后,你就可以在那儿玩手机,由 AI 去完成工作。这就是我在代码和 Co-work 方面的体验。是朝着这个方向吗?

Boris Cherny

这也是我的体验。我觉得这就像任何技术一样。我一直在观察一位朋友,她正逐渐学习如何使用 Co-work。她并不是一名工程师。前几天有个用例,比如她的电脑上有一个语言输入设置,可以在笔记本电脑的几种语言间进行切换。结果出了点问题。她没能弄清楚该如何解决。所以在以前,她会去 Google 搜索,比如询问:嘿,我电脑出现的这个问题该怎么解决?而这一次,她只是求助了 Co-work。一位同事回复说:没问题,让我看看。我可以操作你的电脑吗?

她说可以,接着它就接管了电脑,我猜大概会出现一种橙色的光晕,你就在旁边看着同事打开设置,它识别出语言选择器出了问题,并进行了诊断和修复。你依然掌握着控制权,所以你可以全程看到发生了什么并进行监控,这并不是在后台悄无声息地运行,但这确实很神奇。说实话,我的第一直觉确实是打开 Google,所以很有意思,对她而言,她现在已经习惯用 Co-work 来处理这类问题了。这其实是我经常有的一种感觉。我认为对于那些伴随着这些产品成长并使用过旧版本的人来说,他们的思维可能还不够大胆。但对于那些初次接触这些产品的人,我经常看到他们用 Claude 和 Co-work 处理一些我根本想不到的事情。这简直太惊人了。极具创造力。而且我每次看到它时都会做大量工作。


速率限制、算力扩展与行业竞争

Alex Kantrowitz

没错。现在最大的缺点,我觉得,而且我也看到你在 X 上回复过别人关于这个问题的讨论,就是速率限制。比如,当我看到它时。看到人们说,我已经尝试过 Claude Code 了,但我差不多不想再用了。通常是因为他们达到了令牌分配额度,而它对他们来说只能运行大约一小时。然后他们不得不等上四个小时才能再次使用。于是他们开始寻找替代方案。你认为速率限制对你产品的增长能力造成了什么影响?如果有的话,接下来有什么计划能让用户做到能够在不受这些速率限制的情况下使用它?

Boris Cherny

关于这一点,是我们目前正在积极处理的问题。现实情况是,实际触及速率限制的用户比例非常小,这令人感到惊讶。对于 Pro 用户,这个比例会稍微高一些。对于 Max 用户,这个比例其实相当低。我认为你提到的关于人们对此议论纷纷的原因,主要有几个方面的情况。

首先是我们确实降低了峰值速率限制。目前这一措施已经撤回,而且我们实际上已经将速率限制翻了一番。因此,我们正在为用户提供更多的速率额度。但确实存在一段短暂的时期,我们降低了这些限制。所以当时人们频繁遇到这个问题。

第二点是 Claude Code 实际上具有很强的可扩展性。因此,用户可以使用插件。他们可以使用各种各样的集成。而其中一些插件在使用 Token 时效率相当低。所以,我们一直在努力做的一件事,就是将这些信息呈现给你们。这样用户就可以决定,你是否想要使用该插件?这样你就能看到你所消耗的 Token 中,有多大比例被分配给了它。

我认为第三点是,现在有越来越多的人已经成为了深度用户。比如最初我们发布 Claude Code 时,你一次只能运行一个任务。而如今,比如在我的电脑上,我可能同时运行着五个任务。然后每天晚上我都会运行,也不是每天晚上,但大多数晚上,我一次运行数百个 Claude。全部并行运行。没错,数百个,有时是数千个。这在一年之前是我无法想象的。显然这会消耗大量的 tokens。现在有很多人正在探索这些新工作流,它们会消耗更多的 tokens,这基本上已经达到了 max plan 所能支持的极限。而且,这就是为什么你也可以直接通过 API 付费。所以如果你想获取尽可能多的 tokens,也可以这样做。这也是许多企业正在做的事情。

Alex Kantrowitz

没错。就在不久前,我记得 Anthropic 的首席执行官 Dario 在提到 OpenAI 时,谈到了他们在基础设施建设上的投入。他本人事后也谈到过这一点,他说,我在支出方面力求自律,尽管这仍然意味着要投入数十亿美元建设数据中心,以支持你所提到的这些技术,而其他人——我们认为是指 OpenAI——则是在孤注一掷(yoloing),但现在 OpenAI 也通过 Codex 在做这件事。你可以称之为孤注一掷,但他们确实建立了庞大的数据中心容量。你是怎么看待这一点的?因为当用户遇到速率限制时,他们可能就会转向 Codex。这竞争相当激烈。那么,你是怎么看待这一点的?Anthropic 内部对此有何看法?至少从外界看来,这种在数据中心建设上增加的自律,最终可能会导致你们两家公司在最关键的产品争夺战中流失用户吗?

Boris Cherny

是的。首先,我们目前的增长速度从未像现在这样快。所以,对于 Claude 而言,增长正在加速。我认为这是因为大多数人还并不了解这些情况。实际非常频繁地触及速率限制并不是什么大问题。对于那些受到影响的用户,我们正专注于改善其使用体验。因此,我们放宽了速率限制。我们今天宣布将提高每周的速率限制。

当然,我们还宣布了全新的 Colossus 容量,我们上线该容量正是为了服务所有这些新用户。来自 Elon Musk。因为这种增长确实是任何人都没有预料到的。这完全超出了我们最激进的预测。所以,我认为对我们而言,最重要的是我们需要服务好我们的用户。我们希望确保我们的用户真正感到满意。我们正在竭尽所能去实现这一点。

Alex Kantrowitz

你对 Codex 感到惊讶吗?你如何看待他们作为一个竞争对手?

Boris Cherny

我认为总是会有,总是会有模仿者。总是会有竞争对手。对我来说,这是一种恭维。而且我认为这只会迫使每个人做得更好。所以,对我而言,我最关心的就是尽我们所能为用户提供最好的服务。我们鼓励团队中的每一个人,每天都与用户交流。而且,只要每天让产品变得更好一点点就行了。所以这就是我最关心的事情。好的。


主动模式、并行处理与更长周期的任务

Alex Kantrowitz

我想休息一下,但我们还有很多内容要讲。我想谈谈这如何扩展到代码之外,谈谈聊天机器人的未来,然后再稍微聊聊其他内容。我可以过一遍我们的议程。我们确实需要两个小时。那么我们为什么不休息一下,回来之后尽可能多地完成剩下的内容呢?

欢迎回到 Big Technology 播客,我是主持人,今天嘉宾是 Anthropic 旗下 Claude Code 的负责人 Boris Cherny。Boris,很高兴你能来。就像我之前说的,我每天都在使用你们的产品,所以能和你聊聊这个产品真的很有趣。我们之前已经简单谈过这一点,但我认为有一点我们应该强调,那就是这确实将超越聊天机器人本身。我们之前谈到了预订航班。我曾在市场演示中谈到过这一点。而且,就在我们要谈的这一周,你们发布了一个新的应用场景,即 Claude Co-work 可用于小型企业,包括接管 QuickBooks 并进行一些记账工作。这将会向什么方向发展?你认为整体路线图会把你们带向何方

Boris Cherny

我们正在为 Claude Code 和 Co-work 构思一些东西。有几个主要的主题。首先是提高智能水平,而且我认为这几乎完全取决于模型本身。随着模型的改进,我们可以完成越来越宏大的工作。就编程而言,过去是一次写一行代码。现在则是构建完整的功能模块或整个产品。关于协同办公,这其实起步没多久。起初它只是像撰写文档之类的,而现在它涵盖了预订航班、整合多种工具以及处理 QuickBooks 等事务。这一前沿领域的发展和演进速度极其迅猛。

我们也在构思如何处理更长周期的任务。针对 Claude Code,我们近期展示了,发布了一项名为 auto mode 的功能。auto mode 本质上是对权限提示机制的替代。在此之前,每当模型需要使用工具时,Claude 都会询问你:我可以使用这个工具吗?通常你会直接回答是,但反复回答是会让人感到疲惫。

Alex Kantrowitz

总是允许。这就是你需要点击的按钮。

Boris Cherny

没错,确实如此。但实际上,出于安全考虑,你对此保持深思熟虑是非常重要的。我们意识到,与其对每一个提示词都深思熟虑,不如通过展示如此多的对话内容来引导用户,但他们反而产生了一种疲劳感。他们往往只会直接说“是”,或者总是选择允许。因此,自动模式(auto mode)便是解决方案。这是一种处理这些工具调用(tool calls)路由的新方法。其运作方式是:每当 Claude 想要使用某个工具时,它会询问另一个 Claude:“使用此工具是否安全?”Claude 掌握了部分上下文。它并没有获取全部上下文。此外,还有多层安全检查机制。我们花费了数月时间进行迭代,以确保其绝对安全。我们使用了数千种不同的基准测试和评估方案,以确保其安全性。

从本质上讲,我们在实验室环境中发现,且现在在实际应用场景中也发现,这比我们之前拥有的版本更安全。因此,作为用户,这是一个非常棒的改进,因为你无需再反复点击确认。实际上,这样的结果更好,因为如果 Claude 要求你执行的一长串任务中潜藏着一个不安全的指令,你可能会不小心点击了确认。但如果使用 auto mode 调用第二个 Claude,就不会出现这种情况。它不会盲目点击确认。

所以,这算是一项巨大的投入。也许第三个重要的投入就是并行运行更多的 Claude。关于 Claude 最酷的事情之一,也是我们很早就从 Claude Code 用户那里观察到的现象,即现在很少有人一次只运行一个 Claude Code。大多数人会运行许多许多的 Claude 代码,数量从几个到几千个不等。而在 Co-work 中,我们也开始看到完全相同的情况。随着你越来越习惯让 Co-work 运行,你开始一个任务,然后又开始第二个,你能否继续进行并行处理,做得更多?我认为有很多机会可以让这种体验变得非常好,并让人们更直观地理解它。你该如何做到这一点?你何时去做?


个人杠杆的爆炸式增长与未来全职工作

Alex Kantrowitz

没错。而且这可能也延伸到了你使用聊天机器人的方式上,这很有趣,因为 Anthropic 与这款聊天机器人有着一种奇妙的关系,最初以技术为先,决定构建聊天机器人并发布了 Claude,然后我便转向了其他方向。更多地转向了企业领域,比如当你查看所有图表时,Claude 总是在最底层。但现在你可以看到 Claude 的使用率正在上升。

我有一个想法,很想向您求证:聊天机器人的未来并非仅限于我提出问题,而您给出答案。而是我向您提出问题,或者与您探讨某个问题。随后,聊天机器人会主动建议一些可以代我执行的操作。比如现在我说了非常多,关于去 India 旅行的事。我认为未来我将得到的回馈,就像您刚才所说的那样,不再需要经历从计划到预订航班这一中间步骤;即会出现一种更主动的聊天机器人,它会说:“好的,让我来为您处理这些事。”这是正确的方向吗?

Boris Cherny

我的思路,我预见到了这一点。我预见到了这一点。

Alex Kantrowitz

你们正在研发吗?AI 是未来。

Boris Cherny

而且,我们正在尝试所有这些不同的实验。

Alex Kantrowitz

好的。

Boris Cherny

我们正在尝试一些类似于这样的东西。是的。

Alex Kantrowitz

好的。但这确实有一个限度,对吧,即它能做到什么程度。人们谈论可以并行运行的成千上万个集群的局限性时,有一种有趣的方式,那就是观察 Anthropic 正在招聘什么样的人。我在 Anthropic 网站上最喜欢的招聘启事是你们正在招聘 Salesforce 管理员。你们还在招聘顾问来帮助企业部署这项技术。许多人认为这是一种默认的承认,即这些东西只能带你走到这一步。下面是 Wharton 教授 Ethan Mollick 对此的看法。他说,当你看到人工智能实验室解散他们新组建的咨询部门——抱歉,是前沿部署工程组时,你就会知道他们是真心相信人工超智能的;只要还需要有人来挖掘人工智能的用途、进行组织变革和系统集成,工作岗位看起来还是相当稳固的。你对此有何看法?

Boris Cherny

是的。没错,看看我所从事的那种工程工作,我已经不再编写代码了,我是在向 Claude 发送提示词。实际上现在我做的大部分工作是:我有一个 Claude 来向其他 Claude 发送提示词。所以我甚至不需要直接与 Claude 交流。我有一个 Claude 正在与我的其他 Claude 交流。我认为在工程领域,你已经见证了个人所能拥有的杠杆效应出现了爆炸式增长。现在关键在于一个人能够建立多大规模的业务。一个人能够支撑多少款产品?在 Anthropic,一名工程师现在所拥有的杠杆效应简直令人难以置信。

我认为我们开始在其他学科中也看到了这种趋势。我们开始看到市场营销人员也在使用 Claude 来完成各种任务。我们也开始看到前线部署工程师正在利用 Claude Code 来构建实现方案。我们也观察到了销售团队的情况,因为在 Anthropic,我认为大约有一半的市场推广团队成员在使用 Claude Code。而另一半则在使用 Claude。我认为每个人都在使用所有这些产品。所以我们要表达的是,个人所具备的杠杆效应正在提升。但我们仍然受限于优秀人才的数量。因此,即使人均杠杆效应提高,由于市场需求极其巨大,你仍然无法招募到足够多的优秀人才。而且还有更多的工作等待我们去完成。所以那对我们来说仍然是瓶颈。

Alex Kantrowitz

但我认为,如果人们争辩说这些东西非常强大,你可能会说,看看我的销售组织是如何运作的,然后通过一个提示词将 Salesforce 配置成那样,这是一种例子;人们给出的另一个例子是,如果 Anthropic 能让它处理 IPO 文书工作而无需聘请投资银行,我才会相信 Anthropic 拥有非常强大的 AI。这些是公平的测试吗?嗯,我们开始看到桌上有一位人士正在使用 Claude 来处理税务,我不一定会推荐这样做,我承认我曾把我的税务交给 Claude 处理,并将其与我的会计师的结果进行了对比,结果相当接近。

Boris Cherny

我也做了同样的事。各位,并不是说你们应该这样做,但这确实是一个有趣的用例。没错。但我认为人们在这次谈话中从根本上忽略的是,最终还是得有人与 Claude 对话,要求 Claude 去做这件事。所以即使 Salesforce 是自动配置的,且不是由人来按下所有按钮,那也是 Claude 在执行。总得有人要求 Claude 去做这件事。如果你必须以多种不同的方式配置 Salesforce,要求 Claude 来完成这些工作实际上可能成为一份全职工作。而且在某个时刻,Claude 将会变得非常擅长要求 Claude 来做这件事。而那个人将会去要求 Claude,并让 Claude 去执行这件事。这个链条只会不断深化。但最终,你仍然需要有人来掌控这一切。不过未来或许他们的工作就仅仅是提出一个问题。没错,但试想一下,提出正确的问题所蕴含的影响力有多大。


软件产业的护城河演变

Alex Kantrowitz

确实如此。说得好。既然我们谈到了 Salesforce,那就不得不提一下“SaaS 启示录”(SaaSpocalypse)。对于随着自动化编程的普及,哪些类型的软件公司能够稳操胜券,而哪些又会陷入困境,你有一些独到的见解。你之前曾探讨过现有的不同护城河,以及哪些护城河更为重要,哪些则相对次要。趁着我们正在谈论这个话题,你能简要分享一下吗?

Boris Cherny

有一个非常好的框架叫这个。以及用于讨论模式和商业的各种能力。这类框架有很多,但这一个是我的最爱。我上学时其实学的是经济学。我没有学计算机科学。所以这就是我思考这类框架的方式。商业中存在许多不同的模式。有些公司拥有一种模式,有些则拥有几种模式。他们就像拥有一个模式组合一样。这类模式有很多。

比如其中之一是规模经济。因此,随着生产规模的扩大,规模收益会随之递增。另一个是网络效应。这就像是即时通讯应用或类似的产品。使用的人越多,对每个人而言其价值就越大。另一个是转换成本。还有一个是流程能力。我认为这些护城河大多依然重要,未来一年内,其中一些的相对重要性会提升,而另一些则会下降。

我认为重要性会提升的一个是网络效应,因为代码是谁写的并不重要。无论产品核心是否由智能体驱动,这一点都不重要。或者其他什么,又或者你的产品中是否具备某种智能。如果你的产品具有网络效应,那么这依然非常重要。有些护城河的重要性会降低,例如转换成本。因为如果你想从供应商 A 切换到供应商 B,你只需要让 Claude 去做就行了。而且随着时间的推移,Claude 在这方面的表现会越来越好。所以我认为作为一家公司,你应该思考的是:你的护城河是什么?

我认为许多大型公司之所以强大,正是因为它们拥有多重护城河。这并非仅仅依靠单一要素,因为实现规模化并构建持久防御性业务的方式,在于随着时间的推移不断积累这些护城河。你需要拥有多重护城河。总之,我会思考哪些因素在未来一年会变得更有价值,而哪些会变得不再那么重要。

Alex Kantrowitz

不过,我认为当你思考这些不同的软件公司时,如果你在使用一种 Claude Code,那么所有的模式是否都会融合消失?因为你可能只需要通过这一个应用程序就能连接所有软件,这意味着实际上只剩下一家软件公司了

Boris Cherny

没错。这种情况确实有很多种演变方式。我认为类似这样的事情是有可能的,但在我看来似乎有点牵强。因为如果我思考一下,比如,假设我正在使用一个通讯软件,我该如何决定使用哪一个?我会选择我朋友们都在使用的、我能联系到他们的那个软件。所以,我能否为自己构建一个非常出色的应用程序并不重要,虽然我今天确实能做到。比如,我可以利用 Claude Code 在几个小时内构建出一个很棒的通讯软件。但它依然没什么用,因为我无法通过它与朋友们交流。

Alex Kantrowitz

但这恰恰就是那个例子。你可以去核实一下我说的这些。你的通讯软件里将会有一个代理程序,它会在你朋友发来消息时通知你。我知道你经常在 iPhone 上使用 Claude Code,所以届时你只需看到通知,然后直接语音回复对方即可。只要各家公司愿意配合,你所有的通信内容都有可能集中在这些代理中处理

Alex Kantrowitz

最终它可能确实会成为那个代理,但通信究竟是如何实现的呢?比如,如果你看像 Signal 这样的通讯软件,它使用一种特定的协议来进行通信。而且,我可以开发一个应用程序。它或许可以使用相同的协议,但我认为它实际上无法向 Signal 上的其他人发送消息。不过我可以拥有一个代理,通过使用支持此功能的现有应用程序来执行该消息传递任务

Boris Cherny

是的。所以,确实,这最终会如何发展还不明显。我认为如今人们正混合使用各种应用程序和智能体。不过,我确实发现了这一点。从心理层面来看,我认为许多这类模式的价值实际上仍将随着时间的推移而增长。你可以构想另一个例子。比方说,像 TSM 或其他类似的芯片制造商。如果你思考一下他们为开发某种工艺流程,以及为实现随规模扩大而降低成本的流程所投入的工作量,就会发现这是一种基本的经济力量。许多公司都在做这类事情,特别是在制造业领域,规模越大成本越低。对于科技公司而言,基础设施领域也是如此。因此,如果你构建了非常出色的基础设施,就能支持更多用户,而每个用户的边际成本会随时间推移而降低。所以,如果你拥有这种效应,那么你或我能否构建应用程序就不再重要了。那依然是一个非常强大的模式。但我确实认为两者都在发挥作用。


终极对决:自我进化、世界模型与 AGI 路径

Alex Kantrowitz

好的。我还有3个问题要在10分钟内解决。看看我们能否全部处理完。Anthropic 的创始人之一 Jack Clark 最近表示,他认为这些模型有大约 60% 的可能性会在 2028 年之前开始自我改进。百分比或年份可能会有偏差,但大体上是准确的。你正身处一个可以自动进行编码的应用程序中。你正在运行这个应用程序。你同意 Jack 的观点吗?看起来是对的。

Boris Cherny

是的。当我观察 Claude Code 的编写方式时,可以发现 100% 的 Claude Code 都是使用 Claude Code 编写的。我认为这种情况自去年 11 月,即 Opus 4.5 版本发布以来一直如此。那看起来像是一个快速起飞的场景。

Alex Kantrowitz

所以你预料到了这一点。

Boris Cherny

这是有可能的。这也正是 Anthropic 存在的原因。如果你去问任何一个人、任何工程师或任何研究人员他们为何加入 Anthropic,他们都会告诉你这是为了 AI 安全。这是因为对我们而言,当我们思考未来,比如多年以后,最重要且我们希望为孩子们把控好的事情,就是确保这项技术是安全的。并且我们希望确保它能朝着好的方向发展。因为,没错,那确实是可能的结果之一。

我认为并非如此。尽管我们现在所说的是 Claude Code 正在自我编写,但进行提示词输入的仍然是人。Claude 正开始为 Claude Code 下一步的构建生成自己的想法,但这些想法并不总是好的,而且大部分想法仍然由我来生成。在某个时间点,这种情况会发生改变,模型会不断优化,并逐渐演变成一个自我强化的循环

Alex Kantrowitz

好了,我非常想听听你对这里提到的世界模型论点的看法。支持世界模型的人认为,大语言模型对后果没有理解,为了拥有有效的智能体,必须在其中构建一个世界模型。这是来自 Yann LeCun 的观点。他说,如果没有世界模型,就不可能构建出可靠的代理系统。语言模型没有世界模型。据 Yann 所言,它们在采取行动之前无法预测后果。它们只是采取行动,至于接下来发生什么,那是别人的问题。我最近与 OpenAI 的 Greg Brockman 交谈时,他说基本上他不接受这种论点,他认为 LLMs 是通往 AGI 的直接途径,这些文本模型就是通往 AGI 的必经之路。你站在哪一边?你认为智能需要内置世界模型吗?还是你认为单靠 LLMs 就足够了?

Boris Cherny

我会向 Yann 发出邀请。如果他愿意坐下来和我一起用一小时体验一下 Claude,我很乐意向他展示。你们应该在这个节目上这样做。到时候我也很好奇他的想法。也许他会改变主意,也许不会。

Alex Kantrowitz

没错。但还是想听听你的观点。

Boris Cherny

我个人立场非常坚定地站在产品研发这一边。所以,关于这件事,我并没有什么特别的看法。

Alex Kantrowitz

好吧。如果不介意的话,我想再深入挖掘一下。虽然你站在产品研发的立场,但我听过很多人提出这样一种观点:如果没有对世界运行方式的认知,即所谓的世界模型,LLM 就无法理解世界的运作规律、因果关系之类的东西。你用 Claude 预订了多少次航班,八次航班和酒店吗?你一定认为它对后果有所理解,否则你不会把信用卡给它,我推测你确实这么做了。那么,你对这一特定论点有什么看法?

Boris Cherny

我认为根据我从 Anthropic 从事研究的人员那里读到的内容来看,这些模型所展现出的智能程度令人惊讶。因为正如你在开头所说,它们从根本上所做的事情就是预测下一个 token。所以你会觉得,这似乎是一件很愚蠢的事情。这怎么可能成为顶尖智能?但是,我们实际上已经发布了大量关于这些模型如何能够进行规划的研究成果它们实际上能够进行推理。出现了所有这些非常令人惊讶的行为,而你本来不会指望一个仅仅预测下一个 token 的模型能做到这些。所以,我也说不准。我不会排除这种可能性。

Alex Kantrowitz

我是说,我觉得最令我惊叹的是当它们写诗的时候,在它们写第一行时,你就能在模型中观察到——这是来自 Anthropic 的研究——它们已经在构思下一行了

Boris Cherny

确实如此。这简直让人难以置信,它是怎么做到的?但事实确实如此。我是说,这差不多就是我对这件事的看法。如果让我写诗,我也会采用同样的方式。这真的太疯狂了。就像你教会这个东西去预测下一个词。而不知何故,如果下一个词的预测难度足够大,它就必须学会真正地进行提前规划,并学会如何完成这一切


终极市场测试与早期采用者的未来

Alex Kantrowitz

好的。最后一个问题给你。有时当我看到重大的技术变革正在进行时,以及在我职业生涯中报道这些内容时,我会思考,有些变革成功了,而有些则不然。我总是不得不问自己,我们如何确定这一点?这就是未来,而不是一场狂热的梦。我认为数据表明这是一个真实存在的事物,但我也在想,你必须去质疑,在它将如何持续发展这一层面,你能从现有基础推演到未来多少。认为这只是一场狂热梦境的论点在于,也许人们只想要简单的界面,他们并不介意通过点击来操作。而且,用 Claude Code 说话感觉有点太技术化了。而且它可能不会像在开发者群体中那样迅速流行起来,从而无法吸引普通用户。我是说,你会如何回答这个问题?

Boris Cherny

我们最近举办了一场针对 Opus 4.7 的黑客松,其中一位获胜者是一位开发了应用程序的医生。还有一位电工,还有一位木匠。这些人中有很多并无编程经验,但他们利用 Claude Code 构建了一些有用的东西。有一位参与者通过我们举办的黑客马拉松,构建并出售了一家初创公司。作为我们举办的其中一场黑客马拉松的成果。毫无疑问,当我们最初构建 Claude Code 时,它是面向工程师的,而工程师们也确实摸索出了使用方法。但很快,非工程师背景的人也学会了如何利用它来构建具有经济价值的事物

事实上,如果你审视当今的大量使用场景,会发现使用者并非工程师。它对人们来说实在太有用了,以至于即使在 Copilot 出现之前,他们也愿意克服重重困难去使用它。人们当时就像在终端里安装 Claude Code 一样,对许多人来说,这是他们第一次使用终端。当然,现在你们也知道,对于 Claude Code,我们已经有了桌面应用、iOS 应用、Slack 应用,有很多方式可以与之交互。但当时人们为了使用它费尽周折,因为它实在太有用了

所以对我这个产品经理而言,这是对产品是否有用的终极市场测试,看是否有很多人每天都在使用它,并坚持每天使用答案是肯定的,人数很多,而且还在持续增长。我不断地被人们使用它的方式所惊艳。我也必须说,我自己使用这些工具的方式也让我感到惊讶。我不知道接下来会发生什么,我很期待继续使用它,也非常高兴有机会与你交谈,希望我们能再次交流。感谢你邀请我参加节目。

Alex Kantrowitz

好的,谢谢 Boris,很高兴与你交谈。

免责声明:本站内容来源于互联网公开信息,仅供学习和参考使用。如涉及版权问题,请联系我们,我们将在核实后第一时间删除相关内容。
« 上一篇:上千网友奔赴“按猪”,这锅刨猪汤炖出了网络邻里情_ 下一篇:两个类别,八个赛道!“创客上海2026”赛事开始报名!报名方式见内文 »