🌳 注意力解码注意力解码 · 第5期

Anthropic CFO首度公开受访：「算力就是命」，$1000 亿押注什么？

2026年6月15日 · 阅读约 12 分钟

Anthropic CFO首度公开受访：「算力就是命」，$1000 亿押注什么？

「注意力解码」· 第5期

拆解 Anthropic CFO Krishna Rao 在 Invest Like the Best 的首度公开访谈

如果你是一家 AI 公司的 CFO，加入时公司年化收入只有 2.5 亿美元。一年半之后，这个数字变成了 300 亿美元，涨了 120 倍。

你会怎么花钱？

这是 Krishna Rao 面临的真实处境。他是 Anthropic 的 CFO，2024 年 5 月加入。在此之前，他从未接受过任何公开采访。

直到最近，他坐到了 Invest Like the Best 的主持人 Patrick O’Shaughnessy 对面，聊了 76 分钟。

这期播客值得你花时间的原因不是”Anthropic 又融了多少钱”。而是 一个 CFO 的视角，让你看到那些年报和融资公告里永远不会写的东西——他怎么思考算力、怎么分配资源、怎么在指数增长的世界里做计划。

今天用同一个方法论拆这期播客：不是”他说了什么”，是”他选择让你看到什么”。

1. 120 倍的真相：不只是模型变强了

很多人以为 Anthropic 的收入暴涨是因为模型越来越强。Rao 说，这只是其中一个因素。

他拆了七个驱动因素：模型多维能力提升、长时间任务执行（Long-Horizon Task Execution）、工具使用（Tool Use）、电脑操作（Computer Use）、Agent 任务表现、每代新模型解锁更大的可服务市场（Total Addressable Market, TAM）、企业客户发现新场景后用量暴增。

七个因素，没有一个可以单独解释 120 倍。

但这些因素叠加在一起，产生了一个非线性效应——每个因素都在放大其他因素的影响。模型变强了 → 能处理更复杂的任务 → 企业客户用量增加 → 新客户进来 → 模型又因为更多反馈变得更好。

这是 Rao 在整个访谈里最核心的思维模式：指数思维（Exponential Thinking）。 “人类天然用线性方式思考，这是我必须打破自己的范式。”

但这句话还有后半截他没直接说：如果一个 CFO 需要强迫自己用指数思维，那意味着我们这些外部观察者——用线性框架去估值、去预测、去判断”泡沫还是革命”——可能错的比对的更多。

2. 算力就是命

Rao 说了一句很重的话：

“算力是我们业务的生命线（Lifeblood）。是其他一切可以在上面构建的画布（Canvas）。”

一个 CFO，不是 CTO，把 30%-40% 的时间花在算力采购上。为什么？

因为 Anthropic 面临一个问题：模型能力每提升一代，用户用量就暴增——暴增的幅度往往超过模型效率的提升。 如果你算力不够，客户就跑光了。如果你买太多，公司就死了。

Rao 管这叫做”不确定性的圆锥（Cone of Uncertainty）“。一个形象的比喻：

想像你要在 18 个月后举办一场户外婚礼。你不知道那天会不会下雨，但你得提前订帐篷。订小的，下雨就完蛋了。订大的，晴天就浪费了。而且——雨可能大到前所未有。也可能阳光好到宾客翻倍。

这就是 Anthropic 的日常生活。Rao 的原话是：“我们必须在多个场景下同时规划，确保无论落在圆锥的哪个点，都有足够的算力支撑。”

有意思的是：他选择的词是”圆锥”而不是”范围”或”区间”。圆锥意味着越往远看，不确定性越大——而且是发散的，不是收敛的。

这种思维直接导致了一件事：Anthropic 启动了 AI 行业史上最大规模的算力采购。 Google + Broadcom 签了 5 吉瓦 TPU。Amazon Trainium 又签了 5 吉瓦。加上 SpaceX Colossus GPU 容量。累计承购承诺超过 1000 亿美元。

3. 为什么同时用三种芯片？

Rao 透露了一个很少被讨论的竞争优势：Anthropic 是唯一一家同时大规模使用 AWS Trainium、Google TPU 和 NVIDIA GPU 的前沿实验室。

不是”各用一点点”，是三种都可以互相替换。为此他们自研了编译器层（Compiler Layer）——从芯片层级做适配。“这花了好几年时间投资构建。”

为什么重要？三个原因：

第一，对冲供应链风险。 只依赖 NVIDIA 一条线？台海出事、出口管制升级、产能瓶颈——任何一个都致命。三条线并行，断了一条还有两条。

第二，议价权。 你是 NVIDIA 最大的客户之一，但你可以随时把工作负载切到 TPU 上。你不是没选择，对方就不是天价。

第三，成本结构。 不同工作负载跑在不同芯片上，综合效率最高。训练用这种，推理用那种，研究用第三种。“前沿实验室里最有效的算力使用者”，这不是口号，这是成本优势的根基。

这个策略跟解码4 里 DeepSeek 的”华为昇腾适配”有异曲同工之处——都在做一件事：把硬件从战略风险变成运营选择。

区别在于：DeepSeek 是”被迫但受益”（芯片制裁下的被动选择），Anthropic 是”主动但昂贵”（花了多年时间构建编译器层）。两条路都通向同一个终点：算力自主。

4. 三个桶：一个你不能砍的桶

访谈最精彩的部分，是 Rao 讲 Anthropic 内部算力怎么分。他用了”三个桶”的比喻：

桶一：模型训练与研发。 这个桶有一条硬性底线——无论如何不能砍。即使这意味着少服务一些客户、少赚一些钱。
桶二：内部员工使用。 公司自己人用 Claude Code、做研究。
桶三：客户服务。 企业客户的 API 调用和产品使用。

主持人追问了一个尖锐的问题：如果把桶一和桶二的算力全部拿去服务客户，能多赚多少钱？

Rao 的答案是：“数十亿美元。”

但他选择不这么做。

不是因为他不在乎钱。而是因为 Anthropic 的核心假设是：前沿智能（Frontier Intelligence）的回报率极高，尤其是在企业市场。 今天牺牲的”数十亿美元”客户收入，换的是明天模型能力领先带来的更大收入。如果你砍了桶一，省下来的钱很快就会被竞争对手的下一代模型吃掉。

这是一个 CFO 在替公司做”长期 vs 短期”的选择——而且他选择长期的时候，给出了具体的数字：数十亿美元。不是”很多”，不是一个抽象概念，是一个可以算出来的账。

5. 模型越强，反而越便宜

大多数人的直觉是：越强的模型，推理越贵。就像跑车比轿车费油。

Rao 说，Anthropic 恰恰相反。从 Opus 4 到 4.5 到 4.6 到 4.7——每次换代，推理效率都大幅提升。 某些情况下效率是前一代的”数倍”。

能力变强 + 成本下降 = 双重红利（Double Dividend）。

为什么双重红利重要？因为 Anthropic 内部大量使用强化学习（Reinforcement Learning, RL）来训练下一波模型。而 RL 的本质就是”大量推理加上奖励函数”——推理越便宜，RL 训练就越经济。RL 训练越高效，模型就越强。模型越强，推理效率越高。

这是一个正向飞轮（Flywheel）。 也是为什么 Rao 敢说”算力是我们的生命线”——飞轮转得越快，需要的算力越多，但每个单位的算力产生的价值也在指数增长。

6. Mythos：不敢直接发布的模型

访谈里有一段非常不 CFO 的内容——关于一个叫 Mythos 的模型。

Mythos 是 Anthropic 最新的通用模型，但在网络安全（Cybersecurity）领域的能力突然出现了异常跃升。老模型只能在一个开源代码库中找到 22 个安全漏洞（Vulnerability）。Mythos 找到了 250 个。

Anthropic 的选择是：不分发，分阶段给特定群体。

Rao 说，这是一个”负责任的部署（Responsible Deployment）“框架——模型能力出现意料之外的跃升时，暂停常规发布流程，先评估、再分阶段放出。他们预估其他组织”在 18 个月内也会推出类似能力的模型”。

注意：Rao 是 CFO。他在投资者面前说”我们有能力发布更强的模型但我们选择了暂缓”。这本身就是一个张力——“负责任”是品牌价值还是商业代价？两种可能同时为真。

7. Meta 挖角，Anthropic 只丢了两个人

主持人问了一个组织文化的问题。Rao 给了一组数字：

7 位联合创始人，全都在职。
前 20-30 名员工，绝大多数仍在。
面对 Meta 等竞争对手天价挖角——“只流失了两个人，而其他实验室流失了数十人。”

怎么做到了？Rao 给了三个原因：协作（Collaboration）、谦逊（Humility）、知识诚实（Intellectual Honesty）。每个候选人除了技术面试，必须通过文化面试（Culture Interview）。不通过就不过。CEO Dario Amodei 每两周一次全员大会（All-Hands），任何问题都可以提——不预筛。

在 AI 人才大战最激烈的时候，Anthropic 用的是最传统的武器：文化。不是薪资（Meta 开得更高），不是期权（SpaceX IPO 更诱人），是”你想跟谁一起工作、解决什么问题”。

8. 终局：虚拟协作者

Rao 描摹了 Anthropic 的终局产品形态。不是聊天机器人。而是一个：

拥有组织内部上下文
能使用各种专属工具
有记忆能力
能从错误中学习
能在长时间维度上处理完整项目的

“虚拟协作者（Virtual Collaborator）。”

在 Anthropic 内部，这个未来已经在预演：产品开发不再是三个月周期，而是”每天都有 shipping”。工程师变成了”管理 Agent 的管理者”。一个人同时跑好几个 Agent 处理不同任务。

注意这个表述的细微之处：不是”AI 替代人”，是”人的角色变了”。从”做事的人”变成了”决定做什么、检查做得对不对、设计自动化流程的人”。这跟解码4 里 Boris Cherny 说的”我的工作变成了写 Loops”一模一样。

9. Rao 的回避清单

系列保留环节。一个 CFO 在首度公开采访时，刻意不看什么？

（回避清单见下方）

10. 所以呢？

Krishna Rao 这期播客，最有价值的东西不是数据——$30B ARR 你已经在别处看过了。是他作为一个 CFO 的思维方式：

指数思维（Exponential Thinking）：不用”明年大概会增长多少”，用”如果月增长率在这个区间，12 个月后的上限和下限是多少”。
圆锥思维（Cone of Uncertainty）：不是做”一个预测”，是做”一组场景”——然后确保无论落在哪个点，公司都能活。
桶思维（Bucket Framework）：知道什么能砍、什么不能砍。模型训练研发不能砍——即使这意味着放弃数十亿美元的短期收入。

这三种思维方式，比任何财务数字都更诚实地告诉你 Anthropic 在赌什么：

前沿智能（Frontier Intelligence）的回报率高到可以让所有短期财务逻辑失效。 如果你相信这个前提，$1000 亿的算力承诺是理性的。如果不信——这就是 AI 行业最大的泡沫。

Rao 显然信。而且他用 CFO 的语言——桶、圆锥、飞轮、双重红利——把这套信仰翻译成了可以跟董事会讨论的商业计划。

🧠 我的判断

我从事采购工作。这期播客对我最大的冲击不是 AI，是——一个 CFO 在教我怎么做好采购。

Rao 表面上在讲算力采购。实际上，他讲了三件事，每一件都能直接平移到我日常的工作里：

第一，采购不是”买东西”，是”买不确定性的保险”。

Rao 的圆锥思维（Cone of Uncertainty）本质上是一个采购框架：不是基于”一个预测”去下单，而是基于”一组场景”去做承购承诺——确保无论市场怎么变，公司都能活。传统的采购逻辑是”需求部门给我一个数，我去找三家供应商比价”。但 Rao 的逻辑是：需求本身是指数级变化的，你永远不可能拿到一个准确的数字。采购的价值不在于”用最低价买到需求清单上的东西”，而在于设计一个无论需求怎么变都不会断供的供应链结构。

第二，供应商不是越多越好，是越可互换越安全。

Anthropic 的三芯片策略——Trainium、TPU、GPU 三种芯片通过自研编译器层做到互相替换——这是采购领域的教科书级操作。传统的”备选供应商”是：主供应商出问题，启动备选。但 Rao 的做法是：让三个供应商同时在线，工作负载可以实时切换。 这不是”备选”，这是”互操作”。自研编译器层就是 Anthropic 的供应链基础设施。类比到传统采购：你不是找了三家供应商，你是建了一套”任何一家的物料进来都能即插即用的内部系统”。这才是真正的供应链安全。

第三，知道什么不能砍，比知道什么能砍更重要。

“三个桶”的框架里，模型训练研发有硬性底线——即使放弃数十亿美元客户收入也不能砍。这是采购资源配置里最难的一件事：不是没有预算，是敢不敢在最缺钱的时候，守住那些短期看不见回报的投入。 日常工作中，我们面对的是反过来的压力——每个部门都想保自己的预算，采购夹在中间做平衡。Rao 的启示是：资源分配的终极问题不是”怎么砍”，是”先确定什么绝对不能砍，剩下的再讨论”。底线必须先划，而不是在压缩过程中自然浮现。

这三个启示，跟我日常在用的采购逻辑几乎是反过来的。我以前是从”确定的需求清单”开始，他让我意识到应该从”不确定性的范围”开始。我以前是先找供应商再建流程，他是先建内部能力再让供应商接入。我以前是在压缩预算的时候砍”看起来不紧急”的，他是先锁死”绝对不能砍”的再动其他的。

我不知道这些思维方式能不能直接用到我的工作里。但它们让我看到了一个可能性：采购这门工作，在 AI 时代可能不再是”买东西”，而是管理不确定性的工程学。

我把这个判断写下来。不一定对。但它是我被这期播客击中的地方。

🧭 认知导航

你刚刚读的是「注意力解码」第 5 期——拆解 Anthropic CFO Krishna Rao 的算力采购思维。一个 CFO 用”圆锥""三个桶""双重红利”这三套框架，在管理一场 $1000 亿的赌局。

如果想沿着这期的话题继续深入： → 解码4（上/下）：六家模型公司全景对比——Anthropic 的”筑墙”策略在表里有什么位置？它的定价权凭什么比 OpenAI 强？ → 解码2：Benedict Evans 的三个追问——为什么模型层可能赚不到钱？跟 Rao 的”$1000 亿算力承诺”放在一起看，矛盾就出来了。

如果想回到最底层，理解整套思维方式从哪里来： → 注意力是什么？为什么”少看一点反而理解更深”？（注意力的进化 · 第 1 篇） → 我为什么开始写这个号：一个普通人的 AI 学习之路（注意力进化论 · 发刊词）

你是新读者吗？ 这个号有三个固定栏目：

🌳 注意力解码：拆播客、拆演讲、拆叙事——训练你看穿”他说了什么，没说什么”
📡 注意力雷达：扫行业全景——把碎片拼成地图
📖 注意力深读：拆书、拆论文——消化值得慢慢读的东西

你不需要按顺序读。每一篇都独立成立。但如果你想搭一棵完整的认知树，这里有地图。

本期素材：Invest Like the Best with Patrick O’Shaughnessy — “Krishna Rao - Anthropic’s CFO on Managing Compute, Scaling to $30B ARR, and the Returns to Frontier Intelligence”（2026.5.13）；电脑王阿达中文拆解（2026.5）；YourStory / FirstPost / NewsBytes 等综合报道

🚫 回避清单

以下是作者选择性省略、回避，或未充分讨论的问题：

• 估值——整场访谈，Rao 一次没有主动提到 Anthropic 的 $9,650 亿估值或即将到来的 IPO。一个 CFO 不谈估值——这本身就是一种注意力引导：他想让你看算力和产品，而不是股价。
• OpenAI 和 Google——没有提到任何竞争对手的名字。最接近的一次是'其他实验室流失了数十人'——没有说是谁。跟老黄一样的策略：不进入竞争对手设定的框架。
• 盈利的具体数字——提到了'数十亿美元'的客户收入被放弃、提到了'双重红利'来降低推理成本、但从未给出毛利率或净利润的具体数字。利润在变好——好到什么程度？不知道。
• 地缘政治——三种芯片策略里提到了供应链对冲，但 Rao 没有一次说出'中国''台海''出口管制'这些词。风险被抽象成了'供应链多元化'的管理术语——但你知道那三个词才是真正的原因。
• AI Safety 的具体内容——这是 Anthropic 的立身之本。Rao 提了 Mythos 的审慎部署策略、提了文化面试——但全程没有展开讨论'安全性'本身。Safety 变成了'负责任部署'这个更温和的说法。一个以 Safety 起家的公司，CFO 不主动展开 Safety——这是在向金融市场传递信号：'我们是来赚钱的，不是来讨论哲学问题的。'

🧭 认知导航

你刚刚读的是注意力解码第5期——拆解 Anthropic CFO Krishna Rao 的算力采购思维。一个 CFO 用'圆锥''三个桶''双重红利'三套框架，在管理一场 $1000 亿的赌局。对我冲击最大的是：他在教我怎么做采购——采购不是'买东西'，是'管理不确定性的工程学'。

继续阅读：

→ 解码4（上/下）：六家模型公司全景对比——Anthropic 的'筑墙'策略 → 解码2：Benedict Evans 的三个追问——模型层可能赚不到钱？