Anthropic CFO首度公开受访:「算力就是命」,$1000 亿押注什么?
「注意力解码」· 第5期
拆解 Anthropic CFO Krishna Rao 在 Invest Like the Best 的首度公开访谈
如果你是一家 AI 公司的 CFO,加入时公司年化收入只有 2.5 亿美元。一年半之后,这个数字变成了 300 亿美元,涨了 120 倍。
你会怎么花钱?
这是 Krishna Rao 面临的真实处境。他是 Anthropic 的 CFO,2024 年 5 月加入。在此之前,他从未接受过任何公开采访。
直到最近,他坐到了 Invest Like the Best 的主持人 Patrick O’Shaughnessy 对面,聊了 76 分钟。
这期播客值得你花时间的原因不是”Anthropic 又融了多少钱”。而是 一个 CFO 的视角,让你看到那些年报和融资公告里永远不会写的东西——他怎么思考算力、怎么分配资源、怎么在指数增长的世界里做计划。
今天用同一个方法论拆这期播客:不是”他说了什么”,是”他选择让你看到什么”。
1. 120 倍的真相:不只是模型变强了
很多人以为 Anthropic 的收入暴涨是因为模型越来越强。Rao 说,这只是其中一个因素。
他拆了七个驱动因素:模型多维能力提升、长时间任务执行(Long-Horizon Task Execution)、工具使用(Tool Use)、电脑操作(Computer Use)、Agent 任务表现、每代新模型解锁更大的可服务市场(Total Addressable Market, TAM)、企业客户发现新场景后用量暴增。
七个因素,没有一个可以单独解释 120 倍。
但这些因素叠加在一起,产生了一个非线性效应——每个因素都在放大其他因素的影响。模型变强了 → 能处理更复杂的任务 → 企业客户用量增加 → 新客户进来 → 模型又因为更多反馈变得更好。
这是 Rao 在整个访谈里最核心的思维模式:指数思维(Exponential Thinking)。 “人类天然用线性方式思考,这是我必须打破自己的范式。”
但这句话还有后半截他没直接说:如果一个 CFO 需要强迫自己用指数思维,那意味着我们这些外部观察者——用线性框架去估值、去预测、去判断”泡沫还是革命”——可能错的比对的更多。
2. 算力就是命
Rao 说了一句很重的话:
“算力是我们业务的生命线(Lifeblood)。是其他一切可以在上面构建的画布(Canvas)。”
一个 CFO,不是 CTO,把 30%-40% 的时间花在算力采购上。为什么?
因为 Anthropic 面临一个问题:模型能力每提升一代,用户用量就暴增——暴增的幅度往往超过模型效率的提升。 如果你算力不够,客户就跑光了。如果你买太多,公司就死了。
Rao 管这叫做”不确定性的圆锥(Cone of Uncertainty)“。一个形象的比喻:
想像你要在 18 个月后举办一场户外婚礼。你不知道那天会不会下雨,但你得提前订帐篷。订小的,下雨就完蛋了。订大的,晴天就浪费了。而且——雨可能大到前所未有。也可能阳光好到宾客翻倍。
这就是 Anthropic 的日常生活。Rao 的原话是:“我们必须在多个场景下同时规划,确保无论落在圆锥的哪个点,都有足够的算力支撑。”
有意思的是:他选择的词是”圆锥”而不是”范围”或”区间”。圆锥意味着越往远看,不确定性越大——而且是发散的,不是收敛的。
这种思维直接导致了一件事:Anthropic 启动了 AI 行业史上最大规模的算力采购。 Google + Broadcom 签了 5 吉瓦 TPU。Amazon Trainium 又签了 5 吉瓦。加上 SpaceX Colossus GPU 容量。累计承购承诺超过 1000 亿美元。
3. 为什么同时用三种芯片?
Rao 透露了一个很少被讨论的竞争优势:Anthropic 是唯一一家同时大规模使用 AWS Trainium、Google TPU 和 NVIDIA GPU 的前沿实验室。
不是”各用一点点”,是三种都可以互相替换。为此他们自研了编译器层(Compiler Layer)——从芯片层级做适配。“这花了好几年时间投资构建。”
为什么重要?三个原因:
第一,对冲供应链风险。 只依赖 NVIDIA 一条线?台海出事、出口管制升级、产能瓶颈——任何一个都致命。三条线并行,断了一条还有两条。
第二,议价权。 你是 NVIDIA 最大的客户之一,但你可以随时把工作负载切到 TPU 上。你不是没选择,对方就不是天价。
第三,成本结构。 不同工作负载跑在不同芯片上,综合效率最高。训练用这种,推理用那种,研究用第三种。“前沿实验室里最有效的算力使用者”,这不是口号,这是成本优势的根基。
这个策略跟解码4 里 DeepSeek 的”华为昇腾适配”有异曲同工之处——都在做一件事:把硬件从战略风险变成运营选择。
区别在于:DeepSeek 是”被迫但受益”(芯片制裁下的被动选择),Anthropic 是”主动但昂贵”(花了多年时间构建编译器层)。两条路都通向同一个终点:算力自主。
4. 三个桶:一个你不能砍的桶
访谈最精彩的部分,是 Rao 讲 Anthropic 内部算力怎么分。他用了”三个桶”的比喻:
- 桶一:模型训练与研发。 这个桶有一条硬性底线——无论如何不能砍。即使这意味着少服务一些客户、少赚一些钱。
- 桶二:内部员工使用。 公司自己人用 Claude Code、做研究。
- 桶三:客户服务。 企业客户的 API 调用和产品使用。
主持人追问了一个尖锐的问题:如果把桶一和桶二的算力全部拿去服务客户,能多赚多少钱?
Rao 的答案是:“数十亿美元。”
但他选择不这么做。
不是因为他不在乎钱。而是因为 Anthropic 的核心假设是:前沿智能(Frontier Intelligence)的回报率极高,尤其是在企业市场。 今天牺牲的”数十亿美元”客户收入,换的是明天模型能力领先带来的更大收入。如果你砍了桶一,省下来的钱很快就会被竞争对手的下一代模型吃掉。
这是一个 CFO 在替公司做”长期 vs 短期”的选择——而且他选择长期的时候,给出了具体的数字:数十亿美元。不是”很多”,不是一个抽象概念,是一个可以算出来的账。
5. 模型越强,反而越便宜
大多数人的直觉是:越强的模型,推理越贵。就像跑车比轿车费油。
Rao 说,Anthropic 恰恰相反。从 Opus 4 到 4.5 到 4.6 到 4.7——每次换代,推理效率都大幅提升。 某些情况下效率是前一代的”数倍”。
能力变强 + 成本下降 = 双重红利(Double Dividend)。
为什么双重红利重要?因为 Anthropic 内部大量使用强化学习(Reinforcement Learning, RL)来训练下一波模型。而 RL 的本质就是”大量推理加上奖励函数”——推理越便宜,RL 训练就越经济。RL 训练越高效,模型就越强。模型越强,推理效率越高。
这是一个正向飞轮(Flywheel)。 也是为什么 Rao 敢说”算力是我们的生命线”——飞轮转得越快,需要的算力越多,但每个单位的算力产生的价值也在指数增长。
6. Mythos:不敢直接发布的模型
访谈里有一段非常不 CFO 的内容——关于一个叫 Mythos 的模型。
Mythos 是 Anthropic 最新的通用模型,但在网络安全(Cybersecurity)领域的能力突然出现了异常跃升。老模型只能在一个开源代码库中找到 22 个安全漏洞(Vulnerability)。Mythos 找到了 250 个。
Anthropic 的选择是:不分发,分阶段给特定群体。
Rao 说,这是一个”负责任的部署(Responsible Deployment)“框架——模型能力出现意料之外的跃升时,暂停常规发布流程,先评估、再分阶段放出。他们预估其他组织”在 18 个月内也会推出类似能力的模型”。
注意:Rao 是 CFO。他在投资者面前说”我们有能力发布更强的模型但我们选择了暂缓”。这本身就是一个张力——“负责任”是品牌价值还是商业代价?两种可能同时为真。
7. Meta 挖角,Anthropic 只丢了两个人
主持人问了一个组织文化的问题。Rao 给了一组数字:
- 7 位联合创始人,全都在职。
- 前 20-30 名员工,绝大多数仍在。
- 面对 Meta 等竞争对手天价挖角——“只流失了两个人,而其他实验室流失了数十人。”
怎么做到了?Rao 给了三个原因:协作(Collaboration)、谦逊(Humility)、知识诚实(Intellectual Honesty)。每个候选人除了技术面试,必须通过文化面试(Culture Interview)。不通过就不过。CEO Dario Amodei 每两周一次全员大会(All-Hands),任何问题都可以提——不预筛。
在 AI 人才大战最激烈的时候,Anthropic 用的是最传统的武器:文化。不是薪资(Meta 开得更高),不是期权(SpaceX IPO 更诱人),是”你想跟谁一起工作、解决什么问题”。
8. 终局:虚拟协作者
Rao 描摹了 Anthropic 的终局产品形态。不是聊天机器人。而是一个:
- 拥有组织内部上下文
- 能使用各种专属工具
- 有记忆能力
- 能从错误中学习
- 能在长时间维度上处理完整项目的
“虚拟协作者(Virtual Collaborator)。”
在 Anthropic 内部,这个未来已经在预演:产品开发不再是三个月周期,而是”每天都有 shipping”。工程师变成了”管理 Agent 的管理者”。一个人同时跑好几个 Agent 处理不同任务。
注意这个表述的细微之处:不是”AI 替代人”,是”人的角色变了”。从”做事的人”变成了”决定做什么、检查做得对不对、设计自动化流程的人”。这跟解码4 里 Boris Cherny 说的”我的工作变成了写 Loops”一模一样。
9. Rao 的回避清单
系列保留环节。一个 CFO 在首度公开采访时,刻意不看什么?
(回避清单见下方)
10. 所以呢?
Krishna Rao 这期播客,最有价值的东西不是数据——$30B ARR 你已经在别处看过了。是他作为一个 CFO 的思维方式:
- 指数思维(Exponential Thinking):不用”明年大概会增长多少”,用”如果月增长率在这个区间,12 个月后的上限和下限是多少”。
- 圆锥思维(Cone of Uncertainty):不是做”一个预测”,是做”一组场景”——然后确保无论落在哪个点,公司都能活。
- 桶思维(Bucket Framework):知道什么能砍、什么不能砍。模型训练研发不能砍——即使这意味着放弃数十亿美元的短期收入。
这三种思维方式,比任何财务数字都更诚实地告诉你 Anthropic 在赌什么:
前沿智能(Frontier Intelligence)的回报率高到可以让所有短期财务逻辑失效。 如果你相信这个前提,$1000 亿的算力承诺是理性的。如果不信——这就是 AI 行业最大的泡沫。
Rao 显然信。而且他用 CFO 的语言——桶、圆锥、飞轮、双重红利——把这套信仰翻译成了可以跟董事会讨论的商业计划。
🧠 我的判断
我从事采购工作。这期播客对我最大的冲击不是 AI,是——一个 CFO 在教我怎么做好采购。
Rao 表面上在讲算力采购。实际上,他讲了三件事,每一件都能直接平移到我日常的工作里:
第一,采购不是”买东西”,是”买不确定性的保险”。
Rao 的圆锥思维(Cone of Uncertainty)本质上是一个采购框架:不是基于”一个预测”去下单,而是基于”一组场景”去做承购承诺——确保无论市场怎么变,公司都能活。传统的采购逻辑是”需求部门给我一个数,我去找三家供应商比价”。但 Rao 的逻辑是:需求本身是指数级变化的,你永远不可能拿到一个准确的数字。采购的价值不在于”用最低价买到需求清单上的东西”,而在于设计一个无论需求怎么变都不会断供的供应链结构。
第二,供应商不是越多越好,是越可互换越安全。
Anthropic 的三芯片策略——Trainium、TPU、GPU 三种芯片通过自研编译器层做到互相替换——这是采购领域的教科书级操作。传统的”备选供应商”是:主供应商出问题,启动备选。但 Rao 的做法是:让三个供应商同时在线,工作负载可以实时切换。 这不是”备选”,这是”互操作”。自研编译器层就是 Anthropic 的供应链基础设施。类比到传统采购:你不是找了三家供应商,你是建了一套”任何一家的物料进来都能即插即用的内部系统”。这才是真正的供应链安全。
第三,知道什么不能砍,比知道什么能砍更重要。
“三个桶”的框架里,模型训练研发有硬性底线——即使放弃数十亿美元客户收入也不能砍。这是采购资源配置里最难的一件事:不是没有预算,是敢不敢在最缺钱的时候,守住那些短期看不见回报的投入。 日常工作中,我们面对的是反过来的压力——每个部门都想保自己的预算,采购夹在中间做平衡。Rao 的启示是:资源分配的终极问题不是”怎么砍”,是”先确定什么绝对不能砍,剩下的再讨论”。底线必须先划,而不是在压缩过程中自然浮现。
这三个启示,跟我日常在用的采购逻辑几乎是反过来的。我以前是从”确定的需求清单”开始,他让我意识到应该从”不确定性的范围”开始。我以前是先找供应商再建流程,他是先建内部能力再让供应商接入。我以前是在压缩预算的时候砍”看起来不紧急”的,他是先锁死”绝对不能砍”的再动其他的。
我不知道这些思维方式能不能直接用到我的工作里。但它们让我看到了一个可能性:采购这门工作,在 AI 时代可能不再是”买东西”,而是管理不确定性的工程学。
我把这个判断写下来。不一定对。但它是我被这期播客击中的地方。
🧭 认知导航
你刚刚读的是「注意力解码」第 5 期——拆解 Anthropic CFO Krishna Rao 的算力采购思维。一个 CFO 用”圆锥""三个桶""双重红利”这三套框架,在管理一场 $1000 亿的赌局。
如果想沿着这期的话题继续深入: → 解码4(上/下):六家模型公司全景对比——Anthropic 的”筑墙”策略在表里有什么位置?它的定价权凭什么比 OpenAI 强? → 解码2:Benedict Evans 的三个追问——为什么模型层可能赚不到钱?跟 Rao 的”$1000 亿算力承诺”放在一起看,矛盾就出来了。
如果想回到最底层,理解整套思维方式从哪里来: → 注意力是什么?为什么”少看一点反而理解更深”?(注意力的进化 · 第 1 篇) → 我为什么开始写这个号:一个普通人的 AI 学习之路(注意力进化论 · 发刊词)
你是新读者吗? 这个号有三个固定栏目:
- 🌳 注意力解码:拆播客、拆演讲、拆叙事——训练你看穿”他说了什么,没说什么”
- 📡 注意力雷达:扫行业全景——把碎片拼成地图
- 📖 注意力深读:拆书、拆论文——消化值得慢慢读的东西
你不需要按顺序读。每一篇都独立成立。但如果你想搭一棵完整的认知树,这里有地图。
本期素材:Invest Like the Best with Patrick O’Shaughnessy — “Krishna Rao - Anthropic’s CFO on Managing Compute, Scaling to $30B ARR, and the Returns to Frontier Intelligence”(2026.5.13);电脑王阿达中文拆解(2026.5);YourStory / FirstPost / NewsBytes 等综合报道
🚫 回避清单
以下是作者选择性省略、回避,或未充分讨论的问题:
- • 估值——整场访谈,Rao 一次没有主动提到 Anthropic 的 $9,650 亿估值或即将到来的 IPO。一个 CFO 不谈估值——这本身就是一种注意力引导:他想让你看算力和产品,而不是股价。
- • OpenAI 和 Google——没有提到任何竞争对手的名字。最接近的一次是'其他实验室流失了数十人'——没有说是谁。跟老黄一样的策略:不进入竞争对手设定的框架。
- • 盈利的具体数字——提到了'数十亿美元'的客户收入被放弃、提到了'双重红利'来降低推理成本、但从未给出毛利率或净利润的具体数字。利润在变好——好到什么程度?不知道。
- • 地缘政治——三种芯片策略里提到了供应链对冲,但 Rao 没有一次说出'中国''台海''出口管制'这些词。风险被抽象成了'供应链多元化'的管理术语——但你知道那三个词才是真正的原因。
- • AI Safety 的具体内容——这是 Anthropic 的立身之本。Rao 提了 Mythos 的审慎部署策略、提了文化面试——但全程没有展开讨论'安全性'本身。Safety 变成了'负责任部署'这个更温和的说法。一个以 Safety 起家的公司,CFO 不主动展开 Safety——这是在向金融市场传递信号:'我们是来赚钱的,不是来讨论哲学问题的。'
🧭 认知导航
你刚刚读的是注意力解码第5期——拆解 Anthropic CFO Krishna Rao 的算力采购思维。一个 CFO 用'圆锥''三个桶''双重红利'三套框架,在管理一场 $1000 亿的赌局。对我冲击最大的是:他在教我怎么做采购——采购不是'买东西',是'管理不确定性的工程学'。