注意力解码 #1：黄仁勋的两小时演讲，是一场注意力工程

2026年6月1日 · 阅读约 7 分钟

注意力解码 #1：黄仁勋的两小时演讲，是一场注意力工程

「注意力解码」· 第1期

深度拆解那些值得真正理解的内容。从注意力进化论的角度。

2026年6月1日，台北流行音乐中心。黄仁勋穿皮夹克上台，台下尖叫的分贝不像科技发布会，像演唱会。

两小时二十分钟。产品密集发布：Vera Rubin 全面量产、Vera CPU 首发、RTX Spark 进军 PC、Nemotron 3 Ultra 开源、Cosmos 3 物理 AI、Alpamayo 2 推理自驾。金句频出：“Token就是资产”、“Agent 时代已经到来”、“AI 减少岗位是胡说八道”。全球70个国家同步直播，隔夜股价拉升3%，台湾供应链集体涨停。

媒体报道了所有这些。但你如果只读到这些，你读到的是黄仁勋想让你读到的东西。

任何一场这个级别的演讲，都不是”信息发布”。它是一个精心设计的注意力分配系统。讲者选择把两小时的聚光灯打在哪里、什么东西从头到尾不碰、什么样的句子以什么样的频率反复出现——这些选择本身，比讲者说出口的任何一句话都更诚实。

今天，用注意力进化论的镜片拆了它。

一、从”生成式 AI”到”Agent 时代”——这场演讲的真正任务

先看黄仁勋给自己设定的任务是什么。

两年前，同一个场合，他预言了”下一波 AI”。今天他上台第一件事就是回收这个伏笔——“两年前我在这里跟你讲下一波 AI，今天我可以告诉你，Agent 时代已经到了。”

这句话是整个演讲的锚。它把一场产品发布会的性质，变成了一次**“预言兑现”仪式**。你在见证的不是一家公司在卖新产品，而是一个先知在应验自己的预言。

然后看产品怎么排的：

Vera Rubin —— 不是作为”新一代 GPU”发布的，是作为”AI 工厂的操作系统”发布的。五机架系统，10倍推理性能每瓦特，150家台湾合作伙伴，350多家工厂横跨30个国家。他展示的不是一枚芯片的规格，而是一座工厂的图纸。

Vera CPU —— 这是 NVIDIA 历史上第一颗自研数据中心 CPU。88 核，自研 Olympus 架构，用 LPDDR5X 内存。但最值得听的不是参数，是他给这颗 CPU 的定位——“传统 CPU 是为人类用户设计的，以秒为单位。Vera CPU 是为 AI Agent 重新设计的，以纳秒为单位。”

这句话很厉害。它做了一件事：把 x86 架构放进了”上一代”的盒子里。 不是”AMD 和 Intel 的 CPU 不够好”，是”它们的 CPU 根本不为这个时代设计”。不骂竞品，但直接宣布竞品的时代结束了。

RTX Spark —— 与联发科联合研发，台积电 3 纳米，700 亿晶体管，1 petaflop AI 算力，128GB 统一内存。和微软合作，跑 Windows on Arm。华硕、戴尔、惠普、联想秋季开始出货。

这条产品线在做的事比表面看起来大得多：NVIDIA 正式进入了 x86 最后的堡垒——PC 芯片。 但黄仁勋从头到尾没提 Intel 和 AMD。他只是说”我们在重新发明个人电脑”。不提竞品，不是因为礼貌。是因为一旦把观众注意力引导到”Intel vs NVIDIA”这个框架上，他就从”定义未来的人”降级成了”在现有市场里抢份额的人”。

Nemotron 3 Ultra —— 550B 参数，全球首个 SSM+MoE 混合架构开源模型。5 倍更快，30% 更便宜。开源的不只是模型权重，连数据和训练方法都公开。

这看起来像做慈善。实际是——更多的模型部署 = 更多的推理算力需求 = 更多的 GPU 购买。 NVIDIA 不需要从模型本身赚钱。只要 AI 用量在增长，不管谁家的模型在跑，最终都要找 NVIDIA 买卡。

Cosmos 3 和 Alpamayo 2 —— 物理 AI 世界模型，和首个推理自驾车模型（全球 80% 汽车品牌已承诺采用）。这是在做同一件事：把 AI 的故事从”数据中心”扩展到一切会动的物体。 工厂、机器人、汽车——那些目前还不需要 GPU 的地方，未来需要。

整场演讲看完，产品线铺得极广，但有一条线把每一样东西都串了起来：Agent 时代需要全新的基础设施。从数据中心到 PC，从工厂到汽车。NVIDIA 是那个基础设施。

这不是产品发布。这是在画一张地图，然后告诉所有人：这个世界的路，都是我修的。

二、三句副歌——他是怎么确保你忘不掉的

两小时，十几个产品。正常人的注意力只能记住三样东西。

黄仁勋显然知道这一点。所以他在演讲中埋了三句”副歌”，以不同表述反复出现：

“Token 就是利润单位。”

“Agent 时代已经到来。”

“买得越多，赚得越多。”

这不是金句——金句是用来转发的。这三句是认知缓存，设计目的是让它们在你的长期记忆里占据一个不可替代的位置。

逐一拆：

“Token 就是利润单位。” 这是整场演讲最重要的一步棋。它做了一件非常底层的事——改变了你衡量 AI 价值的单位。

石油时代的单位是”桶”。互联网时代的单位是”点击”和”DAU”。黄仁勋在说：AI 时代的计价单位是 token。而 token 是用 GPU 生产出来的。你接受了”token=利润单位”这个前提，就不得不接受”GPU=利润的生产资料”。计价单位是谁定义的，估值框架就是谁定义的。

“Agent 时代已经到来。” 这句话真正的力道在”已经”两个字。不是”即将”，不是”有望”，是”已经”。它的功能是压缩听众的心理时间线。如果 Agent 时代已经来了，采购决策就不是”先观望一下”——是”现在就得上车”。这句话每重复一次，台下 CIO 的心理预算审批优先级就往上挪一档。

“买得越多，赚得越多。” 前两句建立了认知（新单位、新时代），这一句给出行动指令。而且”买”在”赚”前面。不是你赚了钱再来买我的 GPU，是你先买 GPU，然后你会赚。这句话的逻辑顺序本身就是一套销售闭环。

三句话的功能分工精确到像设计过——因为它们就是设计过的。Transformer 把处理过的 token 存进 KV Cache，下次不再重算。黄仁勋把这三句话存进你的长期记忆，下次想起 AI，它们自动浮现。

三、他没说的——才是这场演讲真正的骨架

前面讲了他选择看什么、说什么、强调什么。

但有一个更深的维度：他那两小时里，刻意不看的东西。

（回避清单见下方）

四、演讲的真正产物

两小时结束，灯光亮起，观众离场。

他们带走的东西，不是一个产品清单。是一个被重新排布过的注意力地图。

在这张地图上，Agent 时代是现在进行时，NVIDIA 是全栈基础设施的定义者，Token 是新经济的计价单位，风险不可见，竞品不存在，质疑不属于这个叙事空间。

黄仁勋做了三十年的 CEO，每一场发布会都在练同一件事：注意力管理。 决定让观众看什么，决定让观众不看什么，决定让观众带走什么——这三个决定，比任何产品参数都更深刻地塑造了 NVIDIA 在人们脑子里的位置。

这件事 AI 花了六年才学会——从 Transformer 的 O(N²) 全量注意，到 Mamba 的选择性机制。核心就一句：少看一点，反而理解得更深。

黄仁勋不是在卖 GPU。他在替整个市场做注意力筛选。你接不接受他的筛选是你的选择——但至少，你得意识到他在筛选。

下一次听一场这个级别的演讲，不管是 Tim Cook 的、Sam Altman 的、还是你公司 CEO 的全员会——在听他说了什么之前，先看他不说什么。演讲的骨架，永远藏在阴影里。

「注意力解码」 是「注意力的进化」的姊妹系列。前者建立认知框架，后者展示如何用它来深度阅读世界。下一篇拆 Benedict Evans 对 AI 价值捕获的分析——为什么模型公司可能赚不到钱。

参考来源：NVIDIA GTC Taipei 2026 Keynote、36氪、Fortune、Yahoo Finance、The Next Web、ChosunBiz 等综合报道

🚫 回避清单

以下是作者选择性省略、回避，或未充分讨论的问题：

• 没提竞品——AMD、Intel、云厂商自研芯片（Google TPU、Amazon Trainium、Microsoft Maia）一个字没提。一旦开始回应竞争，就等于承认竞争值得回应。
• 没提自己的客户也是最大的长期威胁——Amazon、Google、Microsoft 既是 NVIDIA 最大的 GPU 买家，也都在拼命做自己的 AI 芯片。
• 没提估值——NVIDIA 是全球市值最高的公司之一，值不值这个价，黄仁勋一个字没碰。
• 没提地缘政治——站在台北，台海风险是他供应链最集中的单一故障点。没提。芯片制裁正在重塑全球半导体格局。也没提。
• 没提能源——AI 数据中心的电力需求正在暴涨，电从哪来？电网撑得住吗？碳排放呢？在他的叙事里，约束不存在，只有增长。
• 没提 AI 安全——Agent 失控、Deepfake、自主武器化，这些话题在别处激烈辩论，在他这里不存在。唯一碰到的争议话题是'AI 会不会减少岗位'，回答是'胡说八道'——但论据只能证明'目前软件开发领域还没出现净裁员'，不能推广到整个经济。

🧭 认知导航

你刚刚读的是注意力解码第1期——拆解黄仁勋 GTC 2026 的两小时演讲。核心发现：他的产品线铺得极广，但有一条线串起一切——Agent 时代需要全新的基础设施，NVIDIA 是那个基础设施。这不是产品发布，是画一张地图然后告诉所有人：这个世界的路，都是我修的。更重要的是，他埋了三句'认知缓存'在你脑子里：Token 就是利润单位、Agent 时代已经到来、买得越多赚得越多。这三句的功能分工精确到像设计过——因为它们就是设计过的。

继续阅读：

→ 解码2：Benedict Evans 的三个追问——为什么模型公司可能赚不到钱？ → 解码5：Anthropic CFO 的 $1000 亿算力赌局