注意力解码 #1:黄仁勋的两小时演讲,是一场注意力工程
「注意力解码」· 第1期
深度拆解那些值得真正理解的内容。从注意力进化论的角度。
2026年6月1日,台北流行音乐中心。黄仁勋穿皮夹克上台,台下尖叫的分贝不像科技发布会,像演唱会。
两小时二十分钟。产品密集发布:Vera Rubin 全面量产、Vera CPU 首发、RTX Spark 进军 PC、Nemotron 3 Ultra 开源、Cosmos 3 物理 AI、Alpamayo 2 推理自驾。金句频出:“Token就是资产”、“Agent 时代已经到来”、“AI 减少岗位是胡说八道”。全球70个国家同步直播,隔夜股价拉升3%,台湾供应链集体涨停。
媒体报道了所有这些。但你如果只读到这些,你读到的是黄仁勋想让你读到的东西。
任何一场这个级别的演讲,都不是”信息发布”。它是一个精心设计的注意力分配系统。讲者选择把两小时的聚光灯打在哪里、什么东西从头到尾不碰、什么样的句子以什么样的频率反复出现——这些选择本身,比讲者说出口的任何一句话都更诚实。
今天,用注意力进化论的镜片拆了它。
一、从”生成式 AI”到”Agent 时代”——这场演讲的真正任务
先看黄仁勋给自己设定的任务是什么。
两年前,同一个场合,他预言了”下一波 AI”。今天他上台第一件事就是回收这个伏笔——“两年前我在这里跟你讲下一波 AI,今天我可以告诉你,Agent 时代已经到了。”
这句话是整个演讲的锚。它把一场产品发布会的性质,变成了一次**“预言兑现”仪式**。你在见证的不是一家公司在卖新产品,而是一个先知在应验自己的预言。
然后看产品怎么排的:
Vera Rubin —— 不是作为”新一代 GPU”发布的,是作为”AI 工厂的操作系统”发布的。五机架系统,10倍推理性能每瓦特,150家台湾合作伙伴,350多家工厂横跨30个国家。他展示的不是一枚芯片的规格,而是一座工厂的图纸。
Vera CPU —— 这是 NVIDIA 历史上第一颗自研数据中心 CPU。88 核,自研 Olympus 架构,用 LPDDR5X 内存。但最值得听的不是参数,是他给这颗 CPU 的定位——“传统 CPU 是为人类用户设计的,以秒为单位。Vera CPU 是为 AI Agent 重新设计的,以纳秒为单位。”
这句话很厉害。它做了一件事:把 x86 架构放进了”上一代”的盒子里。 不是”AMD 和 Intel 的 CPU 不够好”,是”它们的 CPU 根本不为这个时代设计”。不骂竞品,但直接宣布竞品的时代结束了。
RTX Spark —— 与联发科联合研发,台积电 3 纳米,700 亿晶体管,1 petaflop AI 算力,128GB 统一内存。和微软合作,跑 Windows on Arm。华硕、戴尔、惠普、联想秋季开始出货。
这条产品线在做的事比表面看起来大得多:NVIDIA 正式进入了 x86 最后的堡垒——PC 芯片。 但黄仁勋从头到尾没提 Intel 和 AMD。他只是说”我们在重新发明个人电脑”。不提竞品,不是因为礼貌。是因为一旦把观众注意力引导到”Intel vs NVIDIA”这个框架上,他就从”定义未来的人”降级成了”在现有市场里抢份额的人”。
Nemotron 3 Ultra —— 550B 参数,全球首个 SSM+MoE 混合架构开源模型。5 倍更快,30% 更便宜。开源的不只是模型权重,连数据和训练方法都公开。
这看起来像做慈善。实际是——更多的模型部署 = 更多的推理算力需求 = 更多的 GPU 购买。 NVIDIA 不需要从模型本身赚钱。只要 AI 用量在增长,不管谁家的模型在跑,最终都要找 NVIDIA 买卡。
Cosmos 3 和 Alpamayo 2 —— 物理 AI 世界模型,和首个推理自驾车模型(全球 80% 汽车品牌已承诺采用)。这是在做同一件事:把 AI 的故事从”数据中心”扩展到一切会动的物体。 工厂、机器人、汽车——那些目前还不需要 GPU 的地方,未来需要。
整场演讲看完,产品线铺得极广,但有一条线把每一样东西都串了起来:Agent 时代需要全新的基础设施。从数据中心到 PC,从工厂到汽车。NVIDIA 是那个基础设施。
这不是产品发布。这是在画一张地图,然后告诉所有人:这个世界的路,都是我修的。
二、三句副歌——他是怎么确保你忘不掉的
两小时,十几个产品。正常人的注意力只能记住三样东西。
黄仁勋显然知道这一点。所以他在演讲中埋了三句”副歌”,以不同表述反复出现:
“Token 就是利润单位。”
“Agent 时代已经到来。”
“买得越多,赚得越多。”
这不是金句——金句是用来转发的。这三句是认知缓存,设计目的是让它们在你的长期记忆里占据一个不可替代的位置。
逐一拆:
“Token 就是利润单位。” 这是整场演讲最重要的一步棋。它做了一件非常底层的事——改变了你衡量 AI 价值的单位。
石油时代的单位是”桶”。互联网时代的单位是”点击”和”DAU”。黄仁勋在说:AI 时代的计价单位是 token。而 token 是用 GPU 生产出来的。你接受了”token=利润单位”这个前提,就不得不接受”GPU=利润的生产资料”。计价单位是谁定义的,估值框架就是谁定义的。
“Agent 时代已经到来。” 这句话真正的力道在”已经”两个字。不是”即将”,不是”有望”,是”已经”。它的功能是压缩听众的心理时间线。如果 Agent 时代已经来了,采购决策就不是”先观望一下”——是”现在就得上车”。这句话每重复一次,台下 CIO 的心理预算审批优先级就往上挪一档。
“买得越多,赚得越多。” 前两句建立了认知(新单位、新时代),这一句给出行动指令。而且”买”在”赚”前面。不是你赚了钱再来买我的 GPU,是你先买 GPU,然后你会赚。这句话的逻辑顺序本身就是一套销售闭环。
三句话的功能分工精确到像设计过——因为它们就是设计过的。Transformer 把处理过的 token 存进 KV Cache,下次不再重算。黄仁勋把这三句话存进你的长期记忆,下次想起 AI,它们自动浮现。
三、他没说的——才是这场演讲真正的骨架
前面讲了他选择看什么、说什么、强调什么。
但有一个更深的维度:他那两小时里,刻意不看的东西。
(回避清单见下方)
四、演讲的真正产物
两小时结束,灯光亮起,观众离场。
他们带走的东西,不是一个产品清单。是一个被重新排布过的注意力地图。
在这张地图上,Agent 时代是现在进行时,NVIDIA 是全栈基础设施的定义者,Token 是新经济的计价单位,风险不可见,竞品不存在,质疑不属于这个叙事空间。
黄仁勋做了三十年的 CEO,每一场发布会都在练同一件事:注意力管理。 决定让观众看什么,决定让观众不看什么,决定让观众带走什么——这三个决定,比任何产品参数都更深刻地塑造了 NVIDIA 在人们脑子里的位置。
这件事 AI 花了六年才学会——从 Transformer 的 O(N²) 全量注意,到 Mamba 的选择性机制。核心就一句:少看一点,反而理解得更深。
黄仁勋不是在卖 GPU。他在替整个市场做注意力筛选。你接不接受他的筛选是你的选择——但至少,你得意识到他在筛选。
下一次听一场这个级别的演讲,不管是 Tim Cook 的、Sam Altman 的、还是你公司 CEO 的全员会——在听他说了什么之前,先看他不说什么。演讲的骨架,永远藏在阴影里。
「注意力解码」 是「注意力的进化」的姊妹系列。前者建立认知框架,后者展示如何用它来深度阅读世界。下一篇拆 Benedict Evans 对 AI 价值捕获的分析——为什么模型公司可能赚不到钱。
参考来源:NVIDIA GTC Taipei 2026 Keynote、36氪、Fortune、Yahoo Finance、The Next Web、ChosunBiz 等综合报道
🚫 回避清单
以下是作者选择性省略、回避,或未充分讨论的问题:
- • 没提竞品——AMD、Intel、云厂商自研芯片(Google TPU、Amazon Trainium、Microsoft Maia)一个字没提。一旦开始回应竞争,就等于承认竞争值得回应。
- • 没提自己的客户也是最大的长期威胁——Amazon、Google、Microsoft 既是 NVIDIA 最大的 GPU 买家,也都在拼命做自己的 AI 芯片。
- • 没提估值——NVIDIA 是全球市值最高的公司之一,值不值这个价,黄仁勋一个字没碰。
- • 没提地缘政治——站在台北,台海风险是他供应链最集中的单一故障点。没提。芯片制裁正在重塑全球半导体格局。也没提。
- • 没提能源——AI 数据中心的电力需求正在暴涨,电从哪来?电网撑得住吗?碳排放呢?在他的叙事里,约束不存在,只有增长。
- • 没提 AI 安全——Agent 失控、Deepfake、自主武器化,这些话题在别处激烈辩论,在他这里不存在。唯一碰到的争议话题是'AI 会不会减少岗位',回答是'胡说八道'——但论据只能证明'目前软件开发领域还没出现净裁员',不能推广到整个经济。
🧭 认知导航
你刚刚读的是注意力解码第1期——拆解黄仁勋 GTC 2026 的两小时演讲。核心发现:他的产品线铺得极广,但有一条线串起一切——Agent 时代需要全新的基础设施,NVIDIA 是那个基础设施。这不是产品发布,是画一张地图然后告诉所有人:这个世界的路,都是我修的。更重要的是,他埋了三句'认知缓存'在你脑子里:Token 就是利润单位、Agent 时代已经到来、买得越多赚得越多。这三句的功能分工精确到像设计过——因为它们就是设计过的。