Skip to content

WT快讯

WeTrying | 币圈快讯早知道

Menu
  • 首页
  • 工具包
Menu

黄仁勋 CES2026 最新演讲:三个关键话题,一台“芯片怪兽”

Posted on 2026-01-06 09:53

作者:李海伦 苏扬北京时间 1月 6 日,英伟达 CEO 黄仁勋身着标志性皮衣再次站在 CES2026 的主舞台上。2025年 CES,英伟达展示了量产的 Blackwell 芯片和完整的物理 AI 技术栈。在会上,黄仁勋强调,一个“物理 AI 时代”正在开启。他描绘了一个充满想象力的未来:自动驾驶汽车具备推理能力,机器人能够理解并思考,AIAgent(智能体)可以处理百万级 token 的长上下文任务。转眼一年过去,AI 行业经历了巨大的变革演进。黄仁勋在发布会上回顾这一年的变化时,重点提到了开源模型。他说,像 DeepSeek R1 这样的开源推理模型,让整个行业意识到:当开放、全球协作真正启动后,AI 的扩散速度会极快。尽管开源模型在整体能力上仍比最前沿模型慢大约半年,但每隔六个月就会追近一次,而且下载量和使用量已经呈爆发式增长。01 从路线图到量产:Rubin 首次完整披露性能数据在本次 CES 上,英伟达首次完整披露了 Rubin 架构的技术细节。演讲中,黄仁勋从 Test-time Scaling(推理时扩展)开始铺垫,这个概念可以理解为,想要 AI 变聪明,不再只是让它“多努力读书”,而是靠“遇到问题时多想一会儿”。过去,AI 能力的提升主要靠训练阶段砸更多算力,把模型越做越大;而现在,新的变化是哪怕模型不再继续变大,只要在每次使用时给它多一点时间和算力去思考,结果也能明显变好。如何让“AI 多思考一会儿”变得经济可行?Rubin 架构的新一代 AI 计算平台就是来解决这个问题。黄仁勋介绍,这是一套完整的下一代 AI 计算系统,通过 Vera CPU、Rubin GPU、NVLink 6、ConnectX-9、BlueField-4、Spectrum-6 的协同设计,以此实现推理成本的革命性下降。整体来看,相比 Blackwell,Rubin GPU 在关键指标上实现跨代跃升:NVFP4 推理性能提升至 50 PFLOPS(5 倍)、训练性能提升至 35 PFLOPS(3.5 倍),HBM4 内存带宽提升至 22 TB/s(2.8 倍),单 GPU 的 NVLink 互连带宽翻倍至 3.6 TB/s。这些提升共同作用,使单个 GPU 能处理更多推理任务与更长上下文,从根本上减少对 GPU 数量的依赖。相比上一代架构,英伟达也给出具体直观的数据:相比 NVIDIA Blackwell 平台,可将推理阶段的 token 成本最高降低 10 倍,并将训练混合专家模型(MoE)所需的 GPU 数量减少至原来的 1/4。英伟达官方表示,目前微软已承诺在下一代 Fairwater AI 超级工厂中部署数十万 Vera Rubin 芯片,CoreWeave 等云服务商将在 2026 年下半年提供 Rubin 实例,这套“让 AI 多想一会儿”的基础设施正在从技术演示走向规模化商用。03新一代 DGX SuperPOD :让 576个 GPU 协同工作英伟达在本次 CES 上宣布推出基于 Rubin 架构的新一代 DGX SuperPOD(超节点),将 Rubin 从单机架扩展到整个数据中心的完整方案。什么是 DGX SuperPOD?如果说 Rubin NVL72 是一个装有 72个 GPU 的“超级机架”,那么 DGX SuperPOD 就是把多个这样的机架连接起来,形成一个更大规模的 AI 计算集群。这次发布的版本由 8个 Vera Rubin NVL72 机架组成,相当于 576个 GPU 协同工作。当 AI 任务规模继续扩大时,单个机架的 576个 GPU 可能还不够。比如训练超大规模模型、同时服务数千个 Agentic AI 智能体、或者处理需要数百万 token 上下文的复杂任务。这时就需要多个机架协同工作,而 DGX SuperPOD 就是为这种场景设计的标准化方案。对于企业和云服务商来说,DGX SuperPOD 提供的是一个“开箱即用”的大规模 AI 基础设施方案。不需要自己研究如何把数百个 GPU 连接起来、如何配置网络、如何管理存储等问题。新一代 DGX SuperPOD 五大核心组件:○8个 Vera Rubin NVL72 机架 – 提供计算能力的核心,每个机架 72个 GPU,总共 576个 GPU;○NVLink 6 扩展网络 – 让这 8 个机架内的 576个 GPU 能像一个超大 GPU 一样协同工作;○Spectrum-X 以太网扩展网络 – 连接不同的 SuperPOD,以及连接到存储和外部网络;○推理上下文内存存储平台 – 为长时间推理任务提供共享的上下文数据存储;○英伟达 Mission Control 软件 – 管理整个系统的调度、监控和优化。这一次的升级,SuperPOD 的基础以 DGX Vera Rubin NVL72 机架级系统为核心。每一台 NVL72 本身就是一台完整的 AI 超级计算机,内部通过 NVLink 6 将72块 Rubin GPU 连接在一起,能够在一个机架内完成大规模推理和训练任务。新的 DGX SuperPOD,则由多台 NVL72 组成,形成一个可以长期运行的系统级集群。当计算规模从“单机架”扩展到“多机架”后,新的瓶颈随之出现:如何在机架之间稳定、高效地传输海量数据。围绕这一问题,英伟达在本次 CES 上同步发布了基于 Spectrum-6 芯片的新一代以太网交换机,并首次引入“共封装光学”(CPO)技术。简单来看,就是将原本可插拔的光模块直接封装在交换芯片旁边,把信号传输距离从几米缩短到几毫米,从而显著降低功耗和延迟,也提升了系统整体的稳定性。黄仁勋在 CES 上声称,物理 AI 的“ChatGPT 时刻”快要来了,但面对挑战也很多:物理世界太复杂多变,采集真实数据又慢又贵,永远不够用。怎么办呢?合成数据是条路。于是英伟达推出了 Cosmos。这是一个开源的物理 AI 世界基础模型,目前已经用海量视频、真实驾驶与机器人数据,以及 3D 模拟做过预训练。它能理解世界是怎么运行的,可以把语言、图像、3D 和动作联系起来。黄仁勋表示,Cosmos 能实现不少物理 AI 技能,比如生成内容、做推理、预测轨迹(哪怕只给它一张图)。它可以依据 3D 场景生成逼真的视频,根据驾驶数据生成符合物理规律的运动,还能从模拟器、多摄像头画面或文字描述生成全景视频。就连罕见场景,也能还原出来。在发布会现场,黄仁勋背后站满了不同形态、不同用途的机器人,它们被集中展示在分层舞台上:从人形机器人、双足与轮式服务机器人,到工业机械臂、工程机械、无人机与手术辅助设备,展现出一版“机器人生态图景”。从物理 AI 应用到 RubinAI 计算平台,再到推理上下文内存存储平台和开源 AI“全家桶”。英伟达在 CES 上展示的这些动作,构成了英伟达对于推理时代 AI 基础设施的叙事。正如黄仁勋反复强调的那样,当物理 AI 需要持续思考、长期运行,并真正进入现实世界,问题已经不再只是算力够不够,而是谁能把整套系统真正搭起来。CES 2026 上,英伟达已经给出了一份答卷。

相关

近期文章

  • Coinbase将 RAY、ENERGY、ELSA和 FUN 列入上币路线图
  • 美国 11月 JOLTs 职位空缺 714.6 万人,预期 760 万人
  • 某交易者投入 236 万美元分别买入 660枚 BTC 12 万看涨与 8 万看跌期权
  • 加密股涨跌不一,MSTR 涨 5.97%
  • 某地址加仓做多 BTC,目前浮亏约 198.2 万美元

归档

  • 2026 年 1 月
  • 2025 年 12 月
  • 2025 年 11 月
  • 2025 年 10 月
  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月

分类

  • 1kx (1)
  • 21Shares (1)
  • a16z (1)
  • Aave (3)
  • ai16z (1)
  • Alameda Research (1)
  • Alpaca (1)
  • Arbitrum (1)
  • Ark Invest (1)
  • Arkham (1)
  • Avail (1)
  • Azuki (1)
  • Base (1)
  • Berachain (1)
  • Bitget (8)
  • BlackRock (3)
  • Brian Armstrong (1)
  • BTC (4)
  • Bybit (2)
  • Canary (1)
  • Cathie Wood (1)
  • Coinbase (3)
  • Coinbase Prime (2)
  • Coinbase Ventures (3)
  • CoinDesk (2)
  • CoinGecko (1)
  • Cointelegraph (1)
  • COMP (1)
  • Compound (1)
  • DAO (1)
  • DATA (2)
  • DeAI (1)
  • DePIN (1)
  • DEX (3)
  • EARN (1)
  • Eliza (1)
  • ETF (4)
  • ETH (4)
  • Ethos Network (1)
  • Fartcoin (2)
  • FDUSD (1)
  • FLock.io (1)
  • FLUID (1)
  • FUEL (1)
  • Gas (2)
  • GPU (1)
  • Grayscale (1)
  • IEO (1)
  • Inception (1)
  • IOG (1)
  • Jupiter (1)
  • Kairos (1)
  • Kaito (1)
  • Launchpool (1)
  • Layer2 (1)
  • Liquidity (1)
  • Magicblock (1)
  • Mango Markets (1)
  • Mechanism Capital (1)
  • Meebits (1)
  • Meme (3)
  • Netflix (1)
  • NVIDIA (1)
  • Ondo (1)
  • OpenAI (2)
  • Paradigm (1)
  • Polygon (3)
  • Pudgy Penguins (1)
  • pump.fun (1)
  • Raydium (2)
  • Robert Leshner (1)
  • Robinhood (1)
  • Sam Altman (1)
  • SEC (4)
  • Securitize (1)
  • SideKick (1)
  • SNX (1)
  • SOL (1)
  • Solana (3)
  • Stani Kulechov (1)
  • StarkWare (1)
  • STO (1)
  • Stripe (1)
  • SunDog (1)
  • SunPump (1)
  • Synthetix (1)
  • TechFlow (31,356)
  • The Block (2)
  • Tron (2)
  • TRX (1)
  • Upbit (1)
  • USDC (3)
  • WBTC (2)
  • Web3 (4)
  • WLD (1)
  • WOO X (1)
  • Xai (1)
  • Zora (1)
  • 交易所动态 (8)
  • 人工智能 (1)
  • 以太坊 (4)
  • 以太坊基金会 (1)
  • 信托 (1)
  • 借贷 (2)
  • 公链 (1)
  • 基础设施 (1)
  • 大额投融资 (1)
  • 存储 (2)
  • 孙宇晨 (2)
  • 安全 (2)
  • 富达 (1)
  • 工具 (2)
  • 币安 (7)
  • 快讯 (32,499)
  • 托管 (1)
  • 指数 (1)
  • 支付 (1)
  • 数据 (6)
  • 数据追踪 (4)
  • 智能合约 (1)
  • 未分类 (311)
  • 模块化 (1)
  • 欧洲 (1)
  • 欧盟 (1)
  • 比特币 (7)
  • 永续合约 (1)
  • 治理 (1)
  • 波场 (1)
  • 游戏 (3)
  • 火币 (1)
  • 灰度 (1)
  • 特朗普 (5)
  • 社交 (2)
  • 稳定币 (3)
  • 空投 (6)
  • 纳斯达克 (1)
  • 美国 (6)
  • 美国证券交易委员会 (3)
  • 英伟达 (2)
  • 英国 (1)
  • 萨尔瓦多 (1)
  • 融资 (3)
  • 行情异动 (7)
  • 贝莱德 (1)
  • 质押 (4)
  • 赵长鹏 (1)
  • 跨链 (3)
  • 跨链桥 (1)
  • 迪拜 (1)
  • 重要消息 (45)
  • 金库 (1)
  • 钱包 (4)
  • 阿根廷 (1)
  • 阿里云 (1)
  • 隐私 (2)
  • 项目重要进展 (9)
  • Bluesky
  • Mail
©2026 WT快讯 | Design: Newspaperly WordPress Theme