图片系 AI 生成
英伟达 CEO 黄仁勋到访中国,所过之处都是焦点,以至于有些原本的重点“ 失焦” 了。
7 月 14 日,英伟达宣布将恢复 H20 在中国的销售,并宣布推出面向中国市场的全新且完全兼容的 GPU。H20 攫取了绝大多数的关注,因其直接与大模型训推相关,且此前被美国市场封禁。
相比之下,黄仁勋推出了一款全新且完全兼容的 NVIDIA RTX PRO GPU,并宣称该产品“ 是为智能工厂和物流打造数字孪生 AI 的理想选择”, RTX PRO 是专业领域产品,用户群相对小众,因此没有得到应有的关注。
但在业内人士看来,其重要性被大大低估了,毕竟值得黄仁勋都亲自带货。据市场消息,该产品可能命名为 RTX PRO 6000 D Blackwell,将于今年三季度启动供应,到年底的出货量目标是 100~200 万片,对应价值约为数十亿到上百亿美元,比英伟达此前因 H20 被禁导致的 45 亿美元资产减值还要多。
这款被 H20 遮住的 RTX Pro,将如何影响市场?
聚焦数字孪生需求,卡位蓝海市场
黄仁勋在接受媒体采访时表示,本周是第三届国际供应链博览会的开幕,供应链涵盖了机器人、智能工厂等复杂系统。我们推出 RTX Pro 正是为这些数字工厂、数字双胞胎、机器人等应用场景量身打造的。RTX Pro 非常适合教机器人如何成为“ 机器人”,教智能工厂如何提高效率和质量。因此,本周的博览会是一个非常合适的时机来宣布这一产品。
他还提到,新的产品 RTX Pro 专为数字孪生应用设计。数字孪生构建的是一个虚拟世界,一个数字机器人。之所以需要数字机器人,是因为要通过在数字世界中训练,教会实体机器人如何出色完成任务。RTX Pro 最初是为运行名为 Omniverse 的全新应用平台所打造,该平台对数字工厂、智能工厂及机器人等领域至关重要。因此 RTX Pro 是独一无二的创新产品,堪称全球首创。
“ 在中国这篇机器人创新如火如荼、智能工厂建设方兴未艾、供应链体系极其完备的热土上,RTX Pro 必将大放异彩。对此我感到无比振奋。” 他说。
正如黄仁勋所言,中国有广阔且完备的制造业,市场前景足够诱人,这是英伟达推出 RTX Pro 的直接原因。
据 IDC 预测,2027 年中国数字孪生市场规模将突破 1200 亿元,年复合增长率达 45%。其中,工业制造 (汽车、电子、新能源) 占比超 60%,仅汽车行业就有超 200 家工厂计划部署英伟达 Omniverse 数字孪生系统,单厂投入从 500 万到 2000 万不等。
51WORLD AI 平台技术总监王忆源对笔者表示,中国制造业正加速向“ 智能工厂” 升级,数字孪生成为核心工具,RTX PRO 特性正好匹配中国制造业升级中的数字孪生 AI 需求,工业制造 (如汽车、航空)、建筑设计 (BIM)、影视渲染等领域对高性能 GPU 的依赖日益增强,尤其在 AI 与 3D 可视化融合的背景下,RTX PRO 系列持续获得稳定采购需求。
在 AI 应用方面,包括 AI 推理、小模型训练、视频生成、数字人、AIGC 等业务,企业对具备通用计算能力的显卡配置关注度显著上升,RTX PRO 系列恰好满足这些多样化、复合型的算力需求。
“ 当然,作为算力消耗者,我们也比较关注它的价格,更准确的说是性价比。在获得面向中国市场的全新 RTX PRO 显卡后,会马上做一手评测,合适的话就可以展开部署,试试这款芯片到底能不能打。”
“ 我们非常关注这款芯片的落地时间。” 王忆源表示,“ 比如实时渲染能力,支持构建高精度工厂虚拟模型 (如生产线、仓储系统),需强大图形算力;轻量 AI 推理:优化能耗、预测设备故障等场景无需顶级训练芯片,RTX PRO 的 GDDR7 显存 (带宽 1.1TB/s) 与定制化 AI 核心正适配此需求。”
阉割版全功能 GPU,但依然是优选
英伟达在今年 3 月的 GTC 2025 大会上,推出了专为工作站和服务器设计的 RTX PRO 系列 Blackwell 专业显卡,但此前该产品同样不被允许出口到中国市场,第三方价格在 8 万元左右。
一位算力产业链人士表示,原计划采购高性能算力卡如 H100 的用户正加速向 NVIDIA RTX 系列转向,进一步推动 RTX PRO 在专业市场的接受度和采购意愿。
新一代 RTX PRO 具备 NVIDIA 流式多处理器、第四代 RT 核心、第五代 Tensor 核心、更大、更快的 GDDR7 显存、第九代 NVIDIA NVENC、第六代 NVIDIA NVDEC、第五代 PCIe、DisplayPort 2.1 等特性,适合于需要处理大量数据、进行高强度计算的专业领域。
黄仁勋也提到,新的 RTX 架构基于 Blackwell,而之前的 RTX 架构基于 Hopper。实际上,我们称它为 Beta Hopper。这款新 GPU 不同于 H20,它有计算图形和光线追踪 (Ray tracing) 功能。光线追踪对于传感器模拟非常重要,比如激光雷达、雷达和计算机图形学。我们可以模拟数字工厂中的传感器,或者自动驾驶汽车中的传感器,或者机器人身上的传感器。
“RTX Pro 具备 H20 和其他 AI 产品所不具备的能力,它是一款同时具备计算图形和 AI 功能的产品,专为数字双胞胎设计。在应用中,我们有名为 Omniverse 的 AI 库,所有操作都在 Omniverse 上运行。” 他说。
RTX Pro 是一款全功能 GPU,既能支持图形也能支持 AI,而 H20 只适合 AI 计算,但是为了规避美国制裁风向,RTX PRO 通过剥离高带宽内存 (HBM)、移除 NVLink 互联技术等敏感模块,严格符合美国出口限制,确保长期对华供应合法性。
数字孪生本身也在朝着 AI 方向发展,王忆源介绍,以 51WORLD 的数字孪生 AI 平台 CLONOVA 为例,核心在于“ 三维仿真场景” 和“ 空间智能大模型” 的结合,因此对芯片有三个方面的需求:
- 图形渲染需求 :构建高保真、物理真实的三维仿真场景,需要芯片支持强大的实时光线追踪能力、高分辨率纹理处理能力和复杂的几何渲染能力。
- AI 计算需求:产品核心为驱动空间智能大模型进行理解、分析、决策和交互,从而需要芯片具有支持海量的并行计算能力。
- 大容量显存需求:三维仿真场景本身就是显存消耗大户,高分辨率的纹理、复杂的模型几何数据 (数百万甚至上亿个多边形)、环境光遮蔽贴图等都需要占用大量显存。大模型更是显存的吞噬者:语言大模型和视觉大模型的参数量动辄几百亿,模型本身就需要占用至少数十 GB 的显存才能运行。
从 RTX PRO 的性能来看,RTX Cores (光线追踪核心) 专为实时光线追踪设计,Tensor Cores (张量核心能以极高的效率执行大模型的训练和推理任务,CUDA Cores (统一计算核心) 提供强大的通用并行计算能力,可以同时处理图形渲染管线中的其他任务 (如物理模拟、后处理) 和 AI 计算中的辅助任务。
此外,RTX PRO 系列显卡提供了远超消费级显卡 (如 GeForce 系列) 的大容量显存。用户可以在同一时间,将复杂的、城市级别的三维场景和参数量巨大的数字孪生 AI 模型同时加载到一块 GPU 显存中。
这避免了因为显存不足而频繁在系统内存和显存之间交换数据,从而保证了交互的流畅性和实时性。没有大显存,要么只能用简化的场景,要么只能用小模型,数字孪生 AI 平台发挥将大打折扣。
竞争对手不及预期,英伟达生态延续强势
黄仁勋透露,中国已有数百个数字孪生项目基于 Omniverse 开发,覆盖汽车工厂、光伏电站等场景。
RTX PRO 作为硬件入口,可深度绑定用户至英伟达生态。此外,中国 150 万 CUDA 开发者中,大量人员已熟悉英伟达工具链。RTX PRO 支持 CUDA 并行计算,能够降低工业 AI 应用开发门槛,延续开发生态黏性。
王忆源认为,RTX Pro 跟其他芯片一样,更大的粘性在于软件生态,包括 CUDA 以及基于 CUDA 的各种深度学习库,Omniverse 协作与仿真平台,以及基于 Omniverse 的 IsaacSim 具身智能仿真平台。
51WORLD 推出了专门面向智能辅助驾驶和机器人的仿真平台 SimOne, 可以作为国内的替代品,不过底层也是基于 D3D/Vulkan 图形 API 和 CUDA,使用的也是 NVIDIA 的显卡。
图片系 AI 生成
如上算力产业链人士提到,从生态壁垒看,AMD 的 ROCm 和 Intel 的 oneAPI 虽然在努力追赶,但在软件的广度、深度、成熟度和开发者社区规模上,与 CUDA 存在差距。绝大多数 AI 框架 (PyTorch, TensorFlow)、科学计算库和专业图形软件 (Adobe, Autodesk 等公司产品) 都是优先为 CUDA 进行深度优化的。这意味着即使竞争对手的硬件在理论峰值性能上接近,其实际应用性能也往往因为软件优化不足而打折扣。
对于开发者和企业来说,选择 RTX PRO 意味着极低的学习成本和迁移成本,以及广泛的软件兼容性和很高的性能确定性。选择竞争对手则可能意味着需要投入大量精力去解决软件兼容性问题、性能优化问题,甚至重写部分代码,这在商业应用中是难以接受的。
他还表示,从竞品的性能看,偏图形学的显卡 (如 AMD Radeon PRO): 在传统的 CAD 设计、视频剪辑、三维建模等领域表现出色。但当用户需要进行 AI 模型训练、AI 功能开发 (如 AI 辅助渲染:深度学习超采样、AI 降噪,生成式内容创作:在图形软件中直接调用 AI 模型,生成纹理、3D 模型、环境背景等) 时,其 AI 生态和硬件性能 (缺少成熟的张量核心) 就显得力不从心,导致效率较低或功能无法实现。
偏 AI 的计算卡 (如一些纯 AI 加速卡,或 NVIDIA 自家的 A100/H100 等): 拥有顶级的 AI 训练和推理性能,但在图形输出和实时渲染方面能力为零或极弱。它们无法直接用于高保真的可视化交互。
对于既有图形渲染能力,又有 AI 训练和推理性能的 RTX PRO 来说,能为数字孪生 AI 提供一个“ 单卡解决方案”。用户可以在同一台工作站、同一个软件环境中,无缝地完成从数据可视化、AI 模型训练/微调,到最终交互式渲染的全流程。这带来的总体拥有成本和工作流效率的优势是巨大的。
在数字孪生领域,国产 AI 芯片的存在感不足,重视程度需进一步提高。只有全功能的 GPU 才能满足数字孪生领域的需求,也淘汰了不少国产芯片玩家。
但国产芯片也在逐渐发力,例如摩尔线程,其全功能 GPU 芯片采用自主研发的 MUSA 架构,实现了单芯片架构同时支持 AI 计算加速、图形渲染、物理仿真和科学计算、超高清视频编解码的技术突破。其 s 专业图形加速产品,主要应用于工业设计、高清视频编辑、数字孪生、AI 云电脑等场景。
一位制造行业高管表示,相较于大模型训推领域,国产芯片都看到并且投入了大量资源,国产芯片在数字孪生领域的存在感较低,RTX PRO 转向工业可视化与轻量 AI 推理,避开国产芯片优势领域,选择数字孪生这一有待开发的蓝海市场,也是英伟达有意为之的战略选择。
就目前来看,英伟达的产品短期内具有不可替代性,它能够最大程度的发挥软件产品在图形渲染上的性能和质量,以及支撑多并发多模态的数据融合驱动的任务。
但他也表示,在产品交付和部署的过程中,相关政策鼓励和支持国产化硬件的替代,部分企业更希望以国产化的显卡、芯片等产品实现数字孪生,但就实际测试效果来看,仍然存在一定性能和质量上的差异。此次 RTX Pro 的“ 特供版” 有望能很好地平衡这个需求。(本文首发于钛媒体 APP,作者 | 张帅,编辑 | 盖虹达)
9 月 11 日-14 日由钛媒体集团、ITValue 联合主办的 2025 ITValue Summit 数字价值年会将以 「AI 落地场景真相」 为主题,与新老朋友重聚三亚,并在全年围绕 1 场年度演讲,5 大 ToB 明星 IP 持续内容“ 造血”,设计 N 个场景的想象空间,打造 1 本 《AI 落地场景指南》,一同寻找 AI 实际落地应用难题背后的“10 大真相”,探索数字经济时代的变革和机遇。(点击进入了解更多大会报名信息)
同期,2025 年度 「创新场景 TOP 50」 榜单评选征集启动,可扫码提交案例。
备注说明:场景案例对应的产品或服务需已实际落地,并具有创新性和示范性。
更多精彩内容,关注钛媒体微信号 (ID:taimeiti),或者下载钛媒体 App