
英伟达近日发布了其首款基于ARM架构的超级芯片GB10 Grace Blackwell,这一消息在科技圈引起了广泛关注。这款芯片的出现,不仅在性能上展现了强大的实力,更在架构上实现了创新性突破。
GB10芯片是黄仁勋亲自站台、联发科深度参与研发的成果,其Cortex-X925核心的主频高达3.9GHz,突破了传统的ARM处理器频率限制。借助这一突破性异构计算架构,GB10在Geekbench测试中展现出了惊人的成绩,单核性能已能与高端ARM和x86处理器一较高下。
在硬件配置方面,GB10采用了台积电最新的3nm工艺,集成了20个ARMv9.2架构核心。其中,10个Cortex-X925超大核心的主频达到了惊人的3.9GHz,创下了ARM处理器商用频率的新纪录。这一设计突破得益于Arm最新终端计算子系统(CSS)的赋能,使得Cortex-X925单线程性能较前代提升36%,AI推理性能59%。
更为值得关注的是,GB10还采用了NVLink-C2C互连技术,其带宽是PCIe 5.0的五倍,成功构建了CPU+GPU的统一内存模型。在实际测试中,GB10的内存系统表现优异,使得大模型推理延迟降低了40%,打破了传统GPU的内存墙限制。
在软件方面,英伟达同步推出的DGX Spark平台,通过CUDA-X AI库与Arm Kleidi软件的深度整合,实现了从桌面到云端的无缝衔接。这一创新不仅为开发者带来了便利,更为AI开发范式的重构提供了可能。
GB10的发布不仅代表了芯片技术的突破,更预示着AI开发范式的革新。市场反应热烈,Project DIGITS预售首日即获超2万订单,华硕GX10的预订量更是突破5万台。GB10的影响深远,它证明了ARM架构完全可以承载万亿参数模型训练,或将数据中心CPU市场的格局。
在架构创新方面,GB10的选择是用架构创新替代制程竞赛。其20核设计包括10个Cortex-A725能效核,在轻负载场景下的功耗表现优异。GB10内置的ConnectX-7网卡支持Wi-Fi 7与蓝牙5.3,预示着AI超算与通信基带的融合趋势。
GB10的发布引发了算力,展现了英伟达在AI领域的战略转型。当数据中心算力增长趋缓时,将超算能力下沉至桌面端或许将成为新的增长极。这场由GB10引发的算力,或许只是序幕刚刚拉开。
