在2025华为全联接大会上,华为副董事长、轮值董事长徐直军公布了昇腾AI芯片未来三年的产品迭代路线图。他表示,2026年一季度发布的新产品将采用华为自研HBM(高带宽内存)。根据规划,2026年至2028年期间,华为将分阶段推出四款昇腾系列芯片:2026年第一季度推出昇腾950PR,该芯片采用华为自研HBM;2026年第四季度推出昇腾950DT;2027年第四季度推出昇腾960芯片;2028年第四季度推出昇腾970。
与英伟达基于通用集成集成电路设计的GPU不同,华为昇腾芯片属于专用集成集成电路架构的NPU(神经网络处理器),专为处理神经网络计算任务设计。从2019年开始,华为已发布多款昇腾910系列芯片,包括910B、910C等产品。今年第一季度最新发布的910C基于华为自研的达芬奇架构,专为云端AI训练和推理使用。昇腾910C算力高达800TFLOPS(以行业衡量AI算力规模的半精度浮点数FP16为标准),支持多种数据格式,互联带宽784GB/s,HBM容量为128GB,内存带宽为3.2TB/s。
相比之下,英伟达最新Blackwell B300在同等标准下的算力约为3840TFLOPS,配备288GB HBM3e,带宽为8TB/s。2026年将要发布的昇腾950PR/DT微架构将升级为SIMD/SIMT,算力达到1PFLOPS(FP8)/ 2PFLOPS(FP4),支持多种数据格式,互联带宽为2TB/s。内存容量及带宽上,昇腾950PR为128GB和1.6TB/s;昇腾950DT为144GB和4TB/s。
徐直军指出,由于美国制裁,华为无法到台积电投片,单颗芯片的算力相比英伟达存在差距。但华为有三十多年的技术积累,并在超节点互联技术上实现突破,能够做到万卡级的超节点,从而提供强大的算力。借助超节点技术,华为走“集群规模化”路线,通过高速总线互联技术将多个CPU、GPU或NPU加速卡连接成一个超大的计算单元,弥补单芯片性能不足,实现算力供给。
此前,华为已经推出了基于昇腾910芯片的超节点产品。今年5月推出的昇腾384超节点将384张昇腾NPU与192张鲲鹏CPU连接在一起,并在7月的世界人工智能大会上展出。在此次全联接大会上,徐直军还公布了华为最新的超节点产品Atlas 950 SuperPoD和Atlas 960 SuperPoD,分别支持8192及15488张昇腾卡。按照他在演讲中展示的对比图,Atlas 950 SuperPoD已超越英伟达将在2027年发布的最大规模超节点NVL576。Atlas 950 SuperPoD预计今年四季度上市,Atlas 960 SuperPoD计划将在2027年四季度上市。
徐直军多次强调算力对人工智能的重要性,尤其是对中国人工智能的发展。华为正在努力打造“超节点+集群”算力解决方案,以满足持续增长的算力需求。
本网通过AI自动登载内容,本文来源于:证券时报网,仅代表原作者观点和立场,本站仅做信息存储供学习交流。