近年来,人工智能技术以惊人的速度发展,推动着计算能力的不断升级。面对日益增长的计算需求,传统的计算架构与互连技术逐渐显露出瓶颈。华为作为全球领先的信息与通信技术供应商,深刻洞察这一趋势,于2025年推出了革命性的SuperPoD互连技术,标志着AI基础设施进入全新的发展阶段。SuperPoD通过融合先进的Ascend系列AI芯片与独有的UnifiedBus互连协议,打造出了具备极高性能和扩展能力的计算超级集群,重新定义了AI计算平台的性能极限。华为在今年的Connect 2025大会上详细介绍了SuperPoD的技术架构和未来发展的详细路线,让业界见证了这一技术革新背后的深厚实力与宏大规划。SuperPoD本质上是由多个物理机器组成的一个单一逻辑机器,能够实现计算资源的高度融合,使得数万甚至数十万颗Ascend芯片协同工作,完成深度学习模型训练和大规模推理任务。
华为最新发布的Atlas 950 SuperPoD搭载了高达8192颗Ascend 950DT芯片,计算性能达到了惊人的8艾佛洛普斯(EFLOPS),在存储容量、互联带宽以及计算效率方面均超越业界竞品。相较于2025年发布的Atlas 900 A3 SuperPoD,该产品实现了17倍的训练性能提升,推理性能更是提升了26.5倍,展现了突破性的技术进步。这样的性能提升不仅源于芯片自身的进化,更依赖于华为在互连技术上持续创新。传统的铜缆和光缆技术在长距离、高带宽和高可靠性方面难以兼得,华为则通过研发基于统一总线协议(UnifiedBus 2.0)的全光互连技术,实现了超过200米的高可靠性光互连,再结合多端口聚合、高密度封装和点对点通信架构,确保了数千颗芯片之间低于2.1微秒的超低延迟和TB级别的互联带宽。这种互联技术不仅满足了大规模SuperPoD的严苛需求,也为未来数万颗芯片的超级集群铺平了道路。华为结合多年积累的互联协议设计经验,打造了适用于复杂计算环境的高可用性协议栈,实现了多层次、高精度的故障检测与快速保护切换机制,从物理层到网络传输层均保证了通信的稳定性与高效性,极大提升了系统整体的运行可靠性。
此外,华为针对AI计算的不同阶段和场景推出了多款针对性强的Ascend芯片,形成了覆盖模型训练、推理前填充、推荐系统乃至低精度高效计算的数据格式支持多样化创新体系。以即将上市的Ascend 950系列为例,此系列不仅支持FP8、MXFP8和华为自主研发的HiF8格式,带来了1P FLOPS的FP8性能,更在内存带宽、互联速率和向量处理能力上实现了质的飞跃。特别值得一提的是,Ascend 950系列区分了注重计算密集型的推荐与预填充场景的950PR芯片和专注于模型训练与推理解码的950DT芯片,结合各自优化的高带宽内存(HiBL1.0及HiZQ 2.0),使得整体AI计算体系更加高效且经济。展望未来,华为还计划陆续发布Ascend 960和970系列芯片,持续提升计算性能和互联带宽,预计2027年和2028年面市的产品将达到分别4PFLOPS和8PFLOPS的FP4算力峰值,带领AI计算走向更高水平。伴随硬件性能的提升,华为同步推动SuperCluster的建设,以Atlas 950 SuperCluster和Atlas 960 SuperCluster为代表,它们由数十个SuperPoD组成,配备超过50万乃至百万颗AI芯片,整体峰值算力分别达到524EFLOPS和2ZEFLOPS。这些超级集群不仅满足了当前2.5亿参数级模型的训练需求,更为未来数万亿参数级的大模型训练打下坚实基础。
值得注意的是,华为的互连协议UnifiedBus与以太网结合形成UBoE,使用户能够在保持既有以太网设备投资的同时,获得更低延迟和更高可靠性的网络体验,这一创新极大简化了超级计算集群的部署难度和运营成本。SuperPoD和SuperCluster的技术优势不仅体现在AI智能计算上,还广泛惠及金融等传统行业的通用计算领域。华为的Kunpeng处理器结合其独特的LinxiCore微架构和四层安全隔离设计,支持网络、存储、处理一体化的超大规模节点,打造面向关键业务的高可用通用超算平台。预计2026年发布的Kunpeng 950芯片以及未来规划中的高性能和高密度版本,都将使得面向财务、电信和制造行业的通用SuperPoD拥有更强的算力和安全性,帮助客户平稳替换主机和中型机等传统设备。作为生态的一部分,华为还重视开放源代码策略 - - 其Ascend CANN编译器以及Mind应用套件、openPangu基础模型等软件工具的全面开源,有望促进整个AI社区的繁荣发展。SuperPoD的技术突破,离不开华为对超大规模系统创新的不断投入,以及对产业生态构建的深刻理解。
通过将芯片、服务器、存储、网络互联以及软件平台有机整合,华为希望打造一个从芯片微架构到云端服务的闭环,进而应对未来AI的爆发式增长需求。综合来看,华为SuperPoD互连技术代表了AI基础设施发展的新方向。它不仅打破了传统计算边界,实现了数万核心的无缝连接,更通过技术革新提升了系统的稳定性、可扩展性与性价比。未来,随着Ascend芯片不断迭代以及UnifiedBus技术的持续演进,华为将在AI的算力赛道中持续领跑,引领全球智能计算进入更高效、更智能的新纪元。在人工智能成为社会各领域驱动力的当下,优化AI基础设施,提升计算能力,已经成为产业发展的焦点。华为的SuperPoD互连方案不仅满足了目前大规模训练的技术需求,也为未来包含AGI在内的多样化AI应用奠定了坚实基础。
随着越来越多行业上云、智能化程度提升,华为的新一代AI超级计算平台必将成为推动数字经济转型升级的核心引擎,催生更广泛的商业价值与社会效益。总之,华为基于SuperPoD架构的创新实践展现了其在AI基础设施领域深厚底蕴和前瞻视野。它既是一种计算技术的跨越,也是一种产业战略的升华。未来,凭借持续的技术积累和生态协同,华为有望带领全球AI基础设施进入一个设施更完善、算力更强大、应用更广泛的新阶段,引领人工智能实现更大价值释放。 。