在当前以人工智能和高性能计算为核心驱动力的科技浪潮中,AMD正大胆布局其GPU及系统生态,以期在与英伟达的竞争中实现关键突破。2025年6月,AMD在加州圣何塞举办的Advancing AI 2025大会上,公布了其最新的GPU加速器产品和未来路线图,凸显其在GPU算力、内存技术、系统集成以及网络互联方面的战略规划,进一步拉近与英伟达的差距,甚至在部分领域预示着未来的超越。英伟达早在今年3月的GTC 2025大会发布了开拓至2028年的多元产品路线,包括CPU、GPU、DPU、交换机和整机架解决方案,旨在向全行业展示其持续的性能提升节奏和战略清晰度。作为回应,AMD强调其“Antares+”系列MI350X和MI355X GPU加速器的量产出货,并着重于MI400和MI500系列GPU的研发以及先进网络连通技术,为构建面向未来的AI及HPC集群搭建坚实基础。 据介绍,AMD的MI350系列采用了先进的3纳米工艺制造,配合6纳米的I/O芯片,运用行业领先的3D混合键合技术实现了加速器芯片和I/O芯片的高密度堆叠,这种设计极大增强了芯片之间的带宽互联能力,同时提升能源效率。八个加速器芯片(称为XCD)组成完整的GPU计算核心,每个芯片包含32个计算单元和128个矩阵运算单元,八片芯片总计256个计算单元和1024个矩阵单元。
GPU通过HBM3E高速内存堆栈实现了高达8TB/s的总带宽,整体内置了288GB的高带宽存储。为了弥补部分降低双精度浮点性能带来的影响,MI350X系列引入了针对AI训练和推理优化的FP6、FP4和增强型FP8数据格式,显著提升低精度矩阵计算能力,这对于大型语言模型和神经网络任务尤为关键。相比之前的MI300系列,MI355X在矩阵核心的FP16和FP8精度性能提升近两倍,同时功耗有所增加,达到了1400瓦的热设计功率,并采用液冷系统保障稳定运行。 在系统设计层面,AMD利用Infinity Fabric Advanced Package互联技术,在减少I/O芯片数量的同时,扩大了每条通道的带宽,并降低了信号电压和功耗。MI350系列支持最多八路GPU节点通过高速PCIe 5.0总线和Infinity Fabric 4链路实现协同计算,形成共享内存域,支持复杂的多GPU协同任务。值得一提的是,虽当前MI350X和MI355X所组建的机架中尚未实现跨节点的全共享内存域,但该功能将由计划于2026年发布的MI400系列GPU以及“Helios”机架规模系统提供,进一步推动极大规模AI训练和HPC应用。
MI400(代号“Altair”系列)预计将搭载升级的CDNA 4架构,具备更强的计算能力和内存资源,FP4精度计算峰值能够达到40PF,FP8为20PF,搭载约432GB的HBM4内存,内存带宽提升至约19.6TB/s。AMD宣称,MI400时代的机架系统不仅在GPU插槽记忆域尺寸上实现与英伟达竞争方案的持平,甚至在内存带宽和规模化网络通信能力方面具有至少50%的优势。这些将为构建超大规模、低延迟的AI计算集群奠定坚实基础,满足未来数万亿参数模型的训练需求。 AMD结合收购自定制服务器供应商ZT Systems的工程团队优势,积极整合CPU、GPU、DPU和高性能网络切换设备,力求构建高度统一且优化的集群解决方案。其新一代“UALink”规模化扩展网络与即将推出的Ultra Ethernet超聚合网络技术,将为跨机架、跨节点的GPU内存共享和通信提供突破性的吞吐能力与延迟表现,极大提升集群整体的计算效率和扩展性。 从市场策略角度看,AMD不仅关注硬件性能,更重视产品路线图的可预测性和生态整合,这让合作伙伴和终端客户能够更有信心地投入巨额资金,布局下一代AI项目和高性能计算中心。
AMD计划2027年发布MI500(“Altair+”)系列GPU,与新一代“Verano”Epyc CPU相结合,进一步完善端到端的计算平台,挑战英伟达届时基于“Vera”CV100 CPU和“Rubin”GR100 GPU的“Oberon”系统。在未来三年内,双方将在算力、带宽、能效及整体解决方案的维度继续展开激烈较量,推动行业技术进步与应用创新。 AMD此次的路线图和产品发布,体现了其对未来AI算力需求的深刻理解以及拓展高性能计算边界的决心。从技术细节看,MI350X/355X在能耗控制、芯片面积利用、内存技术应用上的创新,表明AMD已经在关键领域实现赶超或持平局面。3D混合键合堆叠技术和先进制程工艺的结合,使GPU计算核心能够以更紧凑的形态释放更强性能,维持合理热设计指标,增强系统散热与功耗管理灵活性。而从系统层面,融合高带宽内存、智能互连、以及未来向规模化网络演进的架构理念,充分满足了未来AI模型和科学计算对极致性能和可扩展性的双重要求。
综观整个行业,英伟达和AMD作为GPU领域的两大巨头,正通过不断深化技术研发和生态布局,推动人工智能和高性能计算迈入新纪元。AMD紧随英伟达近期的路线图发布,及时调整战略节奏和产品设计,不断扩大产品线丰富度和计算能力,呈现出强烈的市场竞争实力。未来,随着MI400及后续MI500系列产品的问世,并结合更先进的网络系统方案,AMD有望在AI超级计算和企业级数据中心市场实现关键的突破。 此外,AMD的系统整合策略和面向大规模集群的网络创新,也为构建下一代超大规模人工智能模型训练平台提供独特优势。通过支持多GPU统一地址空间、多层高速缓存设计及高密度内存带宽,AMD充分响应当前AI训练对高吞吐、低延迟的苛刻需求。 随着AI应用的持续爆炸,相关计算需求不断升级,投资者、合作伙伴和终端用户都期待看到更多符合成本效益的解决方案。
AMD此次带来的全系列升级与路线图,不仅体现了技术前瞻性,也让其品牌形象焕发出强劲的市场竞争力。未来,围绕GPU的算力演进、内存带宽提升及系统互联技术的竞赛必将加速,持续驱动全球计算产业迈向更高水平。 总结而言,AMD不仅在硬件规格上展现了与英伟达竞争的实力,更通过布局完整的系统架构和网络基础设施为未来的AI和HPC应用场景做好充分准备。其灵活且具扩展性的解决方案,为数据中心和超级计算领域注入了新的活力。随着MI400、MI500及其配套机架系统的陆续发布,AMD有望在未来数年成为AI计算加速赛道上的重要力量,推动全球人工智能技术的发展和应用普及。