NFT 和数字艺术

AMD MI350及CDNA 4架构重磅发布,ROCm 7全面助力AI加速新时代

NFT 和数字艺术
AMD MI350 and CDNA 4 Architecture Launched with ROCm 7

AMD正式推出最新的MI350加速器和基于CDNA 4架构的技术创新,结合ROCm 7软件平台,为人工智能领域带来强劲的计算性能和提升的内存带宽,实现更高效的AI训练和推理能力。

随着人工智能和高性能计算的不断发展,硬件加速器的革新成为推动技术进步的关键因素。2025年6月,AMD发布了新一代Instinct MI350加速器以及基于全新CDNA 4架构的创新设计,配合ROCm 7软件平台,为数据中心和AI开发者带来前所未有的性能提升和更便捷的软件体验。AMD此次发布的产品不仅关注硬件层面的高性能和能效,还着重优化了面向AI工作负载的低精度计算能力,进一步巩固了其在AI加速市场的竞争力。 MI350硬件设计采用了模块化芯片组的理念,结合先进的3D堆叠封装技术,采用台积电N3P工艺制程,提升了芯片的能效比和计算密度。MI350集成了8个XCD计算芯片,每个XCD包含32个CDNA 4计算单元,总计256个计算单元,这些计算单元经过结构优化,算力更加强大。相比前代产品,尽管计算单元数量有所减少,但每个单元的性能增进显著,因而整体加速器的计算能力能够达到甚至超过预期。

架构设计上,MI350取消了四个I/O芯片,转而采用两个更大面积的I/O芯片,涵盖更广泛的计算和内存拓扑结构,减少了跨I/O芯片的数据传输开销,极大提升了数据流效率。Infinity Fabric互联技术和全新的Infinity Cache系统则在提升芯片内部带宽和延迟方面发挥了重要作用,使大量数据可以快速在计算单元和内存之间流动,解决了AI计算中因数据等待导致的性能瓶颈。 为了满足现代大型语言模型和深度学习的计算需求,MI350进一步扩展了内存容量和带宽,使得更多数据能在加速器上近距离存储和处理,极大减少了数据传输延迟。此外,MI350还引入了对低位宽数据格式的强化支持,重点发展FP6浮点格式,与FP4浮点格式共同构成了新的计算引擎,针对AI推理中普遍使用的低精度计算进行了深度优化。这种硬件级别的改进不仅提高了计算效率,也显著提升了单位功耗的算力表现。 在软件生态方面,AMD重磅推出ROCm 7平台,旨在为MI350及未来的CDNA 4架构提供强有力的软件支撑。

ROCm 7通过更完善的驱动和库更新,确保开发者可以无缝访问硬件加速功能,同时简化了安装和使用流程。AMD正努力实现ROCm的“一键安装”体验,未来ROCm 7预计将通过pip工具轻松安装,极大降低了开发门槛。 值得一提的是,ROCm 7将开放支持更多操作系统和设备类型。AMD计划在2025年内将ROCm扩展至笔记本电脑,涵盖包括Red Hat EPEL、Ubuntu、OpenSUSE、Fedora等Linux发行版,甚至实现无WSL支持的Windows平台运行。这意味着搭载AMD Ryzen AI MAX+ 395处理器的用户,可以直接在Windows系统上运行ROCm,无需额外配置虚拟层,为AI开发和研究提供了极大便利。 基于MI350加速器的AI性能提升尤为显著。

AMD展示了基于MI355X液冷版本FP8计算性能与NVIDIA B200的对比,结果表明MI355X在低精度算力和内存带宽优势突出,符合现代大规模AI训练的需求。AMD的企业AI战略和AI Developer Cloud平台也同步推出,通过云端资源和软件服务助力客户快速部署和调优AI模型,打造完整的开发生态。 相较于上一代MI300系列更注重FP64高精度计算,CDNA 4架构针对AI领域将重点放在低精度计算优化上,体现AMD对当下人工智能需求的精准把握。无论是大型语言模型的训练效率还是推理时的性能表现,MI350均实现了显著提升,这为数据中心、科研机构和企业在AI计算方面提供了更具性价比的解决方案。 另外,MI350平台采用了OAM UBB(Universal Baseboard)标准8-GPU通用基板形式,为硬件扩展和整合提供高度兼容性。配合空气冷却的MI350X和液冷版本MI355X,用户可根据自身需求灵活选择方案。

液冷版本最高功率可达1.4千瓦,可支持多达128个GPU的规模部署,尽管空间需求较大,但极大提升了超级计算规模,满足了未来AI计算对大规模GPU集群的强烈诉求。 从硬件架构到软件生态,AMD此次发布的MI350和CDNA 4架构展示了公司在AI硬件领域的坚实布局和技术积淀。随着ROCm 7软件平台的不断完善,开发者能够更加便利、高效地发挥MI350硬件潜能,推动从实验室到生产环境的AI应用落地。未来随着更多芯片制造技术和AI优化算法的融合,AMD有望继续引领业内变革,为AI计算时代注入强劲动力。全面提升的算力表现、先进的低精度计算支持、强大的内存性能以及良好的软件生态是MI350和CDNA 4成功的关键,这些优势将加速人工智能研究与应用的广泛普及,为各行业带来深远影响。

加密货币交易所的自动交易 以最优惠的价格买卖您的加密货币 Privatejetfinder.com

下一步
Torch Backends
2025年09月01号 04点04分40秒 深入解析PyTorch后端技术:加速与优化现代深度学习模型的关键

探索PyTorch后端的多样化支持及其如何通过多种硬件加速和算法优化,提升深度学习模型的性能和效率,助力AI领域的创新发展。

Breathing Pattern Is as Unique as a Fingerprint, Study Finds
2025年09月01号 04点05分34秒 呼吸模式独一无二,如同指纹般个性化的科学发现

全新研究揭示每个人的呼吸模式具有独特性,能够通过鼻息方式识别个体,且与身体质量指数、心理健康等多方面特征相关联,未来或将引领疾病诊断和治疗的新途径。

 Tencent explores purchase of Nexon gaming company
2025年09月01号 04点07分46秒 腾讯探索收购Nexon:游戏行业的新浪潮与未来趋势

腾讯正在积极探索收购韩国知名游戏开发商Nexon,凸显出全球游戏产业在区块链与Web3技术推动下的变革趋势,为未来数字娱乐生态系统带来深远影响。

Shaquille O’Neal Shells Out $1.8M in First Celebrity FTX Settlement
2025年09月01号 04点08分45秒 沙奎尔·奥尼尔支付180万美元,成为首位解决FTX名人诉讼的明星

随着FTX交易所的崩溃引发一系列法律纠纷,前篮球巨星沙奎尔·奥尼尔成为首位通过支付180万美元和解的名人。这一进展不仅为FTX相关诉讼带来重要突破,也揭示了加密货币名人代言背后的法律风险和责任。以下内容深入剖析奥尼尔和FTX案件的来龙去脉,探讨该事件对行业和公众信任的影响。

‘Boring’ data work underpins innovation, strategy, Payoneer CFO says
2025年09月01号 04点12分10秒 Payoneer财务总监揭秘:枯燥的数据工作如何推动创新与战略发展

随着企业数字化转型的加速,财务总监的角色不断拓展,数据管理成为企业战略和创新的核心。Payoneer首席财务官Bea Ordonez阐述了‘枯燥’数据工作在促进公司运营效率和推动业务创新中的关键作用,展现了现代财务领导者如何通过深度数据洞察驱动企业可持续发展。

Tron ($TRX) Primed for Lift-Off After Range Breakout—Bullish Channel Points to $0.30
2025年09月01号 04点13分12秒 Tron($TRX)突破整理区间,多头通道指向0.30美元新高

随着稳定币市场的蓬勃发展和技术指标的利好信号,Tron($TRX)正处于关键突破阶段,成为加密货币市场值得关注的焦点。多重利好因素共振,$TRX有望迈向0.30美元,甚至突破历史新高。

Elizabeth Warren, Jeff Merkley Press Binance, UAE Firm Over $2B Deal Involving Trump Family Stablecoin
2025年09月01号 04点14分06秒 伊丽莎白·沃伦与杰夫·默克利联手施压币安及阿联酋公司,聚焦特朗普家族价值20亿美元的稳定币交易

本文深入探讨美国参议员伊丽莎白·沃伦和杰夫·默克利针对加密货币巨头币安以及阿联酋公司之间涉及特朗普家族的20亿美元稳定币交易展开的政治和监管压力,剖析事件背后的多重影响及加密货币领域的新兴风险。