类别
NFT 和数字艺术元宇宙与虚拟现实加密交易所新闻加密初创公司与风险投资加密市场分析加密活动与会议加密税务与合规加密货币的机构采用加密钱包与支付解决方案加密骗局与安全	区块链技术去中心化金融 (DeFi) 新闻山寨币更新投资策略与投资组合管理挖矿与质押比特币监管和法律更新稳定币与中央银行数字货币行业领袖访谈首次代币发行 (ICO) 和代币销售

页面
主页关于条款	搜索

跟着我们

类别
NFT 和数字艺术元宇宙与虚拟现实加密交易所新闻加密初创公司与风险投资加密市场分析加密活动与会议加密税务与合规加密货币的机构采用加密钱包与支付解决方案加密骗局与安全	区块链技术去中心化金融 (DeFi) 新闻山寨币更新投资策略与投资组合管理挖矿与质押比特币监管和法律更新稳定币与中央银行数字货币行业领袖访谈首次代币发行 (ICO) 和代币销售

页面
主页关于条款	搜索

跟着我们

类别
NFT 和数字艺术元宇宙与虚拟现实加密交易所新闻加密初创公司与风险投资加密市场分析加密活动与会议	加密税务与合规加密货币的机构采用加密钱包与支付解决方案加密骗局与安全区块链技术去中心化金融 (DeFi) 新闻	山寨币更新投资策略与投资组合管理挖矿与质押比特币监管和法律更新稳定币与中央银行数字货币	行业领袖访谈首次代币发行 (ICO) 和代币销售

页面
主页关于条款	搜索

跟着我们

类别
NFT 和数字艺术元宇宙与虚拟现实加密交易所新闻加密初创公司与风险投资加密市场分析加密活动与会议	加密税务与合规加密货币的机构采用加密钱包与支付解决方案加密骗局与安全区块链技术去中心化金融 (DeFi) 新闻	山寨币更新投资策略与投资组合管理挖矿与质押比特币监管和法律更新稳定币与中央银行数字货币	行业领袖访谈首次代币发行 (ICO) 和代币销售

页面
主页关于条款	搜索

跟着我们

2025年09月01号 22点23分11秒

从MI350到MI500：AMD引领未来人工智能加速器的发展蓝图

区块链技术投资策略与投资组合管理

钱财 qian.cx

From MI350 to MI500: AMD's Bold AI Accelerator Roadmap Through 2027

详细解析AMD从MI350系列到MI500系列的人工智能加速器发展路线，涵盖架构升级、芯片技术、网络解决方案及未来创新规划，展望2027年及以后AI计算的革命性进展。

在人工智能技术高速发展的浪潮中，硬件的性能和效率成为推动AI算力提升的关键因素。作为全球领先的半导体厂商，AMD不断通过创新的GPU加速器和系统级解决方案推动AI计算的边界。2025年，AMD在其“Advancing AI”活动中正式揭开了Instinct MI350系列的面纱，展示了基于新一代CDNA4架构的强大AI计算能力，同时公布了未来包括MI400和MI500系列在内的野心勃勃的AI加速器路线图，为AI硬件领域带来前所未有的期待。AMD此举不仅体现出其对AI市场的坚定承诺，也彰显了其在芯片设计、系统集成和网络架构方面的全方位创新。AMD Instinct MI350的发布标志着该公司在AI计算领域实现了重大飞跃。MI350采用了升级版CDNA4架构，针对AI工作负载进行了深度优化，不仅在矩阵运算能力上有大幅提升，还支持多种新的数据格式，包括FP6和FP4等微型精度格式。

这些格式能够在保持计算速度的同时显著降低能耗，极大地契合了现代AI训练和推理对低精度高效率计算的需求。同时，MI350通过先进的硬件支持技术如随机舍入减少了数值偏差，改善了模型训练的稳定性。MI350的硬件设计基础在于AMD进阶的3D芯片模块封装技术，将八个加速计算芯片模块（XCD）与两个I/O芯片（IOD）通过3D混合键合紧密集成在一起。与前一代MI300相比，生产工艺由5纳米升级至更先进的3纳米Node 3+工艺，大幅提高了能效比。物理封装采用了芯片上晶圆上基板（COOS）互联技术，令芯片之间的带宽和延迟表现超过传统2.5D封装。内存子系统方面，MI350配备了八组总容量高达288GB的HBM3E高速显存，每个36GB叠层均支持8Gbps的高频率运行。

另外，AMD持续强化其专有的Infinity Cache缓存体系，达256MB容量，作为显存与计算核心之间的高速缓冲。Infinity Fabric互联则实现了XCD间及GPU多卡间数据的无缝共享，支持单卡内最大5.5TB/s的内部带宽和支持多卡跨节点的38.4Gbps外部连接，体现出其面向大规模分布式AI训练的设计思路。计算单元（CU）的重构是MI350性能提升的核心。每个CU的16位和8位浮点及整数计算能力提升至2倍，尤其对AI常用的混合精度计算有显著优化。新增对FP6与FP4格式的硬件支持表现出AMD对行业未来精度标准的前瞻性布局。与此同时，新加入的矢量算术逻辑单元支持2位计算并能将BF16累积至FP32，进一步提升低位宽运算效率。

此外，MI350加强了LDS（本地数据共享存储）容量、优化了数据加载带宽并提升了软max及Attention等函数的处理能力，从而适配最新AI模型的复杂特性。AMD还赋予GPU更多的可分区计算灵活度，允许通过多种NUMA模式（如NPS1和NPS2）定义显存访问域和物理布局，辅以多重计算分区能力，以满足虚拟化、多租户及多任务并发需求。MI350系列推出了两个版本，分别面向不同功耗和散热环境：MI350X侧重于低功耗、支持空气冷却，适配现有多数数据中心环境；MI355X则针对液冷系统，提供高达1.4千瓦的功率预算，能够输出约20%的性能提升，满足极端AI训练负载。除了GPU核心创新，AMD此次还展示了其基于Pensando架构的Pollara 400 AI网卡。该网卡可由P4程序动态控制，适应快速变化的网络协议和流量管理需求。通过支持GPU间多路径多播技术，极大缓解了通信瓶颈，提升集群内通信效率。

Pollara网卡还引入了精华的选择性确认机制和路径感知拥塞控制，降低包重传开销和对完美网络的依赖，这对于大规模、分布式AI工作负载尤为关键。更值得一提的是，AMD积极参与Ultra Ethernet联盟，助力制定专为AI优化的开放以太网标准，涵盖负载均衡、可靠性和拥塞控制，推动AI硬件生态的标准化与互操作性。软件层面，AMD发布了ROCm 7平台，显著提升AI推理和训练性能，预示开源生态持续繁荣。企业级客户可利用ROCm AI Enterprise套件进行大规模集群管理和MLOps，同时AMD提供开发者云与免费GPU积分，鼓励跨平台、多设备的AI软件开发创新。展望未来，AMD计划于2026年推出MI400系列，核心构件为集成化的Helios机架系统。Helios将结合下一代Venice EPYC CPU、MI400 GPU和更强大的Vulcano 800G AI网卡，打造极致规模AI训练平台。

该系统预计提供高达40 PetaFLOPS的FP4性能和20 PetaFLOPS的FP8性能，配备432GB HBM和20TB/s带宽，支持高效的分布式AI任务。网络互联方面，Vulcano网卡的UAL 1.0超加速链接带宽是PCIe Gen6的两倍，提升跨节点数据交换的效率。Helios寄望在2026年能达到相较目前主流解决方案多达十倍的AI性能提升。根据 AMD 路线图，2027 年及以后，MI500 系列将进一步引入更先进的架构特性以及更高速的芯片与网络技术，这些升级与未来代EPYC CPU（代号Verano）以及Pensando网络的深度协同，将继续支撑AI计算的激进扩展。目前，具体细节尚未完全公开，但AMD明确表示将持续通过统一平台的软硬件协作推动AI计算能效、灵活性与性能极限。AMD从MI300到MI350，再到未来的MI400和MI500系列，体现了其在大规模AI加速器领域的战略布局和领先技术实力。

通过芯片架构进化、先进封装技术、灵活计算分区、完善的网络生态以及强大的软件支持，AMD打造了一个面向未来的端到端AI计算解决方案。随着AI模型规模和计算复杂度的不断攀升，AMD的这些创新无疑将为全球数据中心和超级计算设施提供坚实的算力基石，助力科研、工业和智能应用迈向新高度。

下一步

Ether Plunges 7% as Traders Flee to Dollar and Gold After Israel Strikes Iran

2025年09月01号 22点24分13秒以色列空袭伊朗引发以太币暴跌七成交易者涌向美元与黄金避险

近期，以色列对伊朗发动军事打击引发国际局势紧张，全球投资者纷纷转向美元和黄金等传统避险资产，导致以太币价格急剧下跌。本篇文章深入解析地缘政治风险对加密货币市场的影响、投资者心理变化以及未来可能的市场走势。

Tencent Is Looking to Buy Nexon, the Creator of Web 3 Gaming Franchise MapleStory

2025年09月01号 22点25分06秒腾讯拟收购韩国游戏巨头Nexon，抢占Web3游戏未来高地

腾讯计划收购韩国知名游戏开发商Nexon，通过掌控《MapleStory》等热门IP，进一步扩大其在全球游戏市场尤其是韩国市场的影响力，同时加速其在区块链与Web3游戏领域的战略布局。

Darknet Marketplace Huione Reportedly Still Active Despite Website and Telegram Shutdown

2025年09月01号 22点26分05秒暗网市场Huione：网站和Telegram关闭后依然活跃的背后

深入探讨暗网市场Huione在网站和Telegram频道关闭后，如何通过复杂的洗钱网络和多渠道运营依然保持强劲活力及其对全球加密货币监管的启示。

Lululemon Athletica Stock (LULU) Plunges 23% as Tariff Pressures Eclipse Earnings Beat

2025年09月01号 22点27分13秒关税压力掩盖盈利增长劳伦蒙体育服饰股价暴跌23%深度解析

劳伦蒙体育服饰（Lululemon Athletica）近期发布的季度财报显示出强劲的盈利表现，但与此同时，关税压力和市场挑战对其股价造成了显著影响，引发投资者担忧。本文深入剖析了相关财务数据、关税影响、市场竞争及未来发展趋势，帮助读者全面了解这一热门运动品牌的最新动态及投资前景。

The Impact of Arbitrum Stylus Introduction

2025年09月01号 22点28分03秒解析Arbitrum Stylus：推动区块链开发新时代的革新力量

探讨Arbitrum Stylus如何通过引入WebAssembly语言支持，显著提升Arbitrum Layer 2网络的智能合约性能与开发者体验，推动去中心化应用的创新与生态扩展。

Geopolitical Risk Premium Not yet Priced Into Oil Markets

2025年09月01号 22点29分06秒地缘政治风险溢价为何尚未反映在油市价格中？深度解析2025年油市动态

本文深入探讨了当前地缘政治风险溢价在国际油市中尚未被有效定价的现象，结合中东局势、中美关系紧张等因素，分析其对油价走势的潜在影响及未来可能出现的市场变化。

Show HN: My [sci-fi] book, free forever to listen/download

2025年09月01号 22点30分01秒探索史前文明与人类进化的科幻杰作《星辰观察者》免费聆听与下载体验

结合史前考古学与人类文明演进的创新科幻小说《星辰观察者》现已免费开放听书与下载，带领读者穿越时光，深入探索古人类智慧与社会结构的可能性。