随着人工智能和科学计算的不断融合,传统计算架构面临越来越多的挑战,特别是在处理大规模数据集和复杂模拟时,内存容量和效率成为制约科研发展的重要瓶颈。位于美国华盛顿州的太平洋西北国家实验室(PNNL)携手存储巨头Micron,共同开发出了一款革命性的主动内存计算机系统 - - Crete。该系统凭借其创新的内存技术和硬件软件协同设计,开创了科学计算和AI应用的新纪元。 Crete系统于2025年8月正式投入使用,是一个专为人工智能科学应用量身打造的原型计算平台。与传统高性能计算(HPC)系统不同,Crete采用了一种独特的内存-处理器共置架构,实现了高达15TB的主动内存容量,这在目前的DOE实验室乃至整个高性能计算领域内都属罕见。如此庞大的内存容量相当于240台配备64GB内存的高端笔记本电脑同时在线、实时交流的规模,为处理大规模科学数据和复杂AI算法提供了坚实保障。
Crete的设计核心基于Compute Express Link(CXL)这一开放行业标准,通过由XConn Technologies开发的I/O交换机,将内存与处理器通过高速通道高效连接。相较于传统架构将内存紧密绑定于处理器,Crete结合了紧耦合内存(由Micron Registered Dual In-line Memory Module支持)和松耦合内存(通过定制的Micron CXL控制器板实现),为数据驱动的科学计算带来了前所未有的灵活性和性能。 这一混合内存架构不仅支持大容量的随机访问,还提升了系统带宽和内存共享能力,极大缓解了因内存不足引发的数据瓶颈。AI科学应用尤其受益于这一优势,如分子建模、生成式AI分析科学数据以及大规模数据库处理等领域,将能实现实时信息交换、预测生成和实验结果动态分析,有效推动科学发现过程。 这个系统的出现还表达了科研界对下一代AI驱动研究架构的期望。Micron的高级技术与战略团队高级研究员Mark Helm指出,未来AI研发离不开突破内存限制的新型架构,Crete正是驱动这一变革的典范。
联合开发的Crete平台,不仅是技术的创新,更是赋能科学家探索未知、解决重大科学问题的新工具。 Crete对科研界开放使用,特别是面向获得DOE资助的其他国家实验室和学术机构的研究人员。通过Advanced Memory to Support Artificial Intelligence for Science(AMAIS)项目,用户可以申请访问这一独特的测试平台。该项目不仅限于硬件投入,同时涵盖软件生态和安全防护,在保障系统安全的前提下推动科研创新。 PNNL计算科学家Andrés Márquez强调,Crete设计中融合了针对内存系统安全的多重防御机制,有效应对潜在的网络攻击和安全漏洞。内存历来是计算安全的薄弱环节,PNNL团队从系统设计初期就重视这一点,为科研工作提供坚实保障。
此外,Crete系统也为未来预备了通往百亿亿次级超算的桥梁。PNNL首席计算科学家James Ang介绍,Crete正在帮助研究人员针对未来DOE用户设施投入使用的旗舰超算打造必要工具,保证科研计算基础设施的持续进化和适配下一代复杂工作负载。 在应用层面,Crete已开始为化学领域的AI集成应用提供支持。科研团队与Micron密切合作,实现了利用CXL内存技术运行的先进计算化学软件ExaChem。这一成果得到DOE Accelerate计划中TEC4项目的资助,促使高效能化学模拟得以借助云计算和新兴硬件技术提升。 Crete系统不仅仅是硬件的跃进,更得益于PNNL多年来在软件定义架构和专用硬件加速器领域的基础积累。
这一底层灵活的开源工具链为机器学习和AI任务提供了定制化支持,助力科学家将理论算法转化为高效实践。 展望未来,随着人工智能算法的不断进化,数据密集型科学研究对内存容量和共享性能的需求将持续增长。Crete以其独特的架构优势,为科学领域打开了新视野,特别是在多学科交叉研究如分子生物学、新材料开发和环境科学等方面,具备极大潜力。 总而言之,Crete计算系统标志着科学计算架构迈上了一个新台阶。它通过积极创新内存技术与硬件协同,打造了一个供AI科学应用发挥最大效能的强大平台。伴随科研需求日益多样和复杂,类似Crete这样的内存丰富型计算系统将成为推动重大科学突破的关键动力。
未来,随着CXL等技术的成熟普及,内存与计算深度融合的计算范式将逐渐成为AI时代科学研究的标准配置,引领高性能计算进入一个存算协同创新的新纪元。 。