在人工智能技术迅猛发展的当下,如何打造具备高效推理与决策能力的智能系统,成为推动产业升级的重要课题。NVIDIA 作为全球领先的加速计算公司,于2025年3月18日正式发布了全新的开放推理 AI 模型家族——OpenReasoning Nemotron。该模型基于 Meta 公司开源的 Llama 架构,经过 NVIDIA 深度后训练优化,专注于提升多步数学推理、代码生成、复杂决策等能力,为企业及开发者提供了一个面向未来的智能代理平台基础。OpenReasoning Nemotron 模型家族分为 Nano、Super 和 Ultra 三个规格,分别针对不同的硬件环境和使用需求进行了优化。Nano 模型定位于个人电脑与边缘设备,兼顾了高精度和轻量化;Super 模型专为单 GPU 环境设计,兼具卓越的精度和吞吐量;Ultra 模型则面向多 GPU 服务器,追求极致的推理准确率和性能。通过在 NVIDIA 自有的 DGX 云平台上运用高质量的合成数据和多样化的公开数据集进行后期训练,Nemotron 系列模型在准确度上较基础 Llama 模型提升了约20%,推理速度较其他领先的开放推理模型快约5倍。
这不仅提升了模型处理复杂推理任务的能力,也极大降低了企业在实际应用中的运营成本。值得关注的是,NVIDIA 并未将这些技术封闭为专有系统,而是通过开放工具包和数据集让企业能够灵活定制自有推理模型,促进 AI 技术的广泛创新和落地。许多行业领军企业和 AI 代理平台纷纷与 NVIDIA 合作,积极推动复杂推理 AI的应用落地。微软计划将 Nemotron 模型集成进 Azure AI Foundry,丰富云端智能服务能力,特别是针对 Microsoft 365 的 AI 代理服务进行提升。SAP 则在其 SAP Business AI 解决方案与 AI 助手 Joule 中引入 Nemotron 理解并重构用户查询,使得智能交互更为精准高效。同时,借助 NVIDIA NeMo 微服务优化 SAP ABAP 编程语言模型的代码补全精度。
ServiceNow 也利用 Nemotron 模型提升其 AI 代理性能,加强企业各行业的生产力。安永(Accenture)将 Nemotron 模型集成进 AI Refinery 平台,支持客户快速定制行业专属智能代理,加速数字化转型。德勤(Deloitte)预期将 Nemotron 应用于其新推出的 Zora AI 平台,打造具备深度业务知识与透明度的智能代理系统。这一系列合作充分体现了 Nemotron 推理模型在支持不同应用场景下的高度适应性及卓越表现。NVIDIA 还发布了配套的软件平台与工具,如 NVIDIA AI-Q Blueprint,通过 NIM 微服务与 NeMo Retriever 实现多模态信息检索、多代理互联及优化,为打造具备感知、推理和自主行动能力的 AI 代理奠定坚实基础。NVIDIA AI 数据平台则为构建企业级 AI 查询代理提供可定制的参考架构,支持数据驱动的持续学习与实时环境适应。
新的 NIM 微服务着重加速复杂推理场景下的推理性能,支持包括 Meta、微软和 Mistral AI 在内的领先模型的稳定部署与在线训练。通过搭建数据飞轮,NVIDIA NeMo 微服务帮助企业持续积累和优化智能代理的反馈机制,提高系统的智能化水平和用户体验。当前,Nemotron Nano 和 Super 模型以及相关 NIM 微服务已在 build.nvidia.com 和 Hugging Face 平台上线,面向 NVIDIA 开发者计划成员免费开放,用于开发、测试和研究。企业用户可利用 NVIDIA AI Enterprise 平台,在加速的数据中心和云基础设施上实现 Nemotron 模型的生产环境部署。NVIDIA NeMo 微服务预计在近期公开发布。随着 NVIDIA AI-Q Blueprint 预计于四月推出,结合已开放的 NVIDIA Agent Intelligence 工具包,开发者将拥有更加完备的智能代理构建环境。
NVIDIA 创始人兼 CEO 黄仁勋表示,推理和智能代理 AI 的应用正飞速普及,NVIDIA 提供的开放推理模型和工具,将为全球开发者和企业提供加速构建智能代理系统的基础构件,推动智能AI工作力量的广泛部署。NVIDIA OpenReasoning Nemotron 代表了推理 AI 技术从研究走向实际商业应用的重要里程碑。它不仅弥合了模型精度和性能瓶颈,更以开放共赢的姿态激发产业生态合作,加速智能体自动分析、推理与决策的商业价值实现。未来,随着此类先进 AI 模型和平台的成熟,智能代理将在客户服务、企业自动化、专业知识管理等多个领域深度赋能,助力企业实现数字化和智能化转型升级。NVIDIA 通过持续拓展强大的 AI 计算和服务能力,正在构建一个更加智慧互联、协同共生的 AI 新时代。企业和开发者只需紧跟技术变革步伐,便能抓住智能代理浪潮带来的全新机遇,打造更具竞争力的未来业务和创新应用。
。