随着人工智能技术的高速发展,企业对智能代理系统的需求日益增长,尤其是在信息抽取和数据处理等复杂工作流中。构建高效且低成本的企业级智能代理,成为推动数字化转型和智能化运营的关键所在。Databricks 最新发布的研究成果展示了通过自动化提示优化技术(Automated Prompt Optimization),能够在成本大幅降低的同时,显著提升智能代理的性能,将企业级智能代理的构建成本降低至原有的九十分之一,引发业界广泛关注和热议。 智能代理作为企业数字化基础设施的重要组成,其核心职责是自动化处理海量且复杂的数据,帮助企业实现业务流程自动化和智能决策。长时间以来,构建这种具备高准确率和稳定性的代理系统,需要投入大量资源,包括昂贵的私有模型训练、持续的模型微调以及繁复的人工调优工作。传统方法不仅耗时,而且难以确保适配不同领域和任务的专属要求。
Databricks Agent Bricks 平台引入了自动化提示优化的创新方法,以系统化和结构化的搜索策略,使模型提示(Prompt)不断迭代和改进,从而提升模型在特定任务上的表现。与传统的监督微调(Supervised Fine-Tuning)技术相比,自动化提示优化不仅实现场景特定的性能提升,更为企业大幅降低了推理和部署的成本,关键在于其优化流程无需改动模型本身,仅通过对提示语句的智能调整,降低了资源消耗和迭代时间。 开源模型在企业应用中的表现从未如此令人振奋。以最新发布的gpt-oss-120b模型为例,经过GEPA(一种结合语言反思与进化搜索的提示优化算法)的优化后,该模型不仅在Databricks IE Bench评测中击败了先前领先的开源模型Llama 4 Maverick,性能提升约3%,更意外地超越了性能优异但成本高昂的私有模型Claude Sonnet 4和Claude Opus 4.1,且服务成本分别低约20倍和90倍。这一成果突破了"高性能一定高成本"的传统认知,证明了通过智能优化,开源模型在确保质量的同时具备更优的性价比。 IE Bench是Databricks团队针对企业级信息抽取任务打造的综合评测体系,覆盖金融、法律、医疗、商业等多样化领域。
这个基准测试强调了诸多现实挑战,包括文档长度过百页,信息结构复杂多层次等光复杂度极高的真实场景。通过对比不同模型在此基础上的表现,能够反映模型在真实企业环境中的适应力和实用价值。 自动化提示优化的优势不仅体现在模型性能提升,还大幅提高了开发和维护效率。传统提示工程依赖于专家经验和大量试错,尤其在复合型AI系统中多链调用与工具整合的场景下,人工调优显得极其不切实际。GEPA等先进算法通过反馈驱动的迭代搜索,实现了端到端的提示自动生成和优化,促使模型能够针对特定业务需求和数据属性自适应调整,减轻了人工负担同时也提升了模型的鲁棒性和泛化能力。 此外,GEPA优化技术不仅适用于开源模型,也能有效提升私有前沿模型的表现。
例如在Claude Sonnet 4和Claude Opus 4.1模型上应用该技术,分布优化效果提升了6-7%,创造了私有模型性能的新高,彰显自动化提示优化的普适性和强大潜力。值得注意的是,虽然某些优化过程会带来额外的计算开销,GEPA算法仍在权衡性能和成本的基础上,重塑了企业智能代理的质量-成本帕累托边界,使得整体效用最大化,为企业提供了更为理想的部署选择。 与传统的监督微调技术相比,自动化提示优化展现了明显的竞争优势。以gpt-4.1为例,提示优化提升了模型表现2.1个点,略优于SFT的1.9点提升,且服务成本降低了20%。综合应用两种技术还能叠加优势,将性能提升至4.8点以上,尽管成本有所增加,但为追求极致性能的企业提供了更多弹性选择。此外,自动化提示优化不依赖模型权重调整,能够快速适配业务变化和新需求,显著缩短迭代周期。
从企业实际运营视角审视,生命周期成本尤为关键。即使自动化提示优化的初期探索阶段消耗一定资源,随着请求量激增,服务成本则成为绝大部分开销的主体。在规模达到数十万至百万级请求时,优化带来的效益快速反哺整体投入,使企业能以最低总成本维持高质量服务,保持市场竞争力。尤其对于中小型企业和预算有限的团队,开源模型配合自动化提示优化,为其打开了高性能人工智能应用的大门。 Databricks Agent Bricks平台集成了GEPA、SIMBA和MIPROv2等多种自动化提示优化技术,形成成熟且易用的开发套件。通过统一的评估标准与自动化优化流程,企业能够快速验证、部署并持续改进智能代理,使其真正实现"懂数据、会推理、可自我提升"。
这种闭环优化机制为企业提供了持续提升智能代理能力的保障,顺应了AI技术从试验走向规模化应用的趋势。 展望未来,自动化提示优化将推动企业人工智能向更智能化、更低成本、更快速适应业务需求的方向迈进。随着开源社区与私有厂商的协同创新,我们有望见证更多优化技术的诞生,持续刷新性能与效率的天花板。同时,提示优化的多模态扩展、跨任务联合优化以及与人类反馈的结合,均有望成为企业智能代理的新增长点和核心竞争力。 总结来看,自动化提示优化不仅为企业级智能代理带来了革命性的成本效益,更在性能上超越了传统私有模型,打破了性能与成本之间的固有壁垒。通过Databricks Agent Bricks平台,企业能够轻松接入并利用该技术,开启智能代理的高质量低成本时代。
这不仅推动了企业数字化智能化进程,也为人工智能技术的普惠化应用奠定了坚实基础。选择自动化提示优化,意味着企业在智能化赛道上,把握了通往未来的主动权与领先优势。 。