类别
NFT 和数字艺术元宇宙与虚拟现实加密交易所新闻加密初创公司与风险投资加密市场分析加密活动与会议加密税务与合规加密货币的机构采用加密钱包与支付解决方案加密骗局与安全	区块链技术去中心化金融 (DeFi) 新闻山寨币更新投资策略与投资组合管理挖矿与质押比特币监管和法律更新稳定币与中央银行数字货币行业领袖访谈首次代币发行 (ICO) 和代币销售

页面
主页关于条款	搜索

跟着我们

类别
NFT 和数字艺术元宇宙与虚拟现实加密交易所新闻加密初创公司与风险投资加密市场分析加密活动与会议加密税务与合规加密货币的机构采用加密钱包与支付解决方案加密骗局与安全	区块链技术去中心化金融 (DeFi) 新闻山寨币更新投资策略与投资组合管理挖矿与质押比特币监管和法律更新稳定币与中央银行数字货币行业领袖访谈首次代币发行 (ICO) 和代币销售

页面
主页关于条款	搜索

跟着我们

类别
NFT 和数字艺术元宇宙与虚拟现实加密交易所新闻加密初创公司与风险投资加密市场分析加密活动与会议	加密税务与合规加密货币的机构采用加密钱包与支付解决方案加密骗局与安全区块链技术去中心化金融 (DeFi) 新闻	山寨币更新投资策略与投资组合管理挖矿与质押比特币监管和法律更新稳定币与中央银行数字货币	行业领袖访谈首次代币发行 (ICO) 和代币销售

页面
主页关于条款	搜索

跟着我们

类别
NFT 和数字艺术元宇宙与虚拟现实加密交易所新闻加密初创公司与风险投资加密市场分析加密活动与会议	加密税务与合规加密货币的机构采用加密钱包与支付解决方案加密骗局与安全区块链技术去中心化金融 (DeFi) 新闻	山寨币更新投资策略与投资组合管理挖矿与质押比特币监管和法律更新稳定币与中央银行数字货币	行业领袖访谈首次代币发行 (ICO) 和代币销售

页面
主页关于条款	搜索

跟着我们

2025年09月04号 12点35分51秒

Anthropic多代理研究系统解析：创新AI架构引领智能搜索新时代

山寨币更新区块链技术

钱财 qian.cx

Notes on – Anthropic: How we built our multi-agent research system

本文深入探讨Anthropic如何构建其多代理研究系统，揭示多代理LLM在扩展研究深度与广度方面的优势，详细解读其系统架构、并行处理机制、提示工程优化及评估方法，为AI研究与应用提供宝贵参考。

近年来，随着人工智能技术的飞速发展，语言模型（LLM）在自然语言处理领域发挥了前所未有的作用。Anthropic作为业界领先的人工智能公司，以其多代理研究系统“Claude Research”引发了行业内的广泛关注和讨论。多代理系统这一概念，曾让不少业内人士感到疑惑与怀疑：为何要增加复杂度，采用多个并行运行的提示，难道单一精心设计的提示不能高效完成任务吗？Anthropic的实践与研究证明了多代理系统的巨大潜能，彻底颠覆了先前的认知与偏见。多代理系统究竟为何而兴？其架构设计有何独到之处？在应对复杂信息检索和研究任务时，又展现出怎样的优势？本文将结合Anthropic的最新成果，深度剖析这一智能搜索新范式。多代理的定义是构建一个集合，包含多个智能代理（agent），这些代理能自主调用工具并在循环中共同工作。在Anthropic的研究系统中，主代理担负决策与任务拆解职责，根据用户查询设计研究方案，随后创建若干子代理并行展开信息检索工作。

利用这一机制，大量复杂任务可以同时从多个独立角度被多线程式深入研究，极大地提升了研究的广度和效率。多代理系统的核心价值在于“搜索即压缩”——从海量信息中提取关键洞见。将任务拆分交由各子代理在独立的上下文窗口中处理，能够涵盖更广泛的信息维度，避免单代理受限于模型上下文窗口大小(Anthropic系统中为20万Token)而造成的信息丢失与理解局限。系统内测显示，以Claude Opus 4作为主代理，配合Claude Sonnet 4子代理的多代理架构，其在内部研究评测中的表现相比单一Claude Opus 4代理提升了近90%。Anthropic举例说明，当任务需辨识标准普尔500指数中信息技术公司的董事会成员时，多代理系统通过合理拆解任务，由不同子代理分别执行子任务，成功获取准确答案，而传统单代理因搜索串行且效率低下，未能完成该任务。这种优势不仅体现于任务完成的准确率，更显著缩短了完成的时间。

尽管多代理架构优势明显，却也伴随着一个不可忽视的成本——Token消耗显著增加。Anthropic数据表明，单代理模型的交互大约消耗4倍Token，多代理的研究系统则通常消耗高达15倍Token。这在商业环境中意味着更高的运行成本，促使多代理系统必须聚焦于高价值、复杂且需并行处理的任务上，才能发挥经济效益。Anthropic在设计研究系统时，充分考虑了这一平衡，聚焦于大规模、多维度、复杂工具交互的任务，以充分利用多代理技术的长处。此外，为解决超长文本上下文管理问题，系统实现了记忆功能。主代理会先对研究计划进行思考，并将计划保存在记忆模块中进行持久保存，避免因上下文窗口超限导致信息截断。

此举确保了任务规划的连贯性与完整性，大幅提升后续子代理的执行效率。多代理系统的成功也归功于严谨的提示工程。Anthropic团队详细描述了他们针对子代理行为优化的过程。早期系统中，子代理存在无节制生成庞大量子任务、盲目搜索互联网无效源、以及相互间信息干扰等弊端。通过不断细化和优化提示，引导子代理明确任务目标、输出格式、使用工具及信息范围，系统整体表现大幅提升。Anthropic甚至创新性地设计了“工具测试代理”，专门用来检测和优化子代理使用的工具描述。

该代理反复测试工具功能，识别潜在错误并改写说明，使得未来任务执行过程中错误率下降40%，明显缩短任务完成时长。并行处理能力是另一个多代理系统带来的显著优势。主代理能够同时启动3至5个子代理子线程，而每个子代理也能并行调用多个工具，为复杂查询的处理速度节省了高达90%的时间，使得系统在几分钟内完成通常需数小时的研究工作。这种高效的并行机制不仅提升了查询效率，也保障了信息的多样性和完整性。为了保证系统质量，Anthropic投入了大量资源进行评估。采用“LLM作为裁判”的内置评测机制能快速反馈系统表现，但团队也强调了人工评测不可或缺的重要性。

早期，系统容易偏向SEO优化的内容，而忽略学术论文、专家博客等权威资源，通过引入源质量评估机制，调整提示后问题得以缓解，从而保证信息准确性和权威性。Anthropic公开了多代理系统相关的提示设计示例和操作指南，鼓励开发者最大化利用并行工具调用。通过建议同时调用多个工具而非顺序执行，多代理系统高效运行子代理并最大化系统吞吐量。同时，Anthropic强调了OODA（观察、定向、决策、行动）循环模式的重要性，赋予子代理以动态自适应的研究路径调整能力，从不断获得的新信息中动态优化研究策略。OODA循环确保每个子代理能够有条不紊地收集数据、调整视角、基于最新信息做出决策并实际执行，形成高效闭环。总结来看，Anthropic的多代理研究系统通过巧妙的架构设计、苛刻的提示工程优化以及严谨的评测策略，解决了单代理模型在大规模复杂信息处理中的局限，实现了高效、准确、经济的智能研究新范式。

该系统针对超长上下文管理、并行快速执行及工具链优化提供了宝贵经验，推动了多代理LLM技术走向成熟与应用。未来，随着硬件能力提升、Token经济成本降低以及多代理模型设计的不断完善，多代理架构有望在科研、商业智能、行业分析等广阔领域展现更为强大的驱动力。Anthropic多代理研究系统的成功案例为整个AI行业提供了切实可行的技术蓝图，以及推动研究系统性能跨越式提升的创新思路。面对海量信息和复杂任务，单一模型单线索处理手段已难以满足需求，多代理多线程协同互动的智能体系正成为人工智能发展的大势所趋。通过这套独具匠心的系统架构与优化策略，Anthropic展示了未来智能研究工具的无限可能性和广阔前景，值得所有关注AI前沿技术的专业人士和开发者深入学习和探讨。