2025 年秋季,微软在 Office 生态中推出了被称为"vibe working"的新型体验:Agent Mode 在 Excel 与 Word 中上线,并且在 Copilot 聊天中新增了由 Anthropic 模型驱动的 Office Agent。这个消息在办公自动化与企业生产力领域引发广泛关注,因为它不仅把已有的智能写作与协助扩展为"代理式"工作流,还把复杂任务自动分解并在界面侧边栏以可视化方式执行,从而让非专家也能生成具有可审计性和可复现性的商业文档与报表。本文从功能原理、典型场景、性能评估、使用建议与治理风险五个角度进行全面解读,帮助读者理解"vibe working"对个人办公和企业流程可能带来的变化。 Agent Mode 的核心是什么 Agent Mode 是一种更具"代理性"的 Copilot 体验,区别于以往单次问题/回答型的助手。它会在用户给出高层指令后,将复杂任务拆解为一系列子任务,逐步执行并在侧边栏实时展示每一步操作。对于 Excel,这意味着复杂的数据清洗、公式生成、透视表与图表制作等可以由模型规划并逐项完成;对于 Word,意味着从大纲、内容生成到样式调整和引用校验,文档的创建过程变为一段可追踪的交互式对话。
微软在官方消息中提到,Agent Mode 在 Excel 中使用 OpenAI 的 GPT-5 模型来进行任务分解与执行,而 Copilot 聊天中的 Office Agent 则采用 Anthropic 的模型来处理诸如从 web 研究并生成完整 PowerPoint 或 Word 文档等任务。两者的设计目标都强调"可审计、可刷新与可验证",并在执行每个子任务后做验证环节,减少错误传播。 为什么称为"vibe working"以及它的用户价值 "Vibe working"源自"vibe coding"理念,即通过自然语言提示让 AI 代写代码。把这一思路引入办公软件后,用户对文档与表格的控制从逐步手工构建,变为用对话引导 AI 去完成复杂工作。对企业用户和普通办公人员而言,价值体现在三个方面: 一是效率提升。复杂的报表、分析与文档构建会被自动化,尤其对非专业用户来说,减少了对 Excel 高级技能的依赖; 二是思路可视化。
Agent Mode 在侧边栏展示每一步的计划和操作,用户可以看到模型如何拆解任务,从而理解并监督其决策路径; 三是可审计与可刷新。微软强调生成的内容可以与数据源保持联动,报表支持刷新和验证,这对企业级应用尤为重要,因为业务决策往往依赖可追溯的数据处理流程。 技术与模型的组合:GPT-5 与 Anthropic 的引入 微软并非单一依赖一种模型。Office 内部的一部分功能继续由 OpenAI 系列模型驱动,最新 Agent Mode 在 Excel/Word 中采用了 GPT-5 进行复杂推理与任务拆解。而 Copilot 聊天中的 Office Agent 使用了 Anthropic 的模型来生成像 PowerPoint 这样需要结构化设计与 web 研究的成果。微软的做法是组合不同模型的能力,试图在性能、多样性与可用性之间取得平衡。
值得注意的是,Anthropic 模型在 Copilot 聊天运行时采用 AWS 云服务,这意味着不同模型的部署环境和合规考量也会有所不同。微软方面称会基于模型家族的优势进行组合优化,以便为不同任务选择合适的模型。 性能表现与基准测试 微软在发布时引用了 Agent Mode 在 SpreadsheetBench 上的表现:在真实世界电子表格编辑任务中,Agent Mode 在 Excel 的准确率为 57.2%,超过了像 Shortcut.ai、带 .xlsx 支持的 ChatGPT agent 以及 Claude Files Opus 4.1,但仍低于人工准确率 71.3%。这一数据揭示了两个重要信息:一方面,AI 在电子表格处理方面已经展示出显著进步,可以完成许多中等复杂度的编辑任务;另一方面,仍然存在不少场景需要人工复核,尤其是高风险或对准确性要求极高的财务与合规数据处理。 实际应用场景示例 在财务与运营报表场景中,Agent Mode 可以接收诸如"基于过去六个月的销售数据生成月度汇报,突出环比变化与异常项"的指令。模型会查找并清洗数据、建立必要的公式和图表、撰写文字说明并提示用户审阅。
对于人力资源部门,可以生成招聘进度汇总、员工流失率分析与可视化仪表板。咨询与方案类文档的生成也将显著提速:类似"用三页幻灯片概述某行业的市场进入策略"这类任务,Office Agent 在 Copilot 聊天中能够从 web 抽取信息并制作幻灯片草稿。 使用时的风险与限制 尽管功能强大,但用户在使用 Agent Mode 与 Office Agent 时仍需警惕若干风险。首先是"幻觉"问题:模型生成的内容可能包含事实性错误或虚构数据,尤其在需要外部数据支持或复杂推理时更易发生。微软试图通过验证循环降低错误率,但并不能完全杜绝需要人工干预的场景。 其次是数据安全与合规问题。
企业常常处理敏感数据,任何由云端模型处理的数据都可能触发合规审查或数据主权问题。Office Agent 在 Copilot 聊天中使用 Anthropic 模型并运行于 AWS,企业应核查其数据流、日志存储与合规条款,明确哪些数据可以被模型访问或用于训练。 最后是自动化带来的"过度依赖"风险。业务人员若过于依赖 AI 生成结果而减少人工核查,可能导致质量下降或错误决策。因此必须将 AI 输出视为草稿或建议,并建立必要的复核流程。 最佳实践与落地建议 在将 Agent Mode 与 Office Agent 引入日常办公与企业流程时,推荐遵循几条实践路径以兼顾效率与风险控制。
首先,在敏感或关键业务流程中保留人工验收节点。AI 可以作为草稿生成与初步清洗的工具,但最终的审阅与签发应由具备业务判断力的人员完成。其次,利用可审计的设计。Agent Mode 的侧边栏执行记录与决策路径是非常宝贵的合规证据,应将其纳入变更管理与审计日志。第三,设定数据访问边界。在组织层面明确哪些文件夹、数据集可以被 Copilot 与 Office Agent 访问,必要时采用脱敏或沙盒数据进行测试。
第四,优化提示工程。为获得更可靠的输出,可以为常见任务建立模板提示,并对模型输出进行后处理规则,如数据校验脚本或业务规则检查。 企业治理与 IT 管理注意事项 IT 与数据合规团队需要评估几项关键问题:模型调用的日志是否满足审计要求,数据是否在允许的区域内处理,模型供应商的隐私与训练条款是否符合企业政策,以及在事件发生时如何回溯并修复受影响文档。对于高度合规行业,建议先在受控的 Frontier 计划或测试环境中试点,评估实际误差率与工作流影响,再决定是否推广到生产环境。 对个人用户与小型企业的建议 对个人订阅者与小企业而言,Agent Mode 与 Office Agent 提供了以较低成本获取专业级产出的机会。在日常工作中可以用它来快速完成会议纪要、演示稿初稿或月度数据汇总。
但是应保持对生成内容的审查,尤其是涉及法律、税务或合同条款等敏感内容时,仍应咨询专业顾问并作最终确认。 未来展望与行业影响 Agent Mode 的推出代表了办公软件从"工具"向"代理助手"转型的重要一步。未来几年内,随着模型能力提升与企业管理规则完善,更多重复性强但逻辑复杂的任务会被迁移到 agent 式工作流中。这将促使岗位职责发生变化,从执行型工作转向监督与价值判断型工作。同时,模型组合策略(如微软同时采用 OpenAI 与 Anthropic 的不同模型)预示着未来办公场景中将出现模型编排层,为不同任务选择最佳模型并管理其输出质量。 结语 微软在 Excel 与 Word 中推出的 Agent Mode 以及 Copilot 聊天中的 Office Agent 把"vibe working"理念带入主流办公软件,既带来了显著的效率提升,也提出了新的治理与审计挑战。
对于个人用户与企业来说,充分利用其能力的同时建立必要的校验与合规机制,才能真正把 AI 办公的利益最大化并将风险降到最低。未来随着模型准确性提升与工具成熟,Agent Mode 有望成为现代办公不可或缺的一部分,但在可预见的时间里,人机协作仍是确保质量与可信度的关键。 。