近年来,人工智能技术飞速发展,特别是大语言模型(LLM)和机器学习在自动化和智能代理领域的应用备受关注。尽管市场上涌现出大量声称具备自主决策和办公任务自动化能力的AI代理,但真实的效果和实用性却常常大打折扣。前谷歌DeepMind工程师、新兴科技公司Simular联合创始人李昂在接受采访时直言,如今大量AI代理正在“做错事”,未能踏准技术与实际应用的节奏。李昂的见解不仅透露了行业面临的挑战,也为AI的下一步发展指明了方向。李昂于2017年加入谷歌DeepMind,彼时他亲身经历了谷歌内部对机器学习实用性的质疑。DeepMind团队尝试将其用于围棋的AlphaGo系统应用于谷歌广告平台,却未能带来预期收益,反而导致广告收入下降。
这一经历揭示了现实世界中机器学习系统面临的复杂性:统计学基础的机器学习方法通常假设数据分布是静态的,但真实环境中的数据动态变化极快,比如YouTube每日上传的新视频和不断变化的搜索查询。正是这种数据非静态、环境不断演进的特性,限制了传统机器学习方法的生产环境应用。李昂强调,虽然ChatGPT推出引发了新一轮的生成式AI热潮,并带来了数十亿美元的资本投入,但机器学习在工业级应用中依然普遍表现不佳。例如,在2024年4月建立的OSWorld评测基准上,顶尖的AI代理也只有不到一半的办公自动化任务完成成功率。相比之下,人类员工的任务完成率超过七成。这表明AI代理距离真正替代人类办公还有很长的路要走。
针对这样的困境,李昂和他的团队创立了Simular,致力于打造下一代AI代理框架——S2代理框架。该框架结合了扩展性强的神经网络和符号化编程技术,采用一种“探索与利用”的策略。首先,利用大型语言模型进行方案的尝试和探索,找到可行路径后,立即将这些路径转为符号代码(类似JavaScript的形式)进行稳定执行。这种转化既保证了操作的可预测性,也避免了每次都依赖复杂的神经网络推理,从而提高了执行效率和准确性。当代码出现失误时,系统仍依靠语言模型进行修正和重写,从而实现持续优化。这一策略的核心在于平衡“探索”与“利用”二者的关系。
李昂指出,业内多数竞争者过于集中于探索,试图不断尝试新的解决方案,却忽视了对已知解决方案的稳定执行和优化。反之,Simular的方法充分利用已探索出的确定性路径,用程序代码的形式加以固定和运用,从而避免了任务执行的随机性和低效性。Simular的目标并不仅仅是提供一款简单的AI助手,而是致力于开发具备“持续学习”能力的神经符号强化学习框架。这种框架能够在不断接受新数据的同时,避免“灾难性遗忘”——传统神经网络在更新时往往忘记此前学得的内容——极大提升AI系统的稳健性和适应性。长期来看,这也是迈向人工通用智能(AGI)的关键一步。李昂还特别指出,现实应用中最大痛点之一是“无API行业”,例如保险、医疗、金融等领域。
这些行业的数据和操作流程多以繁琐的表单和界面为主,缺乏统一的程序接口,导致企业必须雇佣大量人工执行重复性工作。针对这一情况,Simular推出了针对macOS平台的Simular Pro,每月收费500美元,专为自动化办公中海量重复性表单处理而设计。它不仅能够有效替代人工操作,还能基于用户习惯形成个性化的自动化方案,极大提升垂直行业效率。值得关注的是,李昂设想的未来人工智能不再需要我们“携带电脑”,而是成为一种类人化的存在,能够自主帮用户订票、预约、购物等,真正实现无缝融入日常生活。通过将用户偏好和习惯存储在本地,保护隐私的同时,使代理更为智能和个性化。这个愿景折射着AI从工具向伙伴的转变,引领智能计算迈向更高层次。
综上所述,李昂关于AI代理的观点为业界敲响警钟。当前大量基于LLM的代理固然令人眼花缭乱,但若缺乏科学的探索与利用平衡、忽视符号编码的稳定执行,必然难以满足工业应用的需求。Simular所提出的神经符号持续强化学习框架,为提升AI稳定性和效率提供了创新路径,同时在特定的API不足行业具备显著的应用优势。未来,AI的进化不仅要在模型能力上突破,更需解决动态环境下的持续学习和有效执行问题。推动AI从实验室走向真实世界,真正实现对人类生产力的增强和替代,这既要求技术创新,也要求对实际场景有深刻理解。李昂的实践经验和思想洞见,为AI产业的发展提供了宝贵的启示,也彰显了持续探索与合理利用结合的关键价值。
随着技术的不断成熟,我们或将迎来真正能“理解”环境、不断进化的智能代理,助力人类进入更加智能和高效的时代。