比特币 加密活动与会议

前谷歌DeepMind工程师揭秘:其他AI代理为何走错路

比特币 加密活动与会议
Former Google DeepMind engineer says other AI agents are doing it wrong

随着人工智能技术的不断发展,AI代理在办公室自动化等领域取得了一定的进展。然而,前谷歌DeepMind工程师李昂提出,当前许多AI代理的发展策略存在根本性误区,深入剖析了AI技术落地的核心挑战及未来的发展方向。本文聚焦于李昂的观点,探讨AI代理技术的真实现状与未来趋势。

近年来,人工智能技术飞速发展,特别是大语言模型(LLM)和机器学习在自动化和智能代理领域的应用备受关注。尽管市场上涌现出大量声称具备自主决策和办公任务自动化能力的AI代理,但真实的效果和实用性却常常大打折扣。前谷歌DeepMind工程师、新兴科技公司Simular联合创始人李昂在接受采访时直言,如今大量AI代理正在“做错事”,未能踏准技术与实际应用的节奏。李昂的见解不仅透露了行业面临的挑战,也为AI的下一步发展指明了方向。李昂于2017年加入谷歌DeepMind,彼时他亲身经历了谷歌内部对机器学习实用性的质疑。DeepMind团队尝试将其用于围棋的AlphaGo系统应用于谷歌广告平台,却未能带来预期收益,反而导致广告收入下降。

这一经历揭示了现实世界中机器学习系统面临的复杂性:统计学基础的机器学习方法通常假设数据分布是静态的,但真实环境中的数据动态变化极快,比如YouTube每日上传的新视频和不断变化的搜索查询。正是这种数据非静态、环境不断演进的特性,限制了传统机器学习方法的生产环境应用。李昂强调,虽然ChatGPT推出引发了新一轮的生成式AI热潮,并带来了数十亿美元的资本投入,但机器学习在工业级应用中依然普遍表现不佳。例如,在2024年4月建立的OSWorld评测基准上,顶尖的AI代理也只有不到一半的办公自动化任务完成成功率。相比之下,人类员工的任务完成率超过七成。这表明AI代理距离真正替代人类办公还有很长的路要走。

针对这样的困境,李昂和他的团队创立了Simular,致力于打造下一代AI代理框架——S2代理框架。该框架结合了扩展性强的神经网络和符号化编程技术,采用一种“探索与利用”的策略。首先,利用大型语言模型进行方案的尝试和探索,找到可行路径后,立即将这些路径转为符号代码(类似JavaScript的形式)进行稳定执行。这种转化既保证了操作的可预测性,也避免了每次都依赖复杂的神经网络推理,从而提高了执行效率和准确性。当代码出现失误时,系统仍依靠语言模型进行修正和重写,从而实现持续优化。这一策略的核心在于平衡“探索”与“利用”二者的关系。

李昂指出,业内多数竞争者过于集中于探索,试图不断尝试新的解决方案,却忽视了对已知解决方案的稳定执行和优化。反之,Simular的方法充分利用已探索出的确定性路径,用程序代码的形式加以固定和运用,从而避免了任务执行的随机性和低效性。Simular的目标并不仅仅是提供一款简单的AI助手,而是致力于开发具备“持续学习”能力的神经符号强化学习框架。这种框架能够在不断接受新数据的同时,避免“灾难性遗忘”——传统神经网络在更新时往往忘记此前学得的内容——极大提升AI系统的稳健性和适应性。长期来看,这也是迈向人工通用智能(AGI)的关键一步。李昂还特别指出,现实应用中最大痛点之一是“无API行业”,例如保险、医疗、金融等领域。

这些行业的数据和操作流程多以繁琐的表单和界面为主,缺乏统一的程序接口,导致企业必须雇佣大量人工执行重复性工作。针对这一情况,Simular推出了针对macOS平台的Simular Pro,每月收费500美元,专为自动化办公中海量重复性表单处理而设计。它不仅能够有效替代人工操作,还能基于用户习惯形成个性化的自动化方案,极大提升垂直行业效率。值得关注的是,李昂设想的未来人工智能不再需要我们“携带电脑”,而是成为一种类人化的存在,能够自主帮用户订票、预约、购物等,真正实现无缝融入日常生活。通过将用户偏好和习惯存储在本地,保护隐私的同时,使代理更为智能和个性化。这个愿景折射着AI从工具向伙伴的转变,引领智能计算迈向更高层次。

综上所述,李昂关于AI代理的观点为业界敲响警钟。当前大量基于LLM的代理固然令人眼花缭乱,但若缺乏科学的探索与利用平衡、忽视符号编码的稳定执行,必然难以满足工业应用的需求。Simular所提出的神经符号持续强化学习框架,为提升AI稳定性和效率提供了创新路径,同时在特定的API不足行业具备显著的应用优势。未来,AI的进化不仅要在模型能力上突破,更需解决动态环境下的持续学习和有效执行问题。推动AI从实验室走向真实世界,真正实现对人类生产力的增强和替代,这既要求技术创新,也要求对实际场景有深刻理解。李昂的实践经验和思想洞见,为AI产业的发展提供了宝贵的启示,也彰显了持续探索与合理利用结合的关键价值。

随着技术的不断成熟,我们或将迎来真正能“理解”环境、不断进化的智能代理,助力人类进入更加智能和高效的时代。

加密货币交易所的自动交易 以最优惠的价格买卖您的加密货币 Privatejetfinder.com

下一步
Pennsylvania led America's industrial rise – now it will lead the AI revolution
2025年10月22号 05点04分54秒 宾夕法尼亚:引领美国工业崛起,如今驱动人工智能革命的先锋

宾夕法尼亚州作为美国工业发展的摇篮,正借助丰富的资源和人才优势,成为引领新时代人工智能革命的核心力量。深入探讨该州在能源、科技和教育领域的独特优势,以及其如何推动经济发展和产业升级。

Paul Hastings, AZB & Partners lead M&A legal advisory in APAC for H1 2025
2025年10月22号 05点06分22秒 2025年上半年亚太区并购法律咨询市场:Paul Hastings与AZB & Partners领跑

2025年上半年亚太区并购法律咨询市场呈现激烈竞争,Paul Hastings凭借超越200亿美元的交易总价值占据榜首,AZB & Partners则以24宗交易数量稳居首位。本文深入分析两大法律事务所如何引领亚太地区并购法律服务市场,及行业动态和竞争格局变化。

Deloitte acquires certain assets of TPS in US
2025年10月22号 05点07分51秒 德勤收购美国TPS资产,强化受托税务服务能力

德勤税务部门收购Cincinnati TPS公司部分资产,提升其机构信托团队在受托税务合规领域的专业能力,推动美国受托税务服务的发展,实现双方优势资源整合。

BlackRock Hits Record $12.5 Trillion in Assets Amid Turmoil
2025年10月22号 05点08分53秒 黑石资产管理规模创新高:在动荡中突破12.5万亿美元

黑石集团在全球经济动荡的背景下,资产管理规模突破12.5万亿美元,展现出其强大的市场影响力和卓越的风险管理能力。文章深入分析了黑石的增长策略、行业地位及未来发展前景,揭示其成为投资界巨头的关键因素。

Morning Bid: CPI, banks and Nvidia, oh my!
2025年10月22号 05点10分10秒 2025年7月全球市场聚焦:CPI数据、银行业表现及Nvidia最新动态解析

深入剖析2025年7月15日全球市场焦点,涵盖美国消费者物价指数(CPI)最新数据、主要银行财报表现以及芯片巨头Nvidia的战略调整,解读其对全球经济及资本市场的影响和未来趋势。

JPMorgan gets a dealmaking boost as Wall Street recovered from tariff tumult
2025年10月22号 05点11分24秒 摩根大通在关税风波后迎来交易复苏,华尔街重获活力

随着华尔街从关税引发的动荡中逐步恢复,摩根大通凭借强劲的交易活动彰显其作为投资银行巨头的领先地位。该行的投资银行收入和盈利能力在波动的市场环境中表现出顽强的韧性,同时也展望了未来潜在风险与机遇。

IFRS on-boards new members to ITCG
2025年10月22号 05点12分46秒 国际财务报告准则(IFRS)引入新成员加强数字分类咨询团队

国际财务报告准则基金会(IFRS Foundation)近期宣布多位新成员加入其数字分类咨询团队,推动全球会计与可持续发展标准的数字化转型,增强财务信息的透明度和一致性。此次成员更替体现了全球资源的优化配置和专业经验的多元融合,为未来数字税onomies的发展奠定坚实基础。