人工智能技术近年来的发展势头异常迅猛,尤其是大型语言模型(LLMs)的崛起,极大地改变了我们与信息交互的方式。然而,与传统工具如螺丝刀或汽车不同,LLMs并非被设计为以特定功能为核心,这使它们成为形状奇特且难以预测的工具。要理解为什么LLMs被称为"形状奇特"的工具,必须从它们的起源和设计理念谈起。传统工具通常是为了完成某种特定任务而精心设计,比如螺丝刀专用于旋转螺丝,汽车用于运输,人们可以直观地预期它们的表现与功能。相反,LLMs的诞生过程充满偶然性。它们最初是通过大量文本预测训练而来,依托强化学习(RL)不断优化"损失函数",而非明确设定的操作目标。
正是这种自然而然的"进化"路径,塑造了LLMs独特的复杂结构和多样能力。LLMs擅长涵盖从文本生成、翻译到写作辅助等多种任务,但正因如此,其应用也常常陷入各种陷阱中。一个典型的例子是AI代理。开发者往往花费数月时间试图完善代理的结构和流程,但实际应用中仍难以保证始终稳定和可靠的表现。类似的,还有基于检索增强生成(RAG)实现的长期记忆功能。虽然这个方案看似前景广阔,但结果往往未能达到理想效果,令人颇感失望。
除此之外,LLMs普遍面临一些技术挑战,包括搜索能力不佳、容易产生"幻觉"信息以及高昂的推理成本。这些显而易见的问题只是冰山一角,更多微妙的弱点在日常研发中不易察觉,更有不少潜在的优势和不足仍未为人所知。当前LLM后期训练工作的前沿,正致力于探索如何修饰和塑造这些"不规则"结构,使其更加契合实际应用需求。这一过程异常艰难,即便是顶尖AI实验室也只能在长期摸索中缓慢进展。由于研发团队和产品团队之间缺乏足够的连接,或者缺乏清晰的愿景,现实中的AI产品普遍存在同质化严重的状况 - - 性能和体验表现趋同,缺乏鲜明特色。在当下,少数成功的消费级AI应用如Midjourney和Perplexity,背后往往伴随着大量的模仿竞赛。
厂商们热衷复制已有产品模型,少有人愿意大胆尝试LLM所开辟的无限可能新领域。这种现象本身也说明了LLM"形状奇特"的本质:它们的复杂架构和灵活特性,挑战了传统产品设计与创新的范式。很多AI服务甚至会将某些功能冠以"AI"之名,实际上却只展现出诸如魔法棒特效或炫彩表情等形式内容,因为产品设计师难以真正表达出智能体验的精髓。可以说,2024年在人机交互产品上并不会因为过度使用AI而遭遇惩罚。这种独特的行业景象反映出人工智能发展进入了一个颇为奇异的阶段。纵观整个技术演进,我们可以预期未来几年AI领域会更加有趣,特别是到了2025年后,这种奇妙的体验和困境可能呈现更多转变。
同时,这种局面也影响了人们对通用人工智能(AGI)实现时间线的判断。与LLMs不同,AGI是明确打造的工具,具有清晰目标和设计思路,这使得它不属于"形状奇特"那一类。探索LLMs的本质及其带来的挑战和机遇,对于理解现代人工智能的现状至关重要。虽然它们不是专门为某一应用而设计的产品,但正是这种不规则和不可预知,激发了创新的可能,同时也带来了诸多不可回避的问题。未来,如何克服现有短板,发掘并利用LLMs更多潜力,将成为AI社区和产业界的核心议题。适应和改造这些奇形怪状的工具,是通向智能革命下一阶段的必由之路。
只有真正理解它们的独特属性,才能在新一轮技术浪潮中获得优势。 。