伴随着人工智能技术的迅猛发展,软件行业正经历着又一次深刻而系统的变革。作为前特斯拉人工智能主管,安德烈·卡帕西在其关于软件变革的分享中,揭示了软件发展的“三大范式”以及大型语言模型(LLM)对未来软件生态的深远影响。他将软件的发展划分为传统代码1.0、神经网络2.0和大型语言模型3.0三个阶段。本文将围绕卡帕西的观点,深入探讨软件如何再次变革,以及这种变革背后的技术逻辑和实践价值。软件的第一次范式转变始于人类编写的传统代码,如Python或者C++等语言,是人们手工设计、调试和维护的程序逻辑体系。随后随着机器学习和深度学习的兴起,软件进入了第二代模式,改由神经网络“编程”——开发人员不再直接书写控制规则,而是通过大量数据训练模型,模型参数决定了行为。
神经网络最大程度地模拟了人类学习思维,带来了以往人工编写代码难以实现的功能和效率提升。如今,软件迎来了第三次范式变化,即大型语言模型3.0。在这一阶段,程序不再只靠传统代码或神经网络模型本身,而是能够通过自然语言以提示词(prompt)的形式“编程”。这让开发者与人工智能之间实现了更直接、灵活的交互。LLM不仅拥有海量知识和超强的推理能力,还因为其具有人类般认知缺陷而显得异常真实,这使得它们既像超级助手,也像需要监控的“人类灵魂”。卡帕西形象地将大型语言模型比喻为上世纪六七十年代的主机操作系统,这些巨型计算机通过云端集中运行,向用户以时分多路复用的方式提供计算资源。
LLM便是云端的“中央处理单元”,其上下文窗口则类似于随机存取存储器(RAM)。这一架构不仅揭示了当代人工智能服务的计算特点,也解释了为什么它们现阶段必须依赖云计算进行大规模部署。在市场生态上,LLM正演变成操作系统格局:少数垄断式闭源巨头如OpenAI和谷歌等,类似微软和苹果的Windows与macOS;而开源阵营则如Meta的Llama,犹如自由的Linux。最令人关注的则是大型语言模型的技术普及路径。传统科技,例如计算机、互联网、GPS等,一般从政府或大型企业自上而下推广至大众用户。然而LLM却反其道而行——它们率先面向亿万终端消费者开放,随后才逐渐被企业和公共组织引入。
这种自下而上的扩散模式,或许预示着未来技术创新和应用的崭新生态。不过,尽管LLM具有超凡的知识量和信息检索能力,但它们依然存在“人格化”的认知弱点。卡帕西指出,LLM容易产生“幻觉”,即错误或捏造信息,同时表现出智力上的“锯齿状”,在高度复杂的领域可超越人类,但在基础事实或逻辑判断上却常常出错。更重要的是,它们不具备持续学习的能力,每次对话开始相当于“失忆”,无法将之前的经验转化为永久知识。此外,LLM对恶意输入非常脆弱,容易受到提示注入攻击,安全隐患不可忽视。面对这类工具,卡帕西强调,“部分自治”的应用才是当前最实用也最成功的路径。
相比完全自主的机器人或智能体,部分自治的智能辅助系统更像是“钢铁侠的战衣”,极大地增强人类能力,但仍保持人在决策链中的主体地位。以代码辅助工具Cursor和搜索助手Perplexity为例,它们通过智能管理上下文、协调多模型协作、并提供专门设计的图形化界面,有效降低用户的认知负担,提升效率。它们还设计了“自治滑块”,让用户根据任务难度实时调整人工智能的介入程度,避免产生不可控内容。这种设计理念体现了人机紧密合作、快速反馈验证的核心思想。人类使用者能够通过高度视觉化、色彩区分的界面迅速审查AI产物,大大缩短校对时间。与此同时,开发者必须“牵制”AI,合理划分任务为可控模块,防止生成过长且难以实时验证的内容。
卡帕西对“2025年是智能代理元年”的观点持谨慎态度,借鉴自动驾驶超过十年依然未完全解决的教训,他认为我们正处于智能代理技术的发展初期,未来十年会是反复试验、持续人机协作的“代理年代”,耐心与人类在环监督不可或缺。得益于LLM的自然语言编程特性,编码门槛被大幅降低,“情绪化编码”(vibe coding)开始兴起。普通用户仅凭创意和描述即可产出简单应用,创作自由度史无前例。但卡帕西坦陈,尽管代码生成易如反掌,部署应用所需处理的运维、身份验证、支付集成等问题仍是制约非专业人士的巨大障碍,需要更完善的工具来简化流程。未来,数字基础设施必然要为智能代理做好准备。代理不仅是软件用户,更是信息消费者,网站和服务必须提供机器可读的文档,诸如llm.txt格式或基于Markdown的API说明书,从根本上让智能体理解如何调用接口。
人类中心的“点击按钮”说明需转变为机器可执行的curl指令,实现人与代理的协同作业。为适应不同数据来源,还需形成统一适合LLM处理的文本格式,打破传统界面与AI解读的壁垒。卡帕西总结,未来的数字世界将寻求“中间地带”,既尊重现有基础设施,又积极打造适合智能代理顺畅工作的环境。总而言之,软件正经历一场由传统代码、神经网络到大型语言模型驱动的深刻革命。大型语言模型作为新形态的操作系统,从技术架构、市场格局到使用方式都在重塑行业图景。它们具备前所未有的能力,也有独特的局限性,部分自治的人机协作才是目前最切实可行的应用方向。
与此同时,开发者和企业必须适应全新的编程范式,优化人与机器之间的验证和反馈流程。未来十年将见证智能代理的蓬勃发展,数字基础设施的升级,以及编程方式的根本转变。紧跟这一趋势,将有助于技术人员抢占先机,驱动创新,为人类社会带来更智能、更高效的数字体验。