人类认知作为心理学和神经科学的研究焦点,涵盖了感知、学习、决策、推理等多方面能力。长期以来,学界努力寻求统一的认知理论,但面临着认知过程多样且跨领域的挑战。传统的认知模型通常针对特定领域设计,缺乏跨任务和跨领域的泛化能力,因此难以全面描述人类认知的复杂行为。伴随着人工智能领域大型语言模型(Large Language Models,LLMs)的快速发展,研究者们开始尝试将其与认知科学结合,构建能够模拟人类认知的通用计算模型。2025年发表在Nature上的一项开创性研究引入了一种名为Centaur的基础模型,这是一款通过大型语言模型微调生成,能预测和捕捉人类认知行为的强大工具。Centaur基于Meta AI发布的Llama 3.1 70B模型,利用量化低秩适配技术对一个名为Psych-101的巨大心理行为数据集进行微调。
Psych-101涵盖了160项心理实验中超过六万名参与者的上千万次选择数据,涵盖了包括多臂赌博任务、决策制定、记忆、监督学习以及马尔可夫决策过程等多个认知领域。借助自然语言转录方式,研究人员将复杂多样的实验范式统一表达,使模型得以在多种任务间进行知识迁移和泛化。对于Centaur的评估显示,它不仅超越了基础模型Llama对未见参与者行为的预测能力,也优于多种领域专用认知模型,表现出卓越的泛化水平。无论是面对修改后的实验情境,如不同的故事包装,还是结构性任务变更,例如从双臂赌博到三臂赌博,甚至是完全新的认知领域如逻辑推理,Centaur都能准确模拟和预测人类行为。其在开放式仿真中的能力更让人印象深刻,模型生成的行为轨迹在探索策略和学习方法分布上高度吻合真实人类样本。此外,Centaur成功区分了人类和人工智能主体的行为,显示出对人类特有认知模式的敏感性。
研究还进一步揭示,经过微调后的Centaur内部表示与人类大脑活动呈现更好的一致性。利用功能性磁共振成像(fMRI)数据,对模型隐藏层激活与人类脑区活动的相关性进行分析,发现Centaur在多个关键脑区表现出优异的预测能力,尤其在涉及决策和奖励处理的区域。这为模型不仅在行为表现层面接近人类,更在神经机制层面展现相似特性提供了重要证据。值得注意的是,该研究还通过案例分析展示了如何利用Centaur和Psych-101推动科学发现。在一项多属性决策实验中,借助Centaur对行为的精确模拟,研究人员结合语言模型解释生成技术,提出并优化了一个结合多种启发式策略的新型认知模型,实现了效率和可解释性的平衡。这一流程说明了基础模型不仅是行为预测工具,更是辅助认知科学理论构建与验证的强大助手。
Centaur为认知科学研究带来的变革深远。其数据驱动且基于通用语言模型的设计架构,提供了一种全新的统一认知建模范式,有望克服传统领域特定模型的局限,促进跨领域认知统一理论的构建。未来,随着数据集的扩展与多模态集成,基础模型的认知覆盖范围和精度将进一步提升,同时模型内部机制的解释性研究也将加深对人类认知本质的理解。此外,Centaur的成功为人工智能技术带来了新的启示,推动构建更具人类般认知能力的智能系统。尽管这一研究成果已取得巨大突破,但挑战仍然存在。现阶段Psych-101数据主要聚焦于学习与决策领域,拓展其他认知领域如语言学、社会心理学以及发展心理学的数据将极大丰富模型的训练环境,提升其在人类认知多样性和个体差异方面的表现。
同时,当前模型受限于文本数据格式,未来多模态数据的引入将帮助模型更真实地模拟人类情境感知和交互。结合神经科学数据的深入融合,将有助于厘清模型与脑功能的对应关系,推动认知模型和神经机制的统一。总之,Centaur作为人类认知基础模型的代表,成功展示了通过大规模行为数据训练的语言模型能够全面预测和捕捉人类行为模式,突破了传统认知科学模型的局限。它不仅加深了我们对人类认知机制的理解,也为认知科学和人工智能的未来发展开辟了宽广道路。随着研究的不断推进,基础模型有望成为连接心理学、神经科学与人工智能的桥梁,实现真正意义上的统一认知理论和智能系统的设计。