在人类历史上,理解认知过程一直是心理学乃至整个科学领域的核心挑战之一。人类的思维极其复杂且具有高度的灵活性,既能完成日常生活中的简单决策,也能解决诸如癌症治疗和太空探索等宏大的难题。多年来,科学家们尝试通过不同的理论和模型来揭示认知的规律,但大多数现有模型局限于特定领域,难以实现跨任务和跨域的泛化应用。最近,随着人工智能技术的发展,尤其是大型语言模型(LLM)的崛起,研究人员提出了一种革命性的思路:利用基础模型(foundation model)结合大规模人类行为数据,建立通用的认知预测模型,进一步迈向终极的“统一认知理论”。Centaur作为此方向上的标杆性成果,正在引领认知科学进入一个崭新的时代。 Centaur是基于Meta AI开发的顶尖语言模型Llama 3.1 70B,通过对庞大的人类心理学数据集Psych-101进行微调得到。
Psych-101涵盖了超过60000名参与者在160个心理实验中做出的超过一千万次选择,涉及多臂老虎机任务、决策制定、记忆、监督学习、马尔可夫决策过程等多种范畴。科学家将这些实验转化成自然语言的形式,使不同范式之间能够无缝整合,为模型训练提供了规范且丰富的语义环境。采用QLoRA的低秩适配技术,Centaur在保持原有模型参数不变的基础上,通过极少量的参数调整,高效吸收并捕捉了各种认知行为模式。 在大量严格的评测中,Centaur展现出了卓越的表现。它不仅能准确预测训练数据中未见个体的选择行为,更能够适应新的实验设置,包括更换实验背景故事、结构调整乃至完全未见过的认知任务领域。与领域特定的认知模型相比,Centaur在预测准确率和泛化能力上均实现了显著超越。
而在闭环模拟中,Centaur的行为轨迹分布几乎与真实人类无异,表现出多样化的学习策略,兼具模型自由和模型基的特点,这一能力在传统语言模型中尚属罕见。 此外,Centaur的内部表征与人类大脑神经活动表现出高度的一致性。通过对功能性磁共振成像(fMRI)数据的预测分析,研究人员发现微调后的Centaur能更好地解码大脑在执行决策任务和语言理解任务时的活动模式。该结果不仅表明模型在行为层面的拟合能力,也暗示了其潜在的神经机制相似性,为理解人脑信息处理提供了新的视角。 Centaur的成功还为认知科学的模型构建和理论发展提供了全新的工具。借助其强大的预测能力,科学家们可以实现自动化的科学发现流程。
例如,在多属性决策研究中,利用Centaur生成的解释指导设计并优化新的认知模型,显著提升了模型拟合效果,同时保持了良好的可解释性。这种以数据驱动和模型辅助为核心的新范式,有望大幅加速认知理论的迭代与完善。 展望未来,基于Psych-101的基础认知大模型可持续扩展到更多认知领域,如语义理解、社交心理学以及经济博弈等复杂场景,并融合个体差异信息实现个性化认知建模。随着多模态数据格式的引入,模型将进一步跨越语言表达的限制,更全面地模拟人类认知的多样化表现。与此同时,深入解析Centaur的内部工作机制,如稀疏自动编码器和注意力机制的可视化,也将为揭示人类知识表征和信息加工机制提供契机。 人类认知的统一理论长久以来被视为心理学的圣杯,但之前因领域碎片化、模型局限性等因素难以实现。
Centaur的问世及其在跨实验、多任务中的优异表现,为统一模型的实现树立了实证基础。或许不久的将来,数据驱动的认知基础模型将成为整合心理学各分支的核心,推动AI与神经科学的深度融合,为理解我们思维的本质带来前所未有的突破。 总的来说,基于大规模人类行为数据微调的基础模型Centaur,以其独特的设计和强大的能力,开创了认知科学的新纪元。它不仅有效预测了复杂多变的人类行为,还彰显了与神经活动的一致性,体现了人工智能与认知科学交汇的巨大潜力。随着研究的深入和数据的丰富,Centaur及其后续模型有望塑造未来心理学和人工智能研究的全景格局,推动人类对自身认知机制的深刻理解和智能系统的不断进化。