人类认知是科学领域最复杂且令人生畏的研究课题之一。长期以来,心理学与认知科学试图通过众多专门且有限的理论解释决策、学习、记忆和推理等各种心智功能。然而,这些传统模型往往局限于特定领域,难以横跨多样的认知现象,实现全面统一的认知理论。最近,一项由跨学科团队联合发布的研究成果——基础模型Centaur,正在改变这一格局,为揭示人类认知提供了一把钥匙。 Centaur的独特之处在于它基于大规模语言模型(LLM)构建,同时结合了数以千万计的心理实验真实数据。其核心训练数据集Psych-101,涵盖超过六万名参与者,经历了160个心理学实验、超过一千万次决策选择,将极其丰富的行为习得和决策过程转化为自然语言格式。
这一创新数据串联了诸多认知域,从多臂赌博机、强化学习、记忆机制到因果推理,无缝整合了多维度的认知范畴。 在模型设计上,Centaur基于Meta AI的开源大语言模型Llama 3.1 70B,通过参数高效的量化低秩适配(QLoRA)技术进行微调。此方法仅对模型少量低秩适配器参数进行训练,有效避免了传统大模型训练成本高昂和过拟合风险。更为关键的是,训练中仅聚焦模型对人类行为响应的预测能力,剔除多余指令文本,从而实现了精准且灵敏地对应人类行为模式的能力。 对人类认知的捕捉尤为关键的是模型的泛化能力。Centaur在多项验证试验中表现出色,不仅精确预测了训练数据以外参与者的行为,还在结构任务变形及全新认知领域中展现出超越传统领域专用模型的适应性。
举例来说,在著名的两步任务实验中,Centaur成功应对了覆盖故事的转换,体现了其对认知任务语义转化的深刻理解。更令人印象深刻的是,它能模拟人类的探索策略与决策轨迹,甚至精确重现了个体间认知差异的分布特征。 另一个研究亮点是模型内部表示与人脑神经活动的紧密关联。经过微调,Centaur的内部表示在携带认知相关信息方面显著优于原始大语言模型,其可用来预测功能磁共振成像(fMRI)采集的人脑数据,覆盖决策过程和语言理解多个脑区。这一神经级别的对齐为认知计算模型赋予了生物学可信度,预示着跨神经科学与计算认知的融合趋势日益明晰。 科学发现领域的应用同样令人瞩目。
利用Centaur和Psych-101,研究团队准确解读复杂多属性决策任务,发现了传统模型忽略的认知策略组合。特别是通过所谓的“科学遗憾最小化”方法,借助Centaur为参考,针对模型预测失败的具体行为实例进行了精准定位与改进,显著推动了认知模型解释力的提升。这不仅展示了数据驱动模型为理论构建提供的新范式,也凸显出人工智能助力科学创新的广阔前景。 尽管成就斐然,Centaur仍处于认知建模新兴阶段,存在可进一步完善的空间。未来研究方向包括扩展数据集覆盖更多心理学领域,如心理语言学、社会心理学及个体差异因素,通过引入跨文化样本破解目前为西方富裕人群主导的认知偏差。此外,向多模态数据转变,将语言、视觉、动作等多源信息相融合,是实现更完整认知模拟的关键所在。
总的来看,Centaur作为融合了深度学习与认知科学的基石性模型,代表了向统一认知理论迈出的一大步。它凭借卓越的预测力和泛化性,正重塑人们对心智机制的理解框架,开启了机器智能与人类认知接轨的新篇章。从理论丰富到实际应用,无论是神经科学、心理学、人工智能,还是临床认知障碍诊疗,Centaur都展示出强大的变革潜力。未来,随着技术和数据的不断完善,这类基础模型将不断深化我们对人类认知的认识,为推动智能科学和人类福祉发挥关键作用。