人类的认知能力呈现出极强的广泛性和灵活性。无论是日常生活中的简单决策,还是应对复杂问题的深度思考,我们都能迅速适应,并基于有限的信息做出合理判断。这种跨领域的普适认知能力,是理解人类智能的关键。然而,长期以来,认知科学和机器学习领域的模型往往专注于特定任务,缺乏统一视角。谷歌旗下的AlphaGo展现了机器在围棋游戏中的卓越能力,但它难以迁移至其他认知任务。心理学领域中,诸如前景理论这样的模型为特定决策过程提供了解释,却难以涵盖学习、规划和探索等认知子系统。
正因如此,开发推进认知科学统一理论的基础模型,一直是科学研究的核心目标之一。 近日,由Marcel Binz等科研团队提出的Centaur模型,为实现这一目标开辟了新路。Centaur构建于当今最先进的大型语言模型之一Llama 3.1 70B之上,通过对心理学领域中广泛多样的实验数据集Psych-101进行微调训练,从而获得了能在多种认知任务下精准预测人类行为的能力。Psych-101囊括160个经典心理学实验,覆盖超过60000名参与者,采集了超过1千万次选择响应,内容涵盖决策、多臂赌博机、记忆、监督学习以及马尔可夫决策过程等多种认知范式,规模和多样性均为历史之最。 模型训练采用了先进的参数高效微调技术QLoRA,仅为基础模型新增少量可训练参数,避免了大规模重新训练的计算代价,同时有效整合大量人类行为模式。训练过程中,团队将数据中的实验设置和任务描述均转换为自然语言格式,使模型可以理解各种任务的语义结构,并专注于模拟人类的具体反应。
令人印象深刻的是,Centaur不仅能够优于已有领域特异认知模型预测未见参与者的行为,更能在全新任务场景下实现出色的泛化表现,如修改实验背景故事或调整任务结构时依旧保持良好预测准确性。 更难能可贵的是,Centaur在开放式模拟中展现出与人类高度相似的行为轨迹,如二步任务中表现出的多种模型自由/模型基学习混合策略,甚至能够准确捕捉个体间行为差异,反映其对群体行为分布的把握。此外,Centaur对人类反应时间也表现出较好的预测能力,与心理学中著名的希克定律高度一致,说明其对信息处理复杂度的敏感度。 从神经科学角度出发,Centaur经微调后,其内部表征与人类脑功能磁共振成像(fMRI)数据显示出更紧密的对齐。尤其在代表认知控制、奖励预测和语言处理的脑区中,模型的特征向量能够更准确地预测脑活动模式,表明模型不仅在行为层面模拟认知过程,其深层表征亦与人脑认知机制存在神经级的共鸣。这一发现为结合计算模型与神经机制研究提供了坚实基础,也证明了以行为数据驱动微调大型语言模型是提升其认知相关性的有效途径。
研究团队还展现了Centaur在认知科学发现中的实用价值。通过引入一种被称为“科学遗憾最小化”的策略,他们利用Centaur作为黑盒预测参考,对某项多属性决策实验中的预测误差进行分析,发现传统认知模型难以解释的特定决策模式。基于这些启示,提出了结合多种启发式策略的混合模型,显著提升了拟合精度,同时保持了模型的解释性。这种闭环的模型发现流程结合了大规模行为数据和强大语言模型的推理能力,为今后认知心理学模型的设计提供了创新范式。 展望未来,Centaur及其背后的数据集和微调方法为认知科学带来前所未有的机遇。随着Psych-101数据库的不断扩充,涵盖诸如心理语言学、社会心理学以及跨文化实验等更广泛领域,模型将能够捕捉到更丰富的人类心理差异和行为特征。
借助模型解释技术如注意力机制可视化和稀疏自动编码器,未来或能深入剖析模型内部如何编码和处理认知信息,进一步促进对人类认知机制的理解与验证。 此外,基于这类大规模自然语言格式的认知行为数据,科学家们还可能探索全新架构模型,结合神经科学理论和计算神经机制,打造融合领域专属模块与领域通用模块的混合认知系统,推动认知科学从碎片化理论向统一理论迈进。同时,利用模型进行模拟研究,也有望优化实验设计,提前预估所需样本量,降低科研成本,提高研究效率。 不可忽视的是,目前数据集和模型在文化背景等方面仍存在一定偏差,偏重于西方教育、工业化社会样本。未来建立更具多元性的数据集,将进一步提升模型的普适适用性和公平性。与此同时,如何将文本形式的数据拓展为多模态数据,吸纳视听、动作和生理信号等信息源,则是迈向更加完整认知模拟的重要方向。
Centaur的成功证明了将大型预训练语言模型与丰富心理学数据相结合的巨大潜力。这一方法不仅改善了对人类自然行为的预测,也有效地反映认知过程的内在机制。该工作为统一认知理论的研发提供了坚实的计算工具和方法学支持,有望推动认知科学向更高维度发展。对相关领域的研究者、人工智能开发者乃至临床应用者而言,都具备重要启示意义。 在人工智能快速发展的时代,Centaur项目奠定了将行为科学与深度学习技术融合的新范式。其跨学科特色体现了未来认知研究的演进趋势,期待更多研究能够由此开花结果,实现对人类心智的更深刻理解与应用。
。