人类的思维和行为表现出惊人的灵活性和多样性。我们不仅能够做日常生活中的简单决策,如选择早餐或穿搭,更能面对复杂的挑战,比如科研创新、解决生命难题或进行跨界艺术创作。认知过程涵盖学习新技能、进行因果推理、激发好奇心以及适应全新环境等诸多方面。这种高度通用性定义了人类独特的智慧和能力。 然而,现有的计算模型多为领域特定,聚焦解决单一问题而不是全面描绘人类认知机制。诸如AlphaGo专注于围棋,虽表现卓越,但无法适应其他任务;类似地,认知科学中的经典理论如前景理论,也只能解释有限的认知现象,难以涵盖学习、规划或探索行为。
为了真正理解人类认知,我们亟需从碎片化的理论转向构建统一、整合性的认知模型。 迈向统一认知理论的关键一步,是建立一个能够准确预测并模拟人类在各种实验环境中行为的计算模型。近期,一项划时代的研究成果发布了名为“Centaur”的基础认知模型。Centaur基于当前最先进的语言模型——Llama 3.1 70B,通过微调一个涵盖超过6万名参与者在160个心理学实验中总计1千万次决策的大规模数据集——Psych-101,成功实现了对人类认知行为的高效捕捉和精准预测。 Psych-101数据集以自然语言形式完整转写心理学实验中每一轮的参与者决策历史,涵盖决策制定、记忆、监督学习、马尔可夫决策过程、多臂老虎机问题等多个认知领域。其独创的自然语言表述方式实现了不同实验范式的统一,极大促进了跨任务的泛化学习。
在训练过程中,Centaur采用了量化低秩适配技术(QLoRA),在基于冻结的四位量化大模型上添加低秩适配层,仅调优0.15%的参数,有效提升模型对行为数据的拟合度,同时保证训练效率和参数存储的最优化。模型专注于人类响应的预测,排除对实验文本指令的训练损失,确保捕捉认知行为本质。经过约五天的大规模训练,Centaur展现出卓越的表现力。 Centaur首先在预测未见过的参与者行为表现上大幅优于原始基础模型和多种领域特定的认知模型,体现出对同类任务的强劲泛化能力。在多项经典实验中,模型不仅准确还原人类的平均表现,还能模拟多样化的行为轨迹,包括基于模型和无模型强化学习的混合策略、 uncertainty-guided探索等复杂认知行为。更难能可贵的是,Centaur难以预测非人类智能体的行为,显示出其对人类认知特性的敏感区分能力。
为了测试模型的稳健性,研究团队让Centaur应对不同类型的挑战,包括改变实验背景故事(如两步骤任务中的“飞船”与“魔毯”故事切换)、调整任务结构(如增加选项三臂多臂老虎机问题),甚至进入完全新的认知领域(如法律入学考试的逻辑推理)。惊人的是,Centaur在所有这些非训练区间均表现优异,远超传统域特定模型和基础模型,彰显其广泛的迁移与概括能力。 此外,通过对近400万条响应时间数据的分析,Centaur基于预测不确定度计算的响应熵能够显著解释人类反应时变化,进一步确认模型在时间动态方面对认知过程的模拟能力。 在保证认知行为捕捉的同时,Centaur未出现预训练知识遗忘,仍然在传统机器学习任务中保持或提升性能,并在多项人类行为特征指标中表现出接近人类样本的行为特性。 与人类大脑活动的联系也令人振奋。研究者通过对两步骤任务与阅读句子任务中功能磁共振成像(fMRI)数据的回归分析发现,Centaur内部表征对人脑活动的预测能力明显优于未调优的基础模型。
尤其是在任务相关的脑区如腹侧纹状体和前额叶皮层,模型表征与神经测量呈现高度相关,表明微调不仅是行为匹配,更反映了认知信息处理机制的部分神经体现。 研究团队还展示了Centaur和Psych-101在科学发现中的强大潜力,体现为辅助构建更精确且可解释的认知模型案例。通过自然语言推理技术生成针对多属性决策实验的认知策略描述,将语言解释形式转译为计算模型,再利用Centaur系统识别预测盲点和优化方向,实现了理论与数据的紧密结合,并在实际应用中匹配甚至超越基线认知模型性能。 该研究不仅验证了基于大规模行为数据与现代语言模型微调的新型认知基础模型的可行性,还为认知科学的自动化和跨领域整合注入了活力。Centaur的成功说明,利用统一格式和多样实验数据进行大规模训练,有望驱动未来认知理论向高度概括和解释力更强的方向发展。 展望未来,研究者计划通过扩展Psych-101数据集,涵盖更多心理学领域如语言心理学、社会心理学及跨文化研究,并希望引入个体差异变量,如年龄、人格与社会经济状态,使模型对人类认知多样性具备更深层理解。
此外,结合注意力机制可视化与稀疏自编码器等技术,有望揭示Centaur如何储存与处理信息,反向启发人类认知模型和神经机制研究。 作为基础模型的里程碑之一,Centaur已在超过十六个“认知十项全能”测试中傲视群雄,显著优于竞品,这不仅证明了其强大的适应力与表现力,也为实现认知科学领域的统一理论提供了重要实践支撑。探索由此开辟的认知网络结构,如注意力机制与矢量记忆的结合,或引入神经科学理论辅助建模,都将是未来拓展的关键方向。 总结而言,Centaur代表了当前认知科学与人工智能交叉领域的顶尖进展。通过结合庞大心理实验数据和尖端语言模型技术,这一基础模型有效捕捉并预测了人类复杂认知行为,不仅促进了对认知过程的理解,也开启了认知科学自动化、统一和深度融合的新篇章。未来,伴随数据规模、模型架构及跨学科整合的不断推进,我们有望见证一个兼具普适性、解释力和生物学基础的统一认知理论诞生,为理解人类心智提供坚实的理论和实践支撑。
。