人类认知的复杂性一直是心理学和神经科学领域最具挑战的课题之一。长期以来,科学家们致力于建立一套统一的认知理论,希望能够解释人类在不同环境和任务中的行为表现。近年来,随着人工智能尤其是大型语言模型的发展,一种全新的方法开始成为可能——基于基础模型(foundation model)的认知预测与模拟。这种方法不仅整合了海量的行为数据,还借助自然语言处理技术,为我们揭开了人类认知的深层规律。 最新研究开发的基础模型名为“Centaur”,其核心思想是在已有强大语言模型的基础上,利用高效的参数微调技术,将模型训练成能够预测并模拟人类在各种心理实验中的行为表现。Centaur所依赖的数据集被命名为“Psych-101”,涵盖160种不同心理实验,涉及超过6万名参与者,累计超过一千万次的行为选择记录。
这些数据通过自然语言形式进行表达,不仅保证了信息的完整性,还使得模型能够理解实验中的复杂语义和情境。 传统的认知模型通常是针对某一特定领域或任务设计的,它们在该领域可能表现优异,但却难以泛化到其他任务中。例如,用于解释人们决策行为的展望理论虽然深入人心,却无法对学习、记忆或规划等其他认知过程作出准确预测。相比之下,Centaur作为一种基础模型,力求在广泛的认知领域内表现出色,实现行为预测的普适性和灵活性。 Centaur的训练过程采用了一种名为“量化低秩适配”(Quantized Low-Rank Adaptation,QLoRA)的技术。这种方法在保持基础模型参数冻结的同时,添加少量可调参数,从而在计算资源有限的情况下快速高效地完成微调。
具体来说,模型向所有非嵌入层的线性部分添加了秩为8的适配器,这些新参数仅占原模型参数总量的0.15%。通过仅训练这些适配器,Centaur在保持语言模型强大学习能力的同时,快速适应并掌握了人类行为模式。 在广泛的实验评估中,Centaur展现出比未调优的基础语言模型和各种领域专用认知模型更优异的表现。它能准确预测之前未见过的参与者的选择行为,甚至能应对任务覆盖故事的改变、任务结构的调整以及全新领域的问题,表现出极强的泛化能力。例如,在经典的两步任务实验中,Centaur不仅能预测标准的航天故事下的行为,还能正确理解使用魔法飞毯故事版本的参与者策略。此外,当面临增加选项数量的多臂赌博机任务或逻辑推理任务时,Centaur依然表现出色,远超多个传统认知模型。
除了行为预测的表现,Centaur的内部表征同样引人关注。研究人员分析了模型不同层次的表示,发现其在解码人类神经活动方面远胜于未经微调的基础模型。在功能磁共振成像(fMRI)任务中,无论是在两步决策任务还是自然句子阅读任务中,Centaur的神经层表示均能较好地预测与认知相关的脑区活动。值得注意的是,这种神经对齐并非通过直接训练脑活动数据获得,而是由对行为数据的微调自然促成的,体现了模型对人类认知机制的深层捕捉。 基础模型所体现的强大能力不仅体现在预测层面,它还为认知科学的理论建构提供了有力支撑。通过结合Centaur与自然语言推理工具,研究者们能够快速发现新的认知策略。
例如,在一个涉及多属性决策的实验中,借助模型生成的解释启发,科学家发展出一种结合多数投票和专家权重决策的混合策略模型,显著优于原有模型。进一步利用所谓的科学遗憾最小化方法,以Centaur为参考模型,发现和改进了该策略的薄弱环节,使其在预测准确性上达到了与Centaur一致的水平,同时保持了模型的解释性。 这种协同创新的模式展示了基础模型在推动认知科学自动化和高效化方面的巨大潜力。未来,研究者们或可借助此类模型进行实验设计的原型测试,优化数据收集及样本规模安排,甚至探索个体差异、发展心理学及计算精神病学等更复杂领域的认知机制。 然而,目前的系统仍面临一些挑战和发展机遇。例如,现阶段数据集在文化背景和人群多样性上尚存偏倚,多集中于西方、受教育水平较高的群体。
未来拓展数据涵盖范围不仅可提升模型普适性,还能揭示不同文化和个体特点对认知的影响。数据表示方式亦有待突破,从主要采用自然语言转向多模态融合,进一步丰富信息维度。 与此同时,模型结构和训练策略的探索也必不可少。通过从零开始训练新架构,结合注意力机制和向量记忆等不同神经科学理论,有望从计算层面深入解析人类认知的神经基理。此类跨学科研究将推动认知科学向真正的统一理论迈进,突破传统领域的界限。 整体来看,基于基础模型的认知预测和模拟代表了认知科学技术革新的前沿方向。
Centaur的成功不仅证明了大型语言模型与认知行为数据结合的可行性,更开启了构建普适认知模型的新纪元。它将促进科学家更全面地理解人类大脑运作及决策机制,助力人工智能更好地模拟人类智能,推动心理学、神经科学与计算机科学的深度融合和发展。未来,随着数据规模的扩大、模型技术的进步与多学科的协作,期待认知科学将在实现统一理论和解决真实世界问题方面取得前所未有的突破。