在人工智能和认知科学的交叉领域,一个令人兴奋的新趋势正在悄然兴起,那就是通过自由联想任务来探索大型语言模型(LLM)内部的语义结构与认知能力。被称为“LLM世界词汇”(LLM World of Words,简称LWOW)的项目正是这一趋势的最新成果,该项目通过模仿人类自由联想实验,利用多款前沿大型语言模型生成了包含百万级关联词条的数据集。这一突破不仅为理解机器如何编码概念知识提供了新途径,也为对比人类与机器的语义网络结构奠定了基石,同时帮助研究者洞察语言模型中潜藏的隐性偏见。自由联想作为心理学和语言学中经典的实验范式,至今依然是研究语义记忆组织和词汇检索的重要手段。传统上,人类被给予一个提示词(cue word),并被要求迅速说出头脑中自然联想到的若干相关词汇。由于任务缺乏特定语境限制,所得词汇能反映个体无意识层面的词汇关联和概念网络。
经过几十年的发展,基于人类自由联想的大规模词汇关联数据库如“Small World of Words”(SWOW)已成为认知模型和语言研究的宝贵资源。尽管如此,随着大型语言模型在自然语言处理领域的崛起,研究者也开始关注如何以类似的自由联想方式,挖掘这些复杂模型所掌握的语义结构和关联网络。传统分析语言模型的手段通常依赖于词嵌入空间,计算词向量间的余弦相似度等数学方法,进而推断词语之间的相关关系。此类“自下而上”的方式在静态词嵌入时代效果显著,但在目前广泛使用的上下文敏感嵌入的大型语言模型中面临挑战。上下文嵌入依赖于大量上下文信息,使单词意义更具多样性与动态变化,因此简单的向量操作难以全面捕捉词义关联或是不同模型间的可比性受到限制。针对这一困境,研究焦点逐渐转向“自上而下”的机器心理学范式——即通过设计类似人类认知实验的提示词任务,让模型直接生成自由联想式的词汇反应,从生成结果推断模型内部的语义结构。
这不仅加深了对LLM认知能力的理解,也增强了研究者利用人类认知科学工具对语言模型进行跨模型及跨物种比较的可能。LWOW项目的核心即在于此。研究团队融合了三款当前性能卓越的语言模型:Mistral、Llama3与Claude Haiku,将与SWOW人类自由联想实验中完全相同的约12,000个提示词提供给模型,要求各自输出3个最自然联想的词汇。通过重复提示100次,三款模型共同产生了逾三百万个响应,形成规模与广度均可媲美人类数据库的自由联想词汇集。为了确保数据质量与实验可比性,研究者在数据预处理上付诸大量细致工作。他们统一转换大小写,去除多余冠词,对拼写错误或词语连写不规范的响应进行自动校正,并利用WordNet词库进行词形还原和词义标准化。
此外,重复次数被严格控制为100次,每条响应中重复或直接复述提示词的词语被剔除。整套流程保障了LSOW数据与SWOW数据在结构与统计上的高度一致。值得注意的是,尽管进行了充分数据清洗,研究团队选择保留部分可能看似无意义甚至怪异的回答。这是因为“无效”与“有效”的定义本身带有主观性,同时这样的回应或包含潜在的偏向模式,对于理解不同主体(人类或机器)语义生成机制同样极具价值。为了进一步探索自由联想数据的认知意义与可靠性,研究者基于构建的关联数据建立了语义记忆网络模型。网络中的节点代表单词,连接表示由自由联想产生的词汇间频繁关系,边权重则反映响应出现的次数。
经过筛选节点与边的有效性,研究者剔除了词库外的异常词条及稀有关联,获得了可进行深入分析与模拟的语义网络。利用著名的“扩散激活”理论,团队模拟了语义启动过程,这一认知心理学框架描述了当大脑接收到提示词后,相关语义节点激活并传播至邻近词汇节点,促进对目标词识别的快速反应。对应经典的词汇决策任务(Lexical Decision Task, LDT),实验验证了相关提示词引导下目标词激活水平显著高于无关词汇,且激活值与人类实验中反应时存在显著负相关关系。这一发现不仅证实了LWOW构建的模型具有认知有效性,也揭示了大型语言模型内部语义结构在人类认知机制上的映射与相似性。除了理论价值,LWOW在实务中的应用前景同样广阔。研究人员提出,利用此数据集可挖掘大模型中存在的隐性社会偏见。
例如,在性别刻板印象方面,借助自由联想产出的语义网络,可以分析诸如“医生-男性”与“护士-女性”等配对的激活差异,揭示模型与人类在隐含态度上的异同。这样的洞察对于推动公平、无偏见的人工智能技术开发具有重要指导意义。与此同时,LWOW数据集及其相关代码均公开托管于Zenodo与GitHub,便于科研人员下载、复现和二次开发,促使跨学科研究和应用场景拓展得以加速。这种开放共享的科研传统为人工智能领域知识积累和合作创造了理想环境。整体来看,LWOW项目不仅回答了如何将心理学经典范式成功运用于大语言模型研究的难题,也为机器智能的语义认知提供了结构化、可比性强的实验数据。它架起了人类与机器“认知桥梁”,使得对比分析二者的语义记忆、关联模式及隐含偏见成为可能。
随着对大型语言模型能力及安全性的持续关注,相信LWOW及类似研究将成为深入理解语言智能本质及其社会影响的核心基石。未来,借助日益丰富的自由联想数据和认知网络模型,我们期待见证人工智能在更广泛、更深层次认知仿真和公平方面取得突破,也期待认知科学与AI技术在语言理解之路上携手前行。