近年来,生成式人工智能(Generative AI)在多个领域表现出强大的内容生成能力,成为引领数字化信息传播和处理的重要工具。用户在利用ChatGPT、Gemini、Claude等先进AI模型时,除了享受AI带来的便捷和智能,还逐渐关注生成内容的来源和准确性。近期,由Muck Rack发布的一项权威研究揭示,生成式AI在回答中大量引用新闻媒体内容,尤其青睐路透社(Reuters)和Axios等新闻机构,这一发现引发了业界及用户的广泛关注。研究分析显示,当问题涉及时效性较强的内容时,生成AI模型近一半的引用均来自新闻媒体,彰显了新闻内容在AI信息生态中的核心地位。首先,理解生成式AI为何会广泛引用新闻媒体,需要回顾其数据训练和实时信息获取机制。虽然主流AI模型依赖大量历史数据进行训练,但面对突破时间节点的新问题时,模型缺乏实时更新能力。
禁用模型网络爬取功能或关闭引用功能后,模型生成的信息往往会出现过时或失实,严重影响用户体验。新闻机构具备快速发布即时信息和专业事实核查的能力,成为训练模型和生成回答时可靠的信息来源。这使得新闻媒体内容在信息时效性和可信度方面具有天然优势,特别是在涉及最新经济动态、政策变化、行业趋势等问题上,新闻报道能够提供第一手权威数据。再者,不同AI模型在引用新闻源的偏好上存在显著差异。例如,Muck Rack报告指出,Claude模型引用新闻媒体的频率显著低于ChatGPT和Gemini。Claude更倾向于引用企业博客、科技媒体和学术刊物,如好管家杂志(Good Housekeeping)、TechRadar和哈佛商业评论(Harvard Business Review),呈现出较少硬新闻偏好。
相较之下,ChatGPT和Gemini则更频繁地引用路透社、金融时报(Financial Times)、时代周刊(Time)和Axios等硬新闻媒体。这种差异反映了AI训练数据和许可协议的不同。值得注意的是,像金融时报、时代周刊和Axios与OpenAI均有AI内容授权协议,而Google的生成AI产品则缺乏类似授权,因此引用习惯也存在差异。新闻媒体被AI模型频繁引用,还体现出它们内容质量和信誉度的优越。路透社作为全球领先的新闻通讯社,其严谨的新闻采编流程和广泛的国际新闻覆盖使得其内容成为AI模型优先选择的权威信息来源。Axios以简明扼要、聚焦政策和商业新闻赢得行业认可,也频繁出现在AI的引用名单中。
这两家机构共同构成了AI时代新闻信息的基石。研究还强调,AI模型倾向于引用近12个月内发布的新闻稿件,尤其是ChatGPT,56%的新闻引用来自近一年内的报道。这种“时效偏好”保证了AI回答的最新性和相关性,满足用户对即时信息的需求。与此同时,新闻引用的行业分布也有明显特点。媒体娱乐、金融保险以及政府领域尤为依赖新闻类内容作为信息来源,而其他领域如医疗、能源和零售则更多从企业博客或官方机构资料中获取信息。这一趋势显示,各行业对新闻内容的依赖程度存在差异,也反映出新闻在公共信息传播链条中的关键节点作用。
尽管新闻机构对生成式AI内容提供了重要支持,但关于AI对新闻内容的使用也引发了版权和商业模式的讨论。生成AI工具部分功能可能挤占传统新闻网站流量,影响新闻机构的广告收入和订阅模式。此外,存在AI虚构新闻链接或引导至未经授权的文章副本的现象,影响新闻内容的版权保护和内容真实性。未来,新闻行业需与AI开发者深化合作,探索合理版权授权和内容共享机制,确保新闻版权利益,同时推动AI模型输出更加精准和可信的内容。综上所述,生成式人工智能模型之所以特别偏爱路透社和Axios等新闻媒体引用,源于新闻的权威性、时效性及丰富的事实基础。新闻媒体不仅为AI提供了高质量的数据支持,也促进了信息传播质量和透明度的提升。
随着AI技术继续革新,新闻内容与AI生成信息的融合将更加紧密,这对新闻产业的数字化转型提出了新的挑战与机遇,也为广大用户提供了获取权威、及时信息的新途径。理解这一趋势,有助于全社会更合理地引导AI应用发展,推动新闻传播生态的健康持续演进。在未来,如何构建新闻媒体与生成式AI之间的良性互动,将成为科技与传媒领域的重要课题。