近年来,人工智能(AI)技术的飞速进步已经深刻改变了信息传播和内容生成的方式。尤其在搜索引擎领域,AI不仅参与内容推荐和排序,甚至开始直接生成内容摘要和综述,助力用户快速获取关键信息。谷歌作为全球搜索引擎的领航者,其推出的AI综述(AI Overviews)功能尤其引人关注。然而,近期一项研究揭示谷歌AI综述引用了大量由其他AI生成的网页内容,形成了一个类似"蛇吃尾巴"的自我循环现象,这不仅引发了原创性和真实性的担忧,也对搜索引擎的未来生态提出了重要挑战。根据原创性检测公司Originality.ai的报告,谷歌AI综述在涵盖"你的钱或你的生活"(Your Money or Your Life,简称YMYL)领域的搜索词中,其引用的内容有近10.4%可能由大型语言模型生成。这一比例虽然看似不算很高,但在健康、金融、法律及政治等关乎人们生活核心利益的领域,AI互相引用产生的信息回声室效应可能引发风险。
这种情形下,AI模型将基于其他AI生成的内容进行二次生成甚至多次迭代,结果可能导致内容质量衰退,产生认知偏差甚至错误信息。学界称这种现象为"模型崩溃"(model collapse),即后续AI模型训练数据被受污染的AI生成内容充斥,从而导致模型逐渐"误解"现实。谷歌方面则针对Originality.ai的检测方法提出质疑,认为其工具并非万能,存在较大误判风险。谷歌发言人强调,谷歌一直在根据内容的相关性、帮助性和时效性动态调整AI综述中的引用链接,绝非单纯基于是否由AI创作进行筛选。事实上,谷歌在2023年明确表示,对于AI生成的内容,评级标准依旧是内容质量,而非创作主体是人类还是机器。这种开放态度显示谷歌并未试图排斥AI内容,相反,AI可能成为创造和表达新内容的重要工具。
然而,逐渐出现的现象是,谷歌AI综述所引用的内容,大量不再来自传统意义上的权威人类作者或主流网站,而是越来越多地包含由其他AI生成的文档。根据Originality.ai的数据显示,这些AI内容甚至很多并不在谷歌自然搜索前100名结果之列,说明AI综述在爬取资料时选择了传统排名之外的AI生成资源。正因如此,AI在信息生态中的作用变得更加复杂。一方面AI帮助我们快速总结复杂信息、发现更深层次资源;另一方面,过度依赖AI生成内容可能抹杀不同观点、多样化信息及人类审慎判断带来的价值。搜索引擎的点击率也因AI综述的强势展示而受到明显冲击。多个研究表明,用户遇到AI综述模块时,点击进入原始网站的意愿降低近三成至一半,这对依赖流量变现的内容创作者和新闻机构带来压力和挑战。
除了Originality.ai之外,佛罗里达大学和亚利桑那州立大学的研究均表明该工具在检测GPT-4等主流语言模型生成内容时准确度较高,误判率较低,进一步佐证了研究结果的参考价值。行业专家也普遍关注AI内容互相引用可能带来的"信息恶性循环"。如果AI模型长期从彼此生成的内容中学习,训练数据集将逐步被"自家复制品"污染,导致创新力下降甚至认知偏差加剧。谷歌的AI综述现阶段主要基于其自家的Gemini大语言模型,该模型能够处理更多样化的数据来源,包括PDF文件、白皮书等非传统网页内容。这使得AI综述能在YMYL领域发掘更全面的信息,但也增加了识别和验证来源真实性的难度。搜索引擎未来如何平衡AI内容和人的原创内容,将成为维护网络内容多样性和公信力的关键。
业内SEO(搜索引擎优化)专家指出,AI综述对排名和流量产生影响不可忽视,但谷歌同时强调AI综述采用多查询扩展机制以寻找高度相关内容,意味着不局限于单一关键词匹配。这种策略提升了搜索结果多维度的覆盖度,也强化了对非传统内容的支持。然而,这种模式下也带来了并非所有引用内容均经过充分筛选和质检的风险,尤其是在涉及严肃主题时对信息准确性更需慎重把控。回顾整个局势,谷歌AI综述引用AI生成内容的现象从技术创新的角度来看是突破性的,能够实现对海量信息的高效整合与总结;但从内容生态的角度,则需警惕自我影响和内容质量下滑的负面效应。学术界、产业界与平台方都面临着如何定义"可信内容"、如何优化AI模型训练数据以及如何保护用户利益的巨大课题。此外,伴随AI内容生成规模的扩大,版权、原创性和信息多样性问题日益突出,监管和伦理讨论亟需跟进。
在这样的背景下,内容创作者和媒体机构应加强原创内容生产的核心竞争力,提升内容价值,才能在日益被AI驱动的搜索生态中保持影响力与生存空间。用户则需主动培养辨别信息真伪和多元获取信息的能力,避免陷入人工智能衍生的"信息回音室"。综合来看,谷歌AI综述引用由AI生成网页内容的趋势及其带来的"蛇吃尾巴"现象,正是人工智能快速发展引发的信息生态重构的缩影。未来,维护信息透明度和多样化,防范模型崩溃风险,保障用户获得权威、客观和多元的信息,将是整个网络生态共同面对的重要课题。随着技术演进,搜索引擎和AI生活助手将如何平衡效率与真实性、开放与严谨,也将继续成为业界、学界和公众关注的焦点。 。