近年来,人工智能技术飞速发展,尤其是在自然语言处理和生成领域,AI模型的训练主要依赖于大量的文本数据。然而,数据获取的合法性和版权问题日益成为行业关注的焦点。2025年6月,英国广播公司BBC正式对美国AI初创企业Perplexity AI发出法律警告,指控该公司未经授权爬取并使用BBC内容训练其AI模型,侵犯版权并要求赔偿。此举标志着传统媒体在面对前沿技术挑战时,开始积极采取法律手段保护自身权益。BBC的这封法律信函直接指出,Perplexity AI的模型通过未经许可的方式获取了BBC的新闻内容,甚至部分内容被Perplexity AI的工具原文复制,这种行为不仅侵犯版权,也直接竞争并削弱了BBC自身服务的价值。BBC强调,AI公司应当在使用版权作品前获得许可,并通过许可协议支付相应的费用,以保障内容创作者的合法利益。
BBC此举并非孤例,今年10月,鲁伯特·默多克旗下的Dow Jones也对Perplexity AI提起诉讼,指控其大规模非法复制其内容,试图在法律层面遏制AI企业免费“搭便车”的行为。面对BBC的指责,Perplexity AI回应称BBC的指控是“操控性且机会主义的”,同时表示BBC对互联网技术和知识产权法律存在根本误解。值得注意的是,Perplexity AI与OpenAI、谷歌、Meta等大型AI公司不同,并不亲自构建或训练基础模型,而是提供用于访问这些模型的接口,使用者可选择不同基础模型进行查询。尽管如此,BBC认为其内容未经许可被爬取以及直接的内容复制已经构成严重侵权。另一方面,全球各大媒体和内容提供商正加快内容版权登记和登记路径建设,意图为自有内容建立更完善的法律保护屏障。BBC从2024年10月起开始在美国对其新闻网站内容进行版权登记,确保在该国法律框架下可以追究未经授权使用的责任,并寻求法定赔偿。
与此同时,英国政府也在探索AI与内容版权保护的相关立法方案。部分初步意见显示,目前英国倾向于默认AI公司可以采集内容,媒体机构需要选择“退出机制”以防止内容被爬取。此举遭到业内强烈反对,认为“一刀切”的默认采集权限将严重削弱英国价值超过1250亿英镑的创意产业的经济价值和持续创新动力。现实中,为维护版权,顶级媒体企业纷纷主动与AI巨头达成内容授权和许可协议。金融时报(Financial Times)、Axel Springer、Hearst和新闻集团(News Corporation)已分别与OpenAI达成合作。路透社与Meta签署内容许可协议,英国《每日邮报》母公司则与ProRata.ai建立了合作机制。
这些合作展示了行业通过商业谈判建立AI训练数据合法供应链的尝试,为版权保护和技术创新寻找平衡点。文化大臣Lisa Nandy日前强调,英国政府虽未确定具体版权法律方向,但承诺不会出台损害创意产业利益的政策,强调劳动党政府坚定支持创作者应得到合理报酬。BBC董事总经理Tim Davie也曾警告指出,若当前状况不加改善,整个版权环境将陷入危机,呼吁政府和业界迅速出台保护知识产权的实质性措施。他认为,国家核心价值和竞争力正依托于知识产权的保护,而版权授权制度是关键保障。然而,AI企业认为,过度严格的版权许可机制可能限制创新和技术发展,阻碍AI技术广泛应用及用户体验提升。他们主张,合理使用或公平使用原则应扩展到AI训练使用场景,避免给技术发展设限。
双方立场反映了技术进步与法律规则间的复杂博弈,也彰显了AI时代知识产权保护的新挑战。未来,随着AI技术进一步融入社会经济的各个领域,如何平衡内容创作者的权益保护与技术创新的发展需求,将成为全球媒体行业、法律界和政策制定者亟须解决的核心议题。监管机构需要制定科学合理的法律框架,既防止内容被非法剽窃和滥用,又鼓励开放数据和AI技术的健康成长。总结来看,BBC针对Perplexity AI发起的法律威胁不仅体现了媒体行业对版权保护的高度重视,也揭示了AI内容训练领域版权监管的复杂性。这场版权纠纷未来可能成为行业范例,推动全球范围内AI版权保护立法和实践的进一步完善。媒体公司应积极推进版权登记,完善内容授权机制,而AI企业则需正视版权合规问题,建立良性合作关系,实现技术创新与版权保护的双赢发展。
。