近年来,人工智能技术飞速发展,尤其是大型语言模型的出现,推动了自然语言处理和智能应用的革命。然而,伴随着AI训练数据需求的激增,版权争议也逐渐浮出水面。美国AI企业Anthropic近期爆发了一场涉及盗版训练材料的重大版权诉讼,备受业内关注。关于Anthropic支付15亿美元与作者达成和解的消息,不仅在版权界引发了热议,也让广大创作者对自身权益的保护充满期待。 Anthropic的这起版权诉讼源于其在训练大型语言模型时,未经授权大量使用了来自LibGen和PiLiMi的盗版电子书。这些作品涉及众多作者和出版商,覆盖了数百万本书籍的数字版本。
诉讼由现实主义非虚构作家Charles Graeber、Kirk Wallace Johnson和惊悚小说作家Andrea Bartz等人发起,代表了广大受影响作者的利益。 案件进展经历了多个阶段。2025年6月,美国加州北区联邦地方法院法官William Alsup就公平使用原则做出部分裁定。他认可通过合法渠道获得的书籍用于AI训练可视为公平使用,但否定了盗版书籍的使用属于公平使用范畴。法官明确指出盗版行为不被保护,随即安排了12月1日的审判以评估Anthropic在盗版部分的责任。 随后,在法院的安排下,原告成功将包括所有从LibGen和PiLiMi中被下载的书籍权利所有者组成了一个版权维权集体,涵盖了版权注册合规且拥有ISBN或ASIN编码的作品。
然而,法官只认可了针对盗版行为的集体诉讼资格,针对AI训练本身的公平使用判决,仅适用于三位原告本人。这一细节体现了法院在版权保护与技术创新之间的复杂平衡。 经过专业第三方中介的调解,双方最终达成了一项具有里程碑意义的和解协议,Anthropic同意支付高达15亿美元的赔偿金。法官Alsup于2025年9月25日对协议进行了预审批准,标志着诉讼进入最后阶段。此项巨额赔偿不仅体现了版权持有人维权力量的提升,也反映了AI行业对版权合规的日益重视。 和解协议明确指出,约有50万本书籍符合集体诉讼资格,这些作品从总共700万被下载的盗版书籍中筛选出来。
最终每本作品大致可获得约3000美元的赔偿,扣除管理和律师费用后分配给作者及出版商。如果作品属于教育教材类别或版权有特殊归属情况,赔偿分配则可根据具体合同条款调整。 权利持有人需要通过专门的和解网站查询适用作品目录,确认自身作品是否包含其中。若确认作品列入,作者可以提交索赔表单,核实身份、版权份额,并选择适合的支付方式。著作权归属单一的作者,如自出版或版权已回归作者,则可获得全部赔偿份额。对合同中版权归属有争议的,则设立专门审裁机制解决分成纠纷。
和解还设计了灵活的退出机制,让作者能够选择不参与和保留独立诉讼权利。 这场版权诉讼和和解事件意义深远,既拓展了版权法在AI时代的新边界,也为全球AI训练数据使用建立了先例。对广大作者来说,这是一场关于尊重原创内容价值和版权保护效果的胜利。对于人工智能企业而言,则是肩负起合法合理利用版权资源责任的重要警示。 未来,随着生成式人工智能技术的不断普及,版权争议极有可能成为行业常态。各方亟需探索更加完善的版权许可和数据获取模式,兼顾创新推进与知识产权保护。
同时,作者团体和行业协会的介入,将为建立良性生态发挥关键作用。 Anthropic赔偿15亿美元和解案为AI训练版权议题提供了宝贵经验,也昭示了技术发展必须与法律规范同步的必要性。在版权保护意识日益增强的背景下,规范化的数据使用路径和透明的赔偿机制将成为未来人工智能行业的标配。所有内容创造者和技术开发者,应当以此为镜,积极推动版权合规体系建设,共同促进数字时代的健康可持续发展。 。