随着人工智能技术的迅速发展,大型语言模型的训练对海量数据的依赖日益显著。如何合法使用这些数据,特别是涉及受到版权保护的书籍、艺术作品等,成为全球科技企业和版权持有者争议的焦点。2025年6月,美国联邦法官William Alsup在Bart v. Anthropic一案中作出重要裁决,首次明确认定Anthropic未经作者许可使用已出版的书籍训练其AI模型的行为构成合理使用(fair use),此判决为人工智能训练数据版权问题开辟了新的法律路径。判决的核心在于合理使用条款,这是美国版权法中一个自1976年以来几乎未作重大修改的重要条文,用以平衡版权保护与社会公众利益之间的关系。法官Alsup认为,Anthropic的行为符合合理使用的定义,尤其在变革性使用(transformative use)方面。也就是说,虽然Anthropic利用了受版权保护的书籍内容,但其目的并不是直接复制书籍的商业价值,而是通过这些内容训练模型,从而生成具有新创意、功能和用途的人工智能工具。
这样的使用被视为对原作的创新性转化,超出了单纯的复制范畴。与此同时,判决对AI训练数据的获取方式也保持了谨慎态度。诉讼中,原告指出Anthropic曾通过非法渠道——即盗版网站下载了大量书籍,并计划建立所谓的“世界所有书籍”的中央数据库永久保存这些内容。法官明令对此行为另案审理,强调盗版行为本身存在侵权责任,即便之后Anthropic购买了正版书籍,也无法免除先前非法下载带来的法律后果。这一细节反映了尽管AI训练用途获得部分司法认可,但数据采集是否合法依旧是版权争议的关键问题,技术公司不能仅依赖合理使用辩护逃避对盗版行为的追责。此判决对版权持有人造成一定压力,因为越来越多的作者、艺术家及出版机构对AI企业未经授权广泛使用其作品表示强烈反对。
包括OpenAI、Meta、Google在内的多家科技巨头均面临类似诉讼,版权方要求明确保护版权收益及作品控制权。法官Alsup的判决虽不保证所有法院都会采纳一致观点,但为AI企业的合理使用抗辩树立了先例,可能将逐步影响更多案件的走向。合理使用判定历来依赖对使用目的、作品性质、使用比例及对市场影响等因素的综合评估。人工智能模型训练作为相对新颖的使用形式,其商业和社会价值、变革性强于传统复制,令司法认定复杂且充满挑战。此次判决在一定程度上承认了AI训练带来的新形势,体现司法对技术发展适应性的提升。此外,判决也提醒业界重视合规的数据获取流程。
人工智能企业需建立合法稳定的版权授权机制,避免因版权纠纷拖累技术进步。与此同时,版权方也应积极探索与技术公司的合作模式,实现内容价值的共享和增值。面对人工智能训练版权问题的法律真空,各方呼吁对版权法进行现代化修订,使其与数字化时代相适应,加强对人工智能等新兴技术的法律指导。包括明确AI训练数据范围、合理使用标准及赔偿机制等,有助于减少诉讼,促进创新与版权保护的平衡。综上所述,联邦法官William Alsup关于Anthropic使用图书训练AI的判决,是版权与人工智能领域的标志性案例。它不仅影响当前多起相关诉讼的走向,更为全球法律界如何审视AI训练数据的版权关系提供了重要参考。
随着人工智能技术不断进步,版权保护与技术创新的博弈将持续展开,期待未来法律体系在保障创作者权益与推动科技发展的双重目标中实现和谐共赢。