近年来,人工智能领域的迅速发展使得开源模型与数据的需求日益增长,但要实现真正意义上的开放AI,还面临诸多法律与技术挑战。2025年5月,由Linux基金会携手亚马逊、Meta、IBM和微软等多家重量级企业联合发布的Open模型定义及权重许可证版本1.0,简称OpenMDW-1.0,应运而生。该许可证试图打破传统软件许可证范畴,涵盖AI模型的所有相关组成部分,包括模型架构、训练数据、参数权重以及相关文档,赋予使用者几乎无限制的使用权。本文将深入解析OpenMDW许可证的结构和内容,比较其与传统开源许可证的异同,并探讨其中潜藏的法律模糊地带及其对AI开源社区的长远影响。OpenMDW是否能称为真正的开源许可证?这一问题是业内关注的核心。OpenMDW继承并融合了MIT授权和Apache-2.0授权的许多精髓,采取了一种宽松的许可证策略。
它明确满足开源定义中关于自由再分发、提供源码以及自由衍生的基本准则,且未针对任何使用者群体或特定技术设置门槛。至2025年7月13日,虽然尚未提交开源倡议组织(OSI)审核,但基于目前条款来看,OpenMDW极有可能被认定为开源许可证。其许可条款核心在于,允许用户按协议自由处理包括版权、专利、数据库权利和商业秘密在内的“模型材料”,这涵盖了完整的AI模型及其相关内容。相较于MIT许可证默示授权的方式,OpenMDW明确将各种权利纳入授予范围,防止了一些法律上的技术性漏洞,比如模型中的理念和算法可能被排除授权的争议。OpenMDW的设计注重简洁,却不失全面。它要求在再分发时保留许可证文本和版权或来源声明,确保用户能追溯模型的由来和贡献者。
这一点呼应了AI模型构成多样、组成复杂的特点,体现了许可证在适配AI系统时的贴心设计。另一方面,OpenMDW还设有类似Apache-2.0的专利保护条款,但对专利诉讼行为的界定更加宽泛,不仅涵盖提起诉讼的主体,还包括参与诉讼的各方,且不局限于直接侵权,而是扩展至间接侵权,意在最大程度遏制专利争端。同时,OpenMDW明确指出对AI生成输出不施加任何限制或义务,这推动了模型输出的自由利用,且避免了某些知名模型许可证对输出内容的“传染性”控制,为终端用户带来了更大信心。不过,OpenMDW亦非无懈可击。其最大的争议在于包括商业秘密权利的授予。商业秘密法律的核心是“秘密性”,分布于公共领域的信息无法享受商业秘密保护。
OpenMDW将商业秘密纳入许可范畴,表面上有助于消除权利障碍,旨在防止模型提供方事后反悔针对某些算法或技术细节主张权利,但这在不同司法辖区中存在法律适用上的不确定性,且可能引发对商业秘密定义的法律测试和解释分歧。此外,OpenMDW对专利诉讼采取的严苛态度虽有利于保护模型提供方,却令使用者面对较高的法律风险,特别是大型企业可能因其复杂的业务布局而难以轻易接受这类严厉的禁令条款。由于涉及模型权利、数据版权及专利风险,OpenMDW把对第三方权利的清查与许可获取义务明确交由用户承担,这既实事求是,也让中小用户面临沉重的合规负担。尤其是训练数据经常来自多方,权利链条冗长复杂,用户如果缺乏完善的审核机制,极易陷入版权纠纷。对比之下,Creative Commons(CC)系列许可证作为数据领域事实上的标准,其对于数据库权利和使用规范处理更为成熟合理,OpenMDW则在数据许可方面表现平平,甚至有过度适用专利反击条款的风险,不适合将其作为首选数据许可证。更值得关注的是,OpenMDW一旦被大量采用,可能带来市场上的“开放洗牌”(Openwashing)现象。
某些模型供应商仅将少量无关紧要或非关键的数据集附带开放发布,即可宣称模型完全基于开放许可,实则隐藏真正核心部分,掩盖数据或模型的封闭性。如此一来,开源品牌的信誉将面临重大挑战,尤其是其所代表的自由、透明、协作与信任精神恐遭侵蚀。Linux基金会至今未提交OpenMDW审批或许正是出于对此潜在影响的权衡。综观全局,OpenMDW作为首个全面适用于AI生态的开源许可证,突破了传统软件许可的局限,明确授权范围,设定了创新的专利保护机制,且对AI输出给予了空前自由度,具有明显的开创价值。它为模型开发者提供了简洁明了且适用范围覆盖广泛的法律基础,有助于推动实现真正意义上的开放AI系统。但考虑到商业秘密权利的包容、专利条款的严苛和对用户审查义务的强化,用户尤其是中小型开发者应谨慎评估适用场景。
理想的做法仍是将训练数据和模型代码分开许可,模型采用类似OpenMDW的许可证,而数据依据具体需求采用CC系列许可证,形成相辅相成的组合。OpenMDW更适用于那些需要严密专利保护、需保持模型和数据统一管理的特殊领域,如生物医药基因、半导体设计等高风险诉讼行业,或是模型参数及数据紧密依赖需确保可重复性的科研场景。未来,开源及AI社区需继续推动对“源码定义”的拓展,即不仅涵盖推理代码,也应包含训练数据及训练流程,以保障模型完整性与可验证性。同时,开源许可证社区应警惕开源洗牌现象,加强解释与监管,维护开源精神的纯粹性。总而言之,OpenMDW是一次重要的许可革新,契合了AI时代对法律框架的迫切需求。它既可能掀起AI开源领域的革命,也需警惕对传统开源价值的冲击。
全行业应理性看待,充分沟通法律多元性,携手推动更加透明、可信且包容的人工智能生态建设。