随着人工智能技术的飞速发展,大型语言模型(LLM)逐渐成为自然语言处理领域的关键技术。近日,瑞士联邦理工学院(EPFL)、苏黎世联邦理工大学(ETH Zurich)以及瑞士国家超级计算中心(CSCS)联合推出了Apertus - - 一个完全开源、透明且支持多语言的语言模型,为推动AI的公开、可信和包容性树立了标杆。Apertus一词源自拉丁语"开放",其名字寓意着项目对开发过程、模型结构、训练数据及权重的完全公开,使研究人员、开发者乃至企业能够自由使用、改进和定制,极大地促进了AI产业的创新与繁荣。Apertus项目的推出不仅展现了瑞士在人工智能领域的领先地位,也为全球AI生态系统带来了更多公平、透明与可持续的可能性。公开透明是Apertus的核心理念。从模型架构设计、训练数据来源,到权重发布和训练流程,每一步均有详尽文档和源码支持,保障了全流程的可复现性和审计便捷性。
与许多只开放部分组件的模型不同,Apertus力求呈现完整开放图景,降低了使用门槛和开发壁垒,极大促进了学术界与工业界合作研究。此外,Apertus严格遵循瑞士数据保护法律、版权法规以及欧盟的AI法规要求,其训练数据严选自公开来源,并细致过滤掉个人敏感信息与拒用标识内容,体现了高度的数据伦理和法律合规意识。从模型规模来看,Apertus提供了参数量约为80亿和700亿两款版本,满足不同用户群体的需求。较小的模型适合个人或小型研究使用,而大型模型则可支持复杂且资源密集型的企业级应用,并具备出色的多语言理解与生成能力。Apertus特别强调其多语言能力,训练数据涵盖超过1000种语言,其中约40%为非英语语言,涵盖了瑞士德语、罗曼什语等在其他主流大型语言模型中鲜有支持的语种。这不仅保证了模型在全球范围内的适用性,也彰显了项目包容多元文化、促进语言平等的社会责任感。
作为AI应用的基础设施,Apertus为聊天机器人、机器翻译系统和教育工具等多样化场景提供了可靠支撑,其开源许可赋予了教育机构、研究人员乃至商业机构灵活应用的权利,不受限制地推动AI技术普及和产业落地。瑞士通讯巨头Swisscom作为Apertus的战略合作伙伴,已经通过其主权AI平台为企业客户提供访问服务,并将在即将举行的Swiss {ai} Weeks黑客松中开放模型测试接口,促使开发者深度体验和反馈模型性能,助力Apertus未来版本的持续迭代与完善。技术创新和数字主权的双重目标贯穿Apertus项目始终。EPFL、ETH Zurich及CSCS不仅贡献了尖端算法和训练基础设施,更将AI视为公共基础设施,类似高速公路、水电系统,强调AI技术对社会公共利益的服务。在AI治理日益重要的当下,Apertus体现了可信赖且自主可控的AI发展范式。在未来规划中,Apertus团队将扩展模型家族,提升效率,探索法律、气候、医疗和教育等专业领域的定制化应用,进一步整合多模态能力,努力保持透明和合规的高标准。
通过这些持续投入,Apertus预计将成为引领全球开放AI生态的重要力量。拥有完整开放源码的Apertus,为AI领域的公平性与创新注入新的活力。大众、学术界与企业皆可围绕该模型展开定制和创新,避免"黑箱"模型引发的信任危机。加之多语种覆盖和合规设计,Apertus为不同社会群体提供了平等参与AI发展的桥梁。尤其是在欧洲数字主权的战略背景下,Apertus树立了由公共机构主导、服务公共利益的AI范式范例,激励更多国家和组织探索类似路径。总的来说,Apertus不仅是技术上的突破,更是AI开放生态和可信架构的先行者。
它的发布标志着一个长期承诺的开始,即建设透明、主权和包容的人工智能基础,让AI真正为全球大众带来福祉。随着社区的加入和不断发展,相信Apertus将持续推动AI技术与社会的深度融合,引领未来人工智能的可持续进步。 。