我不久前遇到了一种理论,尽管 Llama 许可证实际上不符合开源定义的条款,但 Meta 坚持为其 Llama 模型使用“开源”一词的原因之一是,欧盟的人工智能法案包含针对开源模型的特殊规则,而不要求遵守 OSI。
由于欧盟人工智能法案(2024 年 7 月 12 日)可在网上获取,我决定亲自查看一下。
这是一个巨大的 HTML 页面,其中包含该法案的英文全文。我使用ttok检查了令牌计数(它使用 OpenAI 令牌生成器,但它足够接近,可以作为其他模型的良好估计):
卷曲' https://eur-lex.europa.eu/legal-content/EN/TXT/HTML/?uri=OJ:L_202401689 ' |托克
241,722 个代币。这应该非常适合Gemini 2.5 Flash (或 GPT-4.1 或 Gemini 2.5 Pro)。
我的 Gemini API 密钥正在发挥作用,因此我通过OpenRouter (和llm-openrouter )运行它:
llm -f ' https://eur-lex.europa.eu/legal-content/EN/TXT/HTML/?uri=OJ:L_202401689 ' \ -m openrouter/google/gemini-2.5-flash-preview:思考 \ -s '此处提及开源的摘要,包括文档定义开源的含义'
这是完整的答案。相关摘录:
- Recital (89) 指出,在免费和开源许可下提供可访问的“工具、服务、流程或除通用人工智能模型之外的人工智能组件”的第三方不应被强制要求遵守上游提供商对集成者的责任。它还鼓励此类资源的开发人员实施模型卡和数据表等文档实践,以促进值得信赖的人工智能。
- Recital (102) 承认,在免费开源许可下发布的软件和数据(包括模型)可以促进研究和创新并提供增长机会。
我找到了独奏会 89和独奏会 102进行检查。果然,89 说道:
不应强制要求第三方向公共工具、服务、流程或通用人工智能模型以外的人工智能组件提供访问权限,以遵守针对人工智能价值链责任的要求
在 102 中:
应考虑在免费和开源许可下发布的通用人工智能模型,以确保其参数(包括权重、模型架构信息和模型使用信息)公开,以确保高度的透明度和开放性。当许可证允许用户运行、复制、分发、研究、更改和改进软件和数据(包括模型)时,该许可证也应被视为免费和开源,但前提是要注明模型的原始提供商,并遵守相同或类似的分发条款。
Gemini 2.5 Flash 还向我指出了第 2(12) 条,内容如下:
12.本条例不适用于根据免费和开源许可发布的人工智能系统,除非它们作为高风险人工智能系统或属于第5条或第50条规定的人工智能系统投放市场或投入使用。
我问了一个后续问题:
llm -c '所以它说的是特定许可证,但它是否澄清了哪些特定许可证重要? '
并得到了这样的回应:
不,该文档没有列出符合“免费和开源”资格的许可证的具体名称。
该法规没有列出名称(如 GPL、MIT、Apache 等),而是定义了许可证必须授予哪些条款才能将其视为“自由和开源”,以实现该法规的目的。
根据 Recital (102),此类许可证本质上必须允许软件和数据(包括模型):
- 公开分享。
- 用户可以自由访问、使用、修改和重新分发它们或其修改版本。
说明会进一步澄清,即使许可证包含要求归属(注明原始提供者)或尊重相同或类似的分发条款等标准条件,它仍然可以被视为免费和开源。
显然我不是律师,但基于上述内容,我确实发现 Meta 在围绕 Llama 的营销中使用“开源”的理论是可信的,部分原因是欧盟人工智能法案对“开源”模型有特殊豁免,而这些模型与 OSI 对该术语的定义无关。
使用 Gemini 2.5 Flash 的总成本是多少?第一个问题 5.1 美分,后续问题 4.3 美分。第二个问题更便宜,尽管它建立在第一个问题的基础上,因为输出代币比输入代币更昂贵,而且第二个答案比第一个答案短——使用“思考”模型,输出的收费为 3.50 美元/百万代币,输入仅为 0.15 美元/百万。
使用法学硕士作为律师显然是一个糟糕的主意,但使用法学硕士来仔细研究一份巨大的法律文件并对其内容形成一个非常粗略的外行理解对我来说感觉非常好。
标签:元、人工智能伦理、开源、生成人工智能、美洲驼、人工智能、 llms 、 openrouter 、长上下文、 gemini 、 llm
原文: https://simonwillison.net/2025/Apr/19/llama-eu-ai-act/#atom-everything