微软面临新版权诉讼：未经许可用盗版书训练 AI

每日AI快讯1年前 (2025)更新 AI部落小助手

近日，一起涉及人工智能训练数据版权问题的法律案件引发广泛关注。据路透社报道，多位知名作家已向纽约联邦法院提起诉讼，指控微软在训练其AI模型Megatron时未经授权使用了大量盗版图书。此次起诉的作家包括凯・伯德（ Kai Bird ）、贾・托连蒂诺（ Jia Tolentino ）以及丹尼尔・奥克伦特（ Daniel Okrent ）等，他们认为微软利用非法获取的电子书籍作为AI训练材料，侵犯了他们的著作权。

这起诉讼不仅针对微软，还牵涉到Meta、Anthropic和微软投资的OpenAI等多家科技公司。案件的核心焦点在于生成式AI在训练过程中是否可以合法使用受版权保护的。就在该诉讼提交前一日，加州一位联邦法官刚刚作出一项具有风向标意义的裁决：尽管某些AI对作品的使用可被视为“合理使用”，但如果使用的是盗版资源，则仍需承担法律责任。这也是美国首次就生成式AI是否能合法引用受版权保护做出正式司法裁定。

诉状中指出，微软在其AI训练中使用了一个包含近20万本盗版书籍的数据集。原告强调，这种行为严重依赖于创作者的智力成果，并使AI能够模仿原作的语言风格与结构输出文本，构成实质性侵权。作家们希望法院能发布禁令，阻止微软继续侵权，并要求每部作品赔偿最高15万美元（约合人民币107.6万元）的法定赔偿金。

对此，相关科技公司则坚持认为，其使用受版权属于“合理使用”范畴，目的是开发具有创新性和变革意义的人工智能技术。他们担忧，若必须为每一项训练素材支付授权费用，可能会极大限制AI技术的发展空间。然而，这场关于版权与技术创新之间界限的争论仍在持续发酵，或将对未来AI行业的合规发展产生深远影响。

AI训练数据, 版权侵权, 微软Megatron, 生成式AI, 合理使用原则

本文来源：