近日,一起涉及人工智能训练数据版权问题的法律案件引发广泛关注。据路透社报道,多位知名作家已向纽约联邦法院提起诉讼,指控微软在训练其AI模型Megatron时未经授权使用了大量盗版图书。此次起诉的作家包括凯・伯德( Kai Bird )、贾・托连蒂诺( Jia Tolentino )以及丹尼尔・奥克伦特( Daniel Okrent )等,他们认为微软利用非法获取的电子书籍作为AI训练材料,侵犯了他们的著作权。
这起诉讼不仅针对微软,还牵涉到Meta、Anthropic和微软投资的OpenAI等多家科技公司。案件的核心焦点在于生成式AI在训练过程中是否可以合法使用受版权保护的。就在该诉讼提交前一日,加州一位联邦法官刚刚作出一项具有风向标意义的裁决:尽管某些AI对作品的使用可被视为“合理使用”,但如果使用的是盗版资源,则仍需承担法律责任。这也是美国首次就生成式AI是否能合法引用受版权保护做出正式司法裁定。
诉状中指出,微软在其AI训练中使用了一个包含近20万本盗版书籍的数据集。原告强调,这种行为严重依赖于创作者的智力成果,并使AI能够模仿原作的语言风格与结构输出文本,构成实质性侵权。作家们希望法院能发布禁令,阻止微软继续侵权,并要求每部作品赔偿最高15万美元(约合人民币107.6万元)的法定赔偿金。
对此,相关科技公司则坚持认为,其使用受版权属于“合理使用”范畴,目的是开发具有创新性和变革意义的人工智能技术。他们担忧,若必须为每一项训练素材支付授权费用,可能会极大限制AI技术的发展空间。然而,这场关于版权与技术创新之间界限的争论仍在持续发酵,或将对未来AI行业的合规发展产生深远影响。
AI训练数据, 版权侵权, 微软Megatron, 生成式AI, 合理使用原则
本文来源:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...