标签：AI训练数据

AI训练数据版权争议不断：如何通过数据清洗与合规实现合理使用原则？

AI训练数据的灰色地带：版权争议背后的真相近年来，随着人工智能大模型的快速发展，其背后的训练数据来源问题逐渐浮出水面。尽管AI技术在不断突破，但其核心“秘密配方”却并不神秘——大量未经授权的网络。这一现象在业内早已不是秘密，但却引发了愈演愈烈的法律争议。 2023年，《纽约时报》将OpenAI和微软告上法庭，成为AI版权战争的导火索。随后，Meta、Anthropic等科技巨头也相继卷入诉讼风波，原因均指向其AI模型训练数据中可能包含大量受版权保护的。 AI训练数据的合法性边界：变革性使用还是侵权盗用？目前，围绕AI...

来源：

硅星人Pro公众号【阅读原文】 Tags：AI训练数据数据合规数据清洗

11个月前

微软面临新版权诉讼：未经许可用盗版书训练 AI

近日，一起涉及人工智能训练数据版权问题的法律案件引发广泛关注。据路透社报道，多位知名作家已向纽约联邦法院提起诉讼，指控微软在训练其AI模型Megatron时未经授权使用了大量盗版图书。此次起诉的作家包括凯・伯德（ Kai Bird ）、贾・托连蒂诺（ Jia Tolentino ）以及丹尼尔・奥克伦特（ Daniel Okrent ）等，他们认为微软利用非法获取的电子书籍作为AI训练材料，侵犯了他们的著作权。这起诉讼不仅针对微软，还牵涉到Meta、Anthropic和微软投资的OpenAI等多家科技公司。案件的核心焦点在于生成式AI在训练过程中是否可以...

来源：

IT之家【阅读原文】
Tags：AI训练数据人工智能微软微软Megatron 版权侵权生成式AI

1年前 (2025)