标签:AI训练数据
AI训练数据版权争议不断:如何通过数据清洗与合规实现合理使用原则?
AI训练数据的灰色地带:版权争议背后的真相 近年来,随着人工智能大模型的快速发展,其背后的训练数据来源问题逐渐浮出水面。尽管AI技术在不断突破,但其核心“秘密配方”却并不神秘——大量未经授权的网络。这一现象在业内早已不是秘密,但却引发了愈演愈烈的法律争议。 2023年,《纽约时报》将OpenAI和微软告上法庭,成为AI版权战争的导火索。随后,Meta、Anthropic等科技巨头也相继卷入诉讼风波,原因均指向其AI模型训练数据中可能包含大量受版权保护的。 AI训练数据的合法性边界:变革性使用还是侵权盗用? 目前,围绕AI...
微软面临新版权诉讼:未经许可用盗版书训练 AI
近日,一起涉及人工智能训练数据版权问题的法律案件引发广泛关注。据路透社报道,多位知名作家已向纽约联邦法院提起诉讼,指控微软在训练其AI模型Megatron时未经授权使用了大量盗版图书。此次起诉的作家包括凯・伯德( Kai Bird )、贾・托连蒂诺( Jia Tolentino )以及丹尼尔・奥克伦特( Daniel Okrent )等,他们认为微软利用非法获取的电子书籍作为AI训练材料,侵犯了他们的著作权。 这起诉讼不仅针对微软,还牵涉到Meta、Anthropic和微软投资的OpenAI等多家科技公司。案件的核心焦点在于生成式AI在训练过程中是否可以...