由兩屆普利策獎得主約翰·卡雷魯(John Carreyrou)領銜,數十位知名作家近日向美國加州北區地方法院提起集體訴訟,將OpenAI、谷歌、Meta、Anthropic、xAI與Perplexity AI六大AI公司列為共同被告,指控其系統性地使用盜版書籍訓練大模型,構成“故意版權侵權”。
若罪名成立,每部作品最高可索賠15萬美元,總賠償或達數十億乃至上百億美元。訴狀揭露,被告公司形成了一條清晰的侵權閉環:
- 盜版獲取:從LibGen、Z-Library等“影子圖書館”批量下載數百萬冊受版權保護的書籍(包括小説、非虛構作品、學術著作);
- 模型訓練:將這些非法數據用於訓練ChatGPT、Gemini、Claude等大模型;
- 商業變現:通過API訂閲、企業服務、廣告等模式獲利,卻未向原作者支付任何報酬。
原告方強調:“作家的文字是AI智慧的基石,卻成了免費燃料。”這些作品不僅賦予模型語言能力,更塑造其“知識深度”與“敍事風格”,是數十億美元AI生態的隱形支柱。
這並非AI公司首次陷入文字版權糾紛,但本案因原告權威性高、被告覆蓋全、侵權鏈條清晰而備受矚目。據南都數字經濟治理研究中心統計,OpenAI已面臨至少14起版權訴訟,是行業“被訴大户”。
而本案審理地——加州北區法院(舊金山)——目前已受理25起AI相關版權案,佔全美同類案件超50%,其判決結果或將確立AI訓練數據合法性的全國性先例。
被告公司此前多以“合理使用”(Fair Use)抗辯,主張AI訓練屬“轉化性使用”,不損害原作市場。但此次原告聚焦“盜版本質”——若訓練數據本身即非法獲取,則“合理使用”抗辯難以成立。法院若認定“故意侵權”,不僅賠償金額飆升,還可能強制AI公司清洗模型、刪除侵權數據,甚至暫停相關服務。