OpenAI 意外刪除了《紐約時報》版權訴訟案中的潛在證據

OpenAI 可能意外刪除了與其正在進行的相關的重要數據帶來的紐約時報

最早報道者TechCrunch, 顧問時代及其共同原告每日新聞發送了一個向負責此案的法官詳細說明了「專家和律師整整一周的工作」如何「無可挽回地損失」。 OpenAI 向原告提供了兩台專用虛擬機,用於研究涉嫌侵犯版權的案例。信中稱,11 月 14 日,“OpenAI 工程師刪除了其中一台專用虛擬機上儲存的程式和搜尋結果資料。”

時代指控 OpenAI 以及微軟在其 Bing AI 聊天機器人中使用 OpenAI 的模型,透過在付費和未經授權的內容上訓練其模型來侵犯版權。該訴訟詳細說明了“近乎逐字紀錄「複製 ChatGPT 的回應。OpenAI 駁斥了這一說法,稱他們的模型是根據公開數據進行訓練的,因此根據版權法合理使用。此案取決於時代能夠證明 OpenAI 的模型在沒有補償或信用的情況下複製和使用其內容。

可混搭光速

OpenAI 能夠恢復大部分被刪除的數據,但作品的「資料夾結構和檔案名稱」無法恢復,導致資料無法使用。現在,原告律師必須從頭開始收集證據。在信中,律師確認“沒有理由相信[刪除]是故意的”,但也指出“OpenAI 處於搜尋自己資料集的最佳位置”。這家人工智慧公司避免分享有關其訓練資料的任何細節。

其他類似已針對 OpenAI 提起訴訟。但一個來自 Raw Story 和 AlterNet 最近被解僱因為原告無法證明足夠的損害來支持他們的主張。同時,OpenAI 已與多家媒體公司達成許可協議,利用他們的工作進行培訓並提供帶有引用的 ChatGPT 回應。近日,《廣告週刊》報道OpenAI 每年向出版巨頭 Dotdash Meredith 支付至少 1,600 萬美元以獲取其內容許可。