近期,《紐約時報》對OpenAI提起的長期版權侵權官司迎來了關鍵轉折。據Ars Technica的最新報道,負責審理此案的聯邦法官已正式授權《紐約時報》及其聯合原告《紐約每日新聞》和調查報道中心,有權查閱OpenAI的用戶日志,甚至包括已被用戶刪除的內容,以全面核查版權被侵犯的具體情形。
《紐約時報》方面認為,部分ChatGPT用戶可能通過繞過其付費墻來獲取內容,并在事后刪除相關歷史記錄,因此有必要對OpenAI的數據進行全面覆蓋式的檢索。該報還強調,這些日志中可能隱藏的關鍵信息,將成為此次訴訟的重要證據,證明OpenAI的大型語言模型(LLM)不僅使用了其享有版權的材料進行訓練,還存在直接抄襲的行為。這項裁決在上個月發出,并在OpenAI嘗試上訴后,于本周得到了正式確認。
然而,OpenAI對此裁決表達了強烈的不滿。上個月,該公司聲稱這一命令將迫使其違背長期以來的隱私保護原則。在最新裁決公布后,OpenAI的一位發言人向Ars Technica透露,他們計劃繼續抗爭到底。
值得注意的是,這一裁決正值《紐約時報》等出版商與OpenAI就如何處理數據庫搜索問題進行協商之際。OpenAI在上個月的聲明中指出,該命令不僅涉及免費的ChatGPT日志,還涵蓋了使用其API的用戶的更敏感信息,但特別指出ChatGPT Enterprise和ChatGPT Edu(專為高校定制的模型)的日志不受限制。
除了版權侵權的證據搜集,OpenAI的用戶日志還可能成為證明ChatGPT通過在其聊天機器人中總結文章,從而稀釋新聞市場、影響媒體機構廣告收入的關鍵。據《福布斯》報道,今年早些時候,內容授權平臺TollBit發現,相比傳統搜索引擎,OpenAI、谷歌等公司的聊天機器人向出版商發送的流量減少了96%,這一趨勢已開始對新聞行業構成實質性損害。
在這場文字提供者與人工智能之間的較量中,市場稀釋的證據或許將成為版權持有者的有力武器。正如上個月一位法官在另一起涉及Anthropic的出版商訴訟中所言,這對任何試圖繞過付費墻的用戶來說,都將產生深遠的影響。