12 月 3 日消息,科技媒體 Ars Technica 昨日(12 月 2 日)發(fā)布博文,在一起由作家提起的集體訴訟中,美國(guó)法官命令 OpenAI 必須披露其刪除兩個(gè)盜版書籍?dāng)?shù)據(jù)集的內(nèi)部通信,而該案件可能因此迎來(lái)關(guān)鍵轉(zhuǎn)折。
該訴訟指控 OpenAI 非法使用盜版書籍訓(xùn)練 ChatGPT,而案件的核心焦點(diǎn)在于 OpenAI 在 2022 年 ChatGPT 發(fā)布前,刪除了名為“Books1”和“Books2”的兩個(gè)關(guān)鍵數(shù)據(jù)集。
OpenAI 聲稱刪除是因其“未使用”,但隨后又試圖將所有刪除理由都?xì)w為受“律師-客戶特權(quán)”保護(hù)的機(jī)密信息,這種前后矛盾的說(shuō)法引起了原告方的強(qiáng)烈質(zhì)疑。
美國(guó)治安法官 Ona Wang 對(duì) OpenAI 的做法提出了嚴(yán)厲批評(píng)。法官裁定,OpenAI 不能先提出一個(gè)公開理由(如“未使用”),然后在面臨質(zhì)詢時(shí)又聲稱該理由屬于特權(quán)信息。
她指出,OpenAI 的行為“令人難以置信”,并命令其必須在 12 月 8 日前,披露所有關(guān)于刪除數(shù)據(jù)集的內(nèi)部通信,包括與內(nèi)部律師的討論以及提及盜版書庫(kù) LibGen 的所有內(nèi)容。OpenAI 的內(nèi)部律師也必須在 12 月 19 日前接受質(zhì)詢。
如果法院最終認(rèn)定 OpenAI 存在“惡意侵權(quán)”行為,該公司可能面臨巨額賠償。根據(jù)美國(guó)版權(quán)法,對(duì)于惡意侵權(quán),每部被侵權(quán)作品的法定賠償金額最高可達(dá) 15 萬(wàn)美元(注:現(xiàn)匯率約合 106.2 萬(wàn)元人民幣)。
法官 Wang 強(qiáng)調(diào),OpenAI 一方面聲稱自己是“善意”行事,另一方面又試圖隱藏其決策過(guò)程,這種做法存在根本性沖突。陪審團(tuán)有權(quán)了解 OpenAI 聲稱的“善意”究竟基于何種事實(shí),而這些被隱藏的內(nèi)部信息,正是判斷其是否惡意侵權(quán)的關(guān)鍵。
法官 Wang 還特別指出,OpenAI 在辯護(hù)中曲解了另一起針對(duì) AI 公司 Anthropic 的判決,錯(cuò)誤地聲稱“為訓(xùn)練大語(yǔ)言模型而下載盜版書籍是合法的”。











