近期,人工智能領(lǐng)域的一起法庭案件引發(fā)了廣泛關(guān)注,焦點集中在Anthropic公司訓(xùn)練AI助手的方式上。據(jù)悉,該公司為了構(gòu)建其語言模型Claude,采取了極端的措施:購買并銷毀了數(shù)百萬本實體書籍。
案件細(xì)節(jié)顯示,Anthropic購買大量書籍后,通過撕毀裝訂線和掃描書頁的方式將它們數(shù)字化。這一過程不僅導(dǎo)致實體書籍的徹底毀壞,而且數(shù)字化的書籍也并未公開。然而,在法庭上,這一行為被法官視為合理的轉(zhuǎn)化使用,因此Anthropic在部分問題上獲得了勝訴。法官認(rèn)為,這種數(shù)字化處理符合版權(quán)法中的合理使用原則。
盡管如此,批評者依然對Anthropic的做法表示強烈質(zhì)疑。他們指出,盡管Claude能夠生成獨特內(nèi)容,但大型語言模型在訓(xùn)練過程中仍有可能逐字復(fù)制原文。Anthropic在法律上的部分勝利意味著,該公司能夠在不通知原出版商或作者的情況下,利用受版權(quán)保護的書籍訓(xùn)練AI模型。這一行為可能為生成式人工智能行業(yè)掃清了一大障礙,但也引發(fā)了關(guān)于版權(quán)保護的廣泛討論。
事實上,版權(quán)問題一直是生成式人工智能發(fā)展的痛點之一。有業(yè)內(nèi)人士表示,如果AI必須嚴(yán)格遵守版權(quán)法,整個行業(yè)可能會面臨崩潰的風(fēng)險。這是因為,開發(fā)大型語言模型需要龐大的數(shù)據(jù)集,而獲取這些數(shù)據(jù)往往困難重重。持續(xù)的版權(quán)糾紛更是給這一技術(shù)的發(fā)展帶來了巨大挑戰(zhàn)。
近期,一些知名公司也卷入了與AI相關(guān)的版權(quán)訴訟中。例如,Getty Images的首席執(zhí)行官承認(rèn),公司無法承擔(dān)所有與AI相關(guān)的版權(quán)侵權(quán)費用。同時,迪士尼對圖像生成公司Midjourney的訴訟也凸顯了圖像生成器復(fù)制受版權(quán)保護內(nèi)容的能力,這進一步加劇了業(yè)界對生成式人工智能未來發(fā)展的擔(dān)憂。
值得注意的是,盡管法官在部分問題上判決Anthropic勝訴,但該公司仍需在12月面臨版權(quán)審判。據(jù)稱,如果Anthropic被判侵權(quán),每部盜版作品可能面臨高達15萬美元的賠償金。這一潛在的巨額賠償無疑為生成式人工智能的未來增添了更多不確定性。