日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

AI訓練數據獲取新探索:Anthropic拆書引熱議,法律裁定成焦點

   時間:2025-06-26 09:39:53 來源:ITBEAR編輯:快訊團隊 IP:北京 發表評論無障礙通道

近期,人工智能領域的巨頭Anthropic以一種前所未有的方式引發了公眾和法律界的廣泛關注。據悉,該公司斥資數百萬美元,購買了大量圖書,但其目的并非收藏或出版,而是為了拆解這些書籍,將其轉化為訓練AI助手的寶貴數據。

據外媒Ars Technica深入報道,Anthropic在獲取訓練數據的策略上采取了頗具爭議的手段。他們選擇將實體書籍進行拆解、掃描,并在掃描完成后立即銷毀原件。這一做法的細節在法庭文件中得以曝光,并引發了法律界的廣泛討論。然而,法官William Alsup對此做出了“合理使用”的裁定,理由在于Anthropic所購買的書籍均通過合法渠道獲取,且掃描后的數字文件僅供內部使用,并未對外泄露。

Anthropic的這一舉措背后,是對谷歌書籍項目成功經驗的借鑒。公司CEO阿莫代伊透露,在項目初期,團隊曾考慮過使用盜版電子書作為訓練數據,但出于法律風險的考量,最終決定通過購買二手書籍的方式來確保數據的質量和合法性。通過“破壞式掃描”,Anthropic得以快速高效地將書籍轉化為PDF格式,為AI模型的訓練提供了充足的數據資源。

值得注意的是,盡管非破壞性掃描技術已經相當成熟,并被多家機構所采用,如Internet Archive便開發出能夠保留原書的數字化方式,OpenAI和微軟也與哈佛大學圖書館合作,計劃數字化近百萬本公版書籍,確保書籍原版得到妥善保存。相比之下,Anthropic的做法顯得更為激進,無疑為AI訓練領域帶來了新的思考角度。

隨著人工智能技術的不斷發展,如何在尊重知識產權的前提下獲取訓練數據,成為了業界亟待解決的問題。Anthropic的這一嘗試,盡管在公眾和法律界引發了廣泛爭議,但也為未來的AI發展提供了新的方向和可能性,引發了業界對于數據獲取方式的深入思考和探討。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內容
 
主站蜘蛛池模板: 池州市| 德阳市| 望都县| 满洲里市| 安阳市| 伽师县| 美姑县| 宜州市| 安徽省| 兴山县| 普兰店市| 苍南县| 镇沅| 宁强县| 建瓯市| 贺兰县| 三原县| 黎城县| 陆良县| 莱州市| 罗江县| 永靖县| 和静县| 凌源市| 株洲市| 崇阳县| 渝中区| 新巴尔虎右旗| 海丰县| 鞍山市| 林芝县| 年辖:市辖区| 新宾| 安阳市| 扎鲁特旗| 西藏| 沁水县| 灵山县| 泾源县| 且末县| 青铜峡市|