日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

阿里“零搜索”技術革新AI訓練,成本大降八成,精度超越谷歌

   時間:2025-05-09 22:02:53 來源:ITBEAR編輯:快訊團隊 發表評論無障礙通道

在AI技術的前沿探索中,阿里巴巴達摩院近期公布了一項名為“零搜索”的突破性技術,該技術有望徹底改變AI模型的訓練成本問題。5月7日,阿里巴巴達摩院在arXiv平臺上發布的一篇論文詳細闡述了這一創新。

據悉,“零搜索”技術通過模擬搜索引擎的訓練機制,使得大型AI模型無需依賴真實的搜索引擎API,即可自主發展出強大的檢索能力。這一技術的問世,打破了長久以來對科技巨頭API服務的依賴,為開發者提供了前所未有的數據質量控制手段。

阿里巴巴達摩院的研究團隊指出,“零搜索”技術已經面向公眾開源,代碼已上傳至GitHub和Hugging Face平臺,并支持包括Qwen-2.5、LLaMA-3.2在內的主流模型架構,既適用于基礎版模型,也適用于經過指令微調的版本。尤為初創企業僅需配備四塊A100顯卡,即可搭建起高精度訓練環境。

在綜合測評中,“零搜索”技術展現出了驚人的表現。研究團隊在NQ、TriviaQA、PopQA、HotpotQA等七大主流問答數據集上進行了測試,結果顯示,基于“零搜索”技術訓練的140億參數大模型,在搜索準確率上超越了谷歌,同時訓練成本降低了近九成。這一成績,無疑是對傳統AI訓練模式的一次重大顛覆。

具體成本節約方面,據VentureBeat報道,原本需要花費586.70美元(約合人民幣4240.74元)調用商業搜索引擎API的訓練任務,現在僅需70.80美元(約合人民幣510.17元)即可完成。這意味著,開發者可以節省高達88%的成本,同時獲得與商業搜索引擎相媲美甚至更優的檢索能力。

阿里巴巴的研究團隊進一步發現,經過海量預訓練的大型模型已經具備了生成擬真文檔的能力。通過監督微調,這些大語言模型可以被轉化為檢索模塊,按需生成相關或無關的文檔組合。在強化學習階段,系統通過逐步降低生成文檔質量的“教學策略”,迫使模型不斷優化檢索精度,從而形成一個自主進化的閉環。

在TriviaQA等七大主流問答數據集的測試中,“零搜索”技術展現出了強大的實力。基于通義千問2.5、LLaMA3.2等架構的模型在數學視覺推理測試中得分超過了OpenAI的模型,展現出了卓越的圖形與數學結合分析能力。特別是在事實準確性指標上,140億參數模型超越了谷歌搜索2.3個百分點,而70億參數模型則與商業搜索引擎持平。在相同的訓練量下,模擬方案較谷歌搜索API節省了88%的開支。

阿里巴巴達摩院的這一突破,不僅有望大幅降低AI模型的訓練成本,還可能對AI開發價值鏈產生深遠影響。隨著自模擬技術的不斷成熟,未來或將涌現出更多創新的AI訓練方案,推動整個產業進入低成本、自主進化的新階段。這一技術的問世,無疑為AI技術的未來發展開辟了新的道路。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  RSS訂閱  |  開放轉載  |  滾動資訊  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 杭锦旗| 泽库县| 宁安市| 台中县| 宜昌市| 永嘉县| 云阳县| 三都| 英超| 大港区| 卓尼县| 峨山| 博野县| 论坛| 开鲁县| 永城市| 元江| 南汇区| 和田市| 固始县| 汉沽区| 河北区| 威宁| 根河市| 绿春县| 安西县| 贵阳市| 临沧市| 吉隆县| 宜宾市| 革吉县| 石门县| 虎林市| 磴口县| 栖霞市| 宁国市| 万源市| 什邡市| 兴仁县| 义马市| 华亭县|