在AI技術的前沿探索中,阿里巴巴達摩院近期公布了一項名為“零搜索”的突破性技術,該技術有望徹底改變AI模型的訓練成本問題。5月7日,阿里巴巴達摩院在arXiv平臺上發布的一篇論文詳細闡述了這一創新。
據悉,“零搜索”技術通過模擬搜索引擎的訓練機制,使得大型AI模型無需依賴真實的搜索引擎API,即可自主發展出強大的檢索能力。這一技術的問世,打破了長久以來對科技巨頭API服務的依賴,為開發者提供了前所未有的數據質量控制手段。
阿里巴巴達摩院的研究團隊指出,“零搜索”技術已經面向公眾開源,代碼已上傳至GitHub和Hugging Face平臺,并支持包括Qwen-2.5、LLaMA-3.2在內的主流模型架構,既適用于基礎版模型,也適用于經過指令微調的版本。尤為初創企業僅需配備四塊A100顯卡,即可搭建起高精度訓練環境。
在綜合測評中,“零搜索”技術展現出了驚人的表現。研究團隊在NQ、TriviaQA、PopQA、HotpotQA等七大主流問答數據集上進行了測試,結果顯示,基于“零搜索”技術訓練的140億參數大模型,在搜索準確率上超越了谷歌,同時訓練成本降低了近九成。這一成績,無疑是對傳統AI訓練模式的一次重大顛覆。
具體成本節約方面,據VentureBeat報道,原本需要花費586.70美元(約合人民幣4240.74元)調用商業搜索引擎API的訓練任務,現在僅需70.80美元(約合人民幣510.17元)即可完成。這意味著,開發者可以節省高達88%的成本,同時獲得與商業搜索引擎相媲美甚至更優的檢索能力。
阿里巴巴的研究團隊進一步發現,經過海量預訓練的大型模型已經具備了生成擬真文檔的能力。通過監督微調,這些大語言模型可以被轉化為檢索模塊,按需生成相關或無關的文檔組合。在強化學習階段,系統通過逐步降低生成文檔質量的“教學策略”,迫使模型不斷優化檢索精度,從而形成一個自主進化的閉環。
在TriviaQA等七大主流問答數據集的測試中,“零搜索”技術展現出了強大的實力。基于通義千問2.5、LLaMA3.2等架構的模型在數學視覺推理測試中得分超過了OpenAI的模型,展現出了卓越的圖形與數學結合分析能力。特別是在事實準確性指標上,140億參數模型超越了谷歌搜索2.3個百分點,而70億參數模型則與商業搜索引擎持平。在相同的訓練量下,模擬方案較谷歌搜索API節省了88%的開支。
阿里巴巴達摩院的這一突破,不僅有望大幅降低AI模型的訓練成本,還可能對AI開發價值鏈產生深遠影響。隨著自模擬技術的不斷成熟,未來或將涌現出更多創新的AI訓練方案,推動整個產業進入低成本、自主進化的新階段。這一技術的問世,無疑為AI技術的未來發展開辟了新的道路。