螞蟻集團(tuán)近日在人工智能領(lǐng)域取得重要進(jìn)展,正式對外開源其自主研發(fā)的高性能強(qiáng)化學(xué)習(xí)框架Awex(Asystem Weight Exchange framework)。該框架專為萬億參數(shù)級別的模型權(quán)重同步設(shè)計,可在大規(guī)模GPU集群中實現(xiàn)高效運算。
基于Awex框架構(gòu)建的思考型大模型Ring-1T,已在數(shù)千張GPU組成的集群環(huán)境中完成驗證。測試數(shù)據(jù)顯示,該模型能夠在5至10秒內(nèi)完成萬億參數(shù)的權(quán)重同步任務(wù),顯著提升了大規(guī)模模型訓(xùn)練的效率。這一技術(shù)突破為復(fù)雜AI系統(tǒng)的實時協(xié)同運算提供了新的解決方案。
作為配套技術(shù)生態(tài)的重要組成部分,螞蟻百靈團(tuán)隊于上月同步開源了非思考型Ling-1T與思考型Ring-1T兩款萬億參數(shù)模型。其中Ring-1T通過集成Awex框架的核心功能,在保持模型性能的同時,將參數(shù)同步效率提升至行業(yè)領(lǐng)先水平。這兩款模型的開源將為全球開發(fā)者提供更完整的AI基礎(chǔ)設(shè)施支持。
Awex框架采用分布式權(quán)重交換機(jī)制,通過優(yōu)化數(shù)據(jù)傳輸路徑和計算資源調(diào)度,有效解決了大規(guī)模模型訓(xùn)練中的通信瓶頸問題。該框架的開源將推動強(qiáng)化學(xué)習(xí)技術(shù)在金融、醫(yī)療、智能制造等領(lǐng)域的深度應(yīng)用,為構(gòu)建更智能的AI系統(tǒng)奠定技術(shù)基礎(chǔ)。














