上海創(chuàng)智學(xué)院近日在人工智能領(lǐng)域取得重大突破,正式推出具有自主知識產(chǎn)權(quán)的下一代開源AI基礎(chǔ)設(shè)施——強化學(xué)習(xí)框架siiRL 2.0與低比特訓(xùn)練技術(shù)Metis,標(biāo)志著國產(chǎn)算力生態(tài)建設(shè)邁入新階段。
作為新一代模型的核心支撐平臺,siiRL 2.0框架原生兼容華為昇騰、沐曦等國產(chǎn)算力芯片,首次實現(xiàn)千卡級強化學(xué)習(xí)訓(xùn)練集群的國產(chǎn)化部署。該框架采用完全分布式架構(gòu)設(shè)計,未來可擴展至萬卡級訓(xùn)練規(guī)模,在多模態(tài)數(shù)據(jù)處理和長序列上下文建模場景中,訓(xùn)練效率較國際主流框架提升2至7倍,被業(yè)界譽為"下一代模型的動力引擎"。
針對當(dāng)前全球頂尖AI模型80%未開源的現(xiàn)狀,siiRL框架通過開源生態(tài)建設(shè)推動多智能體協(xié)同與深度認(rèn)知能力發(fā)展。其開放的代碼庫和工具鏈,為國內(nèi)科研機構(gòu)和企業(yè)提供了自主可控的技術(shù)底座,有助于打破國際技術(shù)壟斷,加速通用人工智能(AGI)技術(shù)的普惠化進(jìn)程。
同步發(fā)布的Metis低比特訓(xùn)練技術(shù)開創(chuàng)了新的計算范式。該技術(shù)通過將訓(xùn)練過程的數(shù)據(jù)精度從fp32壓縮至fp4,在保持模型性能接近無損的同時,大幅降低計算資源消耗。研究團隊首次系統(tǒng)解決了大模型低精度訓(xùn)練中的數(shù)值穩(wěn)定性難題,為國產(chǎn)芯片廠商指明了低比特計算架構(gòu)的優(yōu)化方向。這項突破將推動芯片設(shè)計向高吞吐、低功耗方向發(fā)展,顯著提升國產(chǎn)算力產(chǎn)品的國際競爭力。
據(jù)介紹,創(chuàng)智學(xué)院正在構(gòu)建全球高校規(guī)模最大的智算平臺之一,已建成超過萬P的智能計算集群。學(xué)院獨創(chuàng)的"建中研、干中學(xué)"人才培養(yǎng)模式,將學(xué)生直接派駐算力建設(shè)一線,通過參與真實項目積累實戰(zhàn)經(jīng)驗。配套的開源激勵機制和全鏈條技術(shù)棧,涵蓋下一代訓(xùn)練框架、推理引擎、萬卡集群通信庫及智能運維系統(tǒng),正在形成完整的國產(chǎn)算力生態(tài)體系。
學(xué)院計劃于近期啟動"AI基礎(chǔ)設(shè)施開源周"活動,屆時將發(fā)布包括分布式調(diào)度系統(tǒng)、異構(gòu)計算優(yōu)化工具等在內(nèi)的完整技術(shù)解決方案。這些創(chuàng)新成果不僅為國產(chǎn)芯片提供了適配驗證平臺,更為我國人工智能產(chǎn)業(yè)構(gòu)建了自主可控的技術(shù)護城河。