在AI技術(shù)高速發(fā)展的當(dāng)下,算力資源的高效利用成為行業(yè)關(guān)注的焦點(diǎn)。華為近日宣布推出全新AI容器技術(shù)Flex:ai,這項(xiàng)創(chuàng)新技術(shù)通過(guò)將單張GPU或NPU的算力進(jìn)行精細(xì)化分割,實(shí)現(xiàn)了算力資源的靈活分配。據(jù)介紹,該技術(shù)可將單張算力卡的資源拆分為多個(gè)虛擬單元,分割精度達(dá)到10%級(jí)別,使得單張硬件設(shè)備能夠同時(shí)支持多個(gè)AI任務(wù)并行運(yùn)行。
更值得關(guān)注的是,F(xiàn)lex:ai技術(shù)突破了單設(shè)備限制,能夠整合集群中不同節(jié)點(diǎn)的閑置XPU算力,構(gòu)建動(dòng)態(tài)的"共享算力池"。這種資源整合方式顯著提升了企業(yè)算力利用率,優(yōu)化了模型訓(xùn)練與推理過(guò)程中的資源調(diào)度效率。對(duì)于需要大規(guī)模部署AI應(yīng)用的企業(yè)而言,這項(xiàng)技術(shù)有效解決了算力資源閑置與需求波動(dòng)的矛盾,實(shí)現(xiàn)了算力使用的彈性管理。
該技術(shù)的開(kāi)源計(jì)劃進(jìn)一步降低了使用門(mén)檻。華為決定將Flex:ai同步開(kāi)源至魔擎社區(qū),使開(kāi)發(fā)者和企業(yè)能夠基于開(kāi)放平臺(tái)快速構(gòu)建算力解決方案。這種開(kāi)放策略不僅加速了技術(shù)普及,更推動(dòng)了算力資源向云端存儲(chǔ)般的便捷獲取模式轉(zhuǎn)變,為AI生態(tài)建設(shè)提供了重要支撐。
在當(dāng)前國(guó)內(nèi)算力資源緊張的背景下,F(xiàn)lex:ai的技術(shù)突破具有特殊意義。通過(guò)將固定硬件轉(zhuǎn)化為可動(dòng)態(tài)分配的資源池,這項(xiàng)技術(shù)本質(zhì)上提升了社會(huì)整體算力供給效率。特別是在2025年AI大模型全面普及的關(guān)鍵節(jié)點(diǎn),這種底層技術(shù)革新將為行業(yè)提供關(guān)鍵的競(jìng)爭(zhēng)力支撐,助力AI技術(shù)向更深層次的應(yīng)用場(chǎng)景滲透。
技術(shù)專家指出,F(xiàn)lex:ai的創(chuàng)新不僅體現(xiàn)在硬件資源利用層面,更重構(gòu)了算力分配的邏輯框架。通過(guò)虛擬化技術(shù)實(shí)現(xiàn)算力顆粒化分割,配合智能調(diào)度系統(tǒng),這種解決方案為AI基礎(chǔ)設(shè)施建設(shè)提供了新的發(fā)展路徑。隨著技術(shù)落地進(jìn)程加快,預(yù)計(jì)將在智能制造、智慧城市等領(lǐng)域引發(fā)連鎖反應(yīng),推動(dòng)AI技術(shù)向更高效的產(chǎn)業(yè)化方向演進(jìn)。












