在計(jì)算機(jī)系統(tǒng)與人工智能技術(shù)深度融合的背景下,阿里云自主研發(fā)的GPU資源池化方案“Aegaeon”憑借其創(chuàng)新性入選國(guó)際頂級(jí)學(xué)術(shù)會(huì)議SOSP 2025。該方案通過(guò)突破傳統(tǒng)“一模型一GPU”的硬件綁定模式,實(shí)現(xiàn)了GPU資源利用率的大幅提升,目前已在阿里云百煉平臺(tái)完成核心技術(shù)的落地應(yīng)用。
作為計(jì)算機(jī)系統(tǒng)領(lǐng)域最具影響力的學(xué)術(shù)會(huì)議之一,SOSP(操作系統(tǒng)原理研討會(huì))由ACM SIGOPS主辦,年均論文收錄量不足百篇,被譽(yù)為操作系統(tǒng)領(lǐng)域的“奧斯卡”。本屆會(huì)議聚焦系統(tǒng)軟件與AI大模型技術(shù)的交叉創(chuàng)新,阿里云的研究成果成為系統(tǒng)層優(yōu)化支撐AI應(yīng)用的典型案例。
測(cè)試數(shù)據(jù)顯示,在阿里云模型市場(chǎng)為期三個(gè)月的Beta測(cè)試中,Aegaeon系統(tǒng)在支撐720億參數(shù)規(guī)模大模型運(yùn)行時(shí),將英偉達(dá)H20 GPU的使用量從1192臺(tái)壓縮至213臺(tái),硬件成本削減幅度達(dá)82%。這一突破對(duì)于依賴(lài)大規(guī)模GPU集群的AI服務(wù)商具有戰(zhàn)略意義——在真實(shí)業(yè)務(wù)場(chǎng)景中,少數(shù)熱門(mén)模型(如阿里Qwen)占據(jù)絕大多數(shù)流量,而大量“長(zhǎng)尾”模型長(zhǎng)期閑置GPU資源,曾導(dǎo)致17.7%的算力僅處理1.35%的請(qǐng)求。
Aegaeon的核心創(chuàng)新在于Token級(jí)動(dòng)態(tài)調(diào)度技術(shù)。系統(tǒng)在每次生成文本Token后,實(shí)時(shí)評(píng)估是否切換模型,通過(guò)組件復(fù)用、顯存精細(xì)管理和KV緩存同步優(yōu)化等全棧技術(shù),將模型切換開(kāi)銷(xiāo)降低97%,確保亞秒級(jí)響應(yīng)能力。實(shí)驗(yàn)表明,該方案支持單GPU同時(shí)運(yùn)行7個(gè)不同模型,有效吞吐量較主流方案提升1.5至9倍,請(qǐng)求處理能力提升2至2.5倍。
在2025云棲大會(huì)上,阿里巴巴集團(tuán)CEO吳泳銘宣布了AI基礎(chǔ)設(shè)施建設(shè)的重大戰(zhàn)略。他指出,大模型正在取代傳統(tǒng)操作系統(tǒng),成為連接用戶(hù)、應(yīng)用與AI算力的核心中間層,而超級(jí)AI云將成為下一代計(jì)算機(jī)的基礎(chǔ)形態(tài)。為迎接超級(jí)人工智能(ASI)時(shí)代,阿里云計(jì)劃在未來(lái)十年投入3800億元建設(shè)AI基礎(chǔ)設(shè)施,并預(yù)留追加投資空間。
根據(jù)規(guī)劃,到2032年,阿里云全球數(shù)據(jù)中心的能耗規(guī)模將較2022年增長(zhǎng)10倍,這一指數(shù)級(jí)擴(kuò)張預(yù)示著算力投入的質(zhì)變。財(cái)務(wù)數(shù)據(jù)顯示,2025財(cái)年第二季度阿里云智能集團(tuán)收入同比增長(zhǎng)26%,創(chuàng)近三年新高,凈利潤(rùn)增長(zhǎng)76%,表明AI技術(shù)投入已產(chǎn)生顯著經(jīng)濟(jì)效益。
吳泳銘強(qiáng)調(diào),通用人工智能(AGI)的實(shí)現(xiàn)只是起點(diǎn),終極目標(biāo)是開(kāi)發(fā)出具備自我迭代能力的超級(jí)人工智能(ASI)。他預(yù)測(cè),未來(lái)全球可能僅存在5至6個(gè)超級(jí)云計(jì)算平臺(tái),而阿里云將通過(guò)全棧AI體系升級(jí),構(gòu)建從大模型到基礎(chǔ)設(shè)施的技術(shù)閉環(huán)。目前,阿里云已形成以通義大模型為核心的操作系統(tǒng)和以AI云為核心的下一代計(jì)算機(jī)架構(gòu),過(guò)去一年AI算力增長(zhǎng)超5倍,存儲(chǔ)能力提升4倍。











