9月24日,2025云棲大會,阿里巴巴集團CEO吳泳銘宣布阿里云重磅升級全棧AI體系,實現從AI大模型到AI基礎設施的技術更新。面向新一輪智能革命,阿里云將全力打造成為全棧人工智能服務商。
AI時代,大模型將是下一代操作系統,超級AI云是下一代計算機。吳泳銘認為,超級AI云需要超大規模的基礎設施和全棧的技術積累,未來,全世界可能只會有5-6個超級云計算平臺。阿里云將持續加大投入,迎接超級人工智能時代到來。

大模型七連發,Qwen3-Max性能躋身全球前三,超過GPT5
圍繞大模型和AI云,2025云棲大會現場,阿里云智能首席技術官周靖人發布了多項重磅技術更新。通義大模型7連發,在模型智能水平、Agent工具調用和Coding能力、深度推理、多模態等方面實現多項突破。

2025云棲大會,阿里云CTO周靖人發布多項重磅技術更新
在大語言模型中,阿里通義旗艦模型Qwen3-Max全新亮相,性能超過GPT5、Claude Opus 4等,躋身全球前三。Qwen3-Max包括指令(Instruct)和推理(Thinking)兩大版本,其預覽版已在 Chatbot Arena 排行榜上位列第三,正式版性能可望再度實現突破。
Qwen3-Max是通義千問家族中最大、最強的基礎模型,預訓練數據量達36T tokens,總參數超過萬億,擁有極強的Coding編程能力和Agent工具調用能力。在大模型用Coding解決真實世界問題的SWE-Bench Verified測試中,Instruct版本斬獲69.6分,位列全球第一梯隊;在聚焦Agent工具調用能力的Tau2-Bench測試中,Qwen3-Max取得突破性的74.8分,超過Claude Opus4和DeepSeek-V3.1。Qwen3-Max推理模型也展現出非凡性能,結合工具調用和并行推理技術,其推理能力創下新高,尤其在聚焦數學推理的AIME 25和HMMT測試中,均達到突破性的滿分100分,為國內首次。
下一代基礎模型架構Qwen3-Next及系列模型正式發布,模型總參數80B僅激活 3B ,性能即可媲美千問3旗艦版235B模型,實現模型計算效率的重大突破。Qwen3-Next針對大模型在上下文長度和總參數兩方面不斷擴展(Scaling)的未來趨勢而設計,創新改進采用了混合注意力機制、高稀疏度 MoE 結構、多 token 預測(MTP)機制等核心技術,模型訓練成本較密集模型Qwen3-32B大降超90%,長文本推理吞吐量提升10倍以上,為未來大模型的訓練和推理的效率設立了全新標準。
在專項模型方面,千問編程模型Qwen3-Coder重磅升級。新的Qwen3-Coder與Qwen Code、Claude Code系統聯合訓練,應用效果顯著提升,推理速度更快,代碼安全性也顯著提升。Qwen3-Coder此前就廣受開發者和企業好評,代碼生成和補全能力極強,可一鍵完成完整項目的部署和問題修復,開源后調用量曾在知名API調用平臺OpenRouter上激增1474%,位列全球第二。

通義千問Qwen模型家族
在多模態模型中,千問備受期待的視覺理解模型Qwen3-VL重磅開源,在視覺感知和多模態推理方面實現重大突破,在32項核心能力測評中超過Gemini-2.5-Pro和GPT-5。Qwen3-VL擁有極強的視覺智能體和視覺Coding能力,不僅能看懂圖片,還能像人一樣操作手機和電腦,自動完成許多日常任務。輸入一張圖片,Qwen3-VL可自行調用agent工具放大圖片細節,通過更仔細的觀察分析,推理出更好的答案;看到一張設計圖,Qwen3-VL 就能生成Draw.io/HTML/CSS/JS 代碼,“所見即所得”地完成視覺編程。此外,Qwen3-VL還升級了3D Grounding(3D檢測)能力,為具身智能夯實基礎;擴展支持百萬tokens上下文,視頻理解時長擴展到2小時以上。
全模態模型Qwen3-Omni驚喜亮相,音視頻能力狂攬32項開源最佳性能SOTA,可像人類一樣聽說寫,應用場景廣泛,未來可部署于車載、智能眼鏡和手機等。用戶還可設定個性化角色、調整對話風格,打造專屬的個人IP。類似于人類嬰兒一出生就全方位感知世界,Qwen3-Omni一開始就加入了“聽”、“說”、“寫”多模態混合訓練。在預訓練過程中,Qwen3-Omni采用了混合單模態和跨模態數據。此前,模型在混合訓練后,各個功能會相互掣肘甚至降智,比如音頻理解能力提升,文字理解能力反而降低了。但Qwen3-Omni在實現強勁音頻與音視頻能力的同時,單模態文本與圖像性能均保持穩定,這是業內首次實現這一訓練效果。

通義萬相Wan模型家族
通義大模型家族中的視覺基礎模型通義萬相,推出Wan2.5-preview系列模型,涵蓋文生視頻、圖生視頻、文生圖和圖像編輯四大模型。通義萬相2.5視頻生成模型能生成和畫面匹配的人聲、音效和音樂BGM,首次實現音畫同步的視頻生成能力,進一步降低電影級視頻創作的門檻。通義萬相2.5視頻生成時長從5秒提升至10秒,支持24幀每秒的1080P高清視頻生成,并進一步提升模型指令遵循能力。此次,通義萬相2.5還全面升級了圖像生成能力,可生成中英文文字和圖表,支持圖像編輯功能,輸入一句話即可完成P圖。

通義百聆發布
2025杭州云棲大會上,通義大模型家族還迎來了全新的成員——語音大模型通義百聆,包括語音識別大模型Fun-ASR、語音合成大模型Fun-CosyVoice。Fun-ASR基于數千萬小時真實語音數據訓練而成,具備強大的上下文理解能力與行業適應性;Fun-CosyVoice可提供上百種預制音色,可以用于客服、銷售、直播電商、消費電子、有聲書、兒童娛樂等場景。

通義大模型已成為全球第一開源模型,也是中國企業選擇最多的模型。截至目前,阿里通義開源300余個模型,覆蓋不同大小的“全尺寸”及LLM、編程、圖像、語音、視頻等“全模態”,全球下載量突破6億次,全球衍生模型17萬個,穩居全球第一。超100萬家客戶接入通義大模型,權威調研機構沙利文2025上半年報告顯示,在中國企業級大模型調用市場中,阿里通義占比第一。
模型日均調用量增長15倍,阿里云百煉發布全新Agent開發框架
作為一站式模型服務和Agent開發平臺,阿里云百煉也來了重磅升級。大會現場,阿里云發布全新Agent開發框架ModelStudio-ADK,該框架突破以預定義編排方式開發Agent的局限,可幫助企業高效開發具備自主決策、多輪反思和循環執行能力的Agent。使用ModelStudio-ADK,1個小時就能輕松開發一個能生成深度報告的Deep Research項目。隨著模型能力的不斷提升以及Agent應用的爆發,過去一年,阿里云百煉平臺的模型日均調用量增長了15倍。

在框架層面,阿里云ModelStudio-ADK基于通義開源的AgentScope打造,可開發深度研究、硬件代理智能體、復雜檢索智能體等應用。該框架還全面支持云端部署和云端組件調用,提供企業級、服務穩定、靈活部署和運行的高代碼開發模式,幫助企業和開發者快速實現復雜場景Agent的開發和落地。
在模型層面,阿里云百煉持續上線全新通義千問家族旗艦模型,基于Qwen3系列模型強大的推理能力,可驅動Agent實現更高效的自主規劃與決策,推理性能提高50%,決策成功率達到90%。目前,用戶可一鍵調用Qwen、Wan、DeepSeek等200多款業界領先的模型。
在組件層面,面向Agent開發和部署所需的各類組件,阿里云百煉集成了工具連接MCP Server、多模數據融合RAG Server、沙箱工具Sandbox Server、智能記憶存取Memory Server以及支付訂閱服務 Pay Server等7大企業級能力。以Pay Server為例,該服務由阿里云百煉和支付寶聯合首發推出,是業界首個為企業級Agent提供專業商業化支付通道的服務。目前,阿里云百煉首批上線了基于ModelStudio-ADK開發的DeepResearch、Agentic-RAG、Computer-Use Agent等Agent應用,用戶可免費在線體驗或下載代碼進行二次開發。
大會現場,阿里云百煉還升級了低代碼Agent開發平臺ModelStudio-ADP,該平臺已廣泛應用于金融、教育和電商等領域企業,目前,阿里云百煉平臺已有超20萬開發者開發了80多萬個Agent。據介紹,網商銀行基于ModelStudio-ADP開發了貸款審核應用,支持合同、發票、營業執照等26種憑證,以及店面門頭、餐飲廚房、就餐區、貨架商品等超過400種細粒度物體的精準識別,準確率超95%,其任務處理時間從原來的3小時優化至5分鐘內。
同時,阿里云Agent Infra重要組件的無影AgentBay迎來重大升級。無影AgentBay是阿里云為Agent量身打造的“超級大腦” ,可動態調用云上算力、存儲及工具鏈資源,大大突破了Agent在本地設備上的算力限制。本次云棲大會,無影AgentBay還全新推出了自進化引擎、自定義鏡像、安全圍欄、內存狀態管理等新能力,并首次展示全新的個人計算產品——無影Agentic Computer,擁有全新的人機交互方式,革命性的“記憶”能力和近乎無窮的云上算力。
AI算力一年增長超5倍,阿里云AI基礎設施全面升級
阿里云圍繞AI進行了軟硬全棧的協同優化和系統創新,已初步形成以通義為核心的操作系統和以AI云為核心的下一代計算機。過去一年,阿里云AI算力增長超5倍,AI存力增長4倍多。

2025年云棲大會現場,全面升級的阿里云AI基礎設施重磅亮相,全面展示了阿里云從底層芯片、超節點服務器、高性能網絡、分布式存儲、智算集群到人工智能平臺、模型訓練推理服務的全棧AI技術能力。
在服務器層面,阿里云發布全新一代磐久128超節點AI服務器。新一代磐久超節點服務器由阿里云自主研發設計,具備高密度、高性能和高可用的核心優勢,可高效支持多種AI芯片,單柜支持128個AI計算芯片,密度刷新業界紀錄。磐久超節點集成阿里自研CIPU 2.0芯片和EIC/MOC高性能網卡,采用開放架構,擴展能力極強,可實現高達Pb/s級別Scale-Up帶寬和百ns極低延遲,相對于傳統架構,同等AI算力下推理性能還可提升50%。

磐久AI Infra2.0 128超節點服務器
在網絡層面,阿里云新一代高性能網絡HPN 8.0全新亮相。為應對大模型時代對海量數據傳輸的需求,HPN8.0采用訓推一體化架構,存儲網絡帶寬拉升至800Gbps,GPU互聯網絡帶寬達到6.4Tbps,可支持單集群10萬卡GPU高效互聯,為萬卡大集群提供高性能、確定性的云上基礎網絡,助力AI訓推提效。
在存儲層面,阿里云分布式存儲面向AI需求全面升級。高性能并行文件存儲CPFS單客戶端吞吐提升至40GB/s, 可滿足AI訓練對快速讀取數據的極致需求;表格存儲Tablestore為Agent提供高性能記憶庫和知識庫;對象存儲OSS推出 Vector Bucket,為向量數據提供高性價比的海量存儲,相比自建開源向量數據庫,成本驟降95%,結合OSS metaQuery 語義檢索和內容感知能力,可快速構建RAG等AI應用。
在AI智算集群層面,智能計算靈駿集群通過多級親和性與拓撲感知調度設計,基于HPN 網絡支持10萬卡穩定互聯,多級可擴展的架構讓每張卡間互聯路徑更短、帶寬更優。靈駿集群面向任務的穩定性設計、故障分鐘級恢復能力,有效提高了模型訓練任務的集群穩定性。
AI需求爆發也帶動了通用算力需求上升,阿里云通用計算全面升級。依托自研的“飛天+CIPU”架構體系,阿里云第九代企業級實例采用英特爾、AMD的最新芯片,在大幅提升算力水平的同時,可為Agent提供穩定、安全、高性能的通用CPU算力。其中,九代AMD實例g9ae提供物理核的規格,性能最高提升67%,尤其適合企業離線數據分析處理、視頻轉碼等高并發場景。
為AI負載提供彈性、調度優化和規模化運行的容器計算,也迎來重磅升級。容器服務ACK新增靈駿節點池,引入模型感知智能路由、多角色推理負載管理、故障自愈等核心功能,自動處理恢復時長縮短了 85% ,模型推理冷啟動提速10倍。容器計算服務ACS強化網絡拓撲感知調度,任務通信性能整體提升30%,并針對AI Agent場景深度優化,Serverless GPU算?開箱即用,支持每分鐘15000沙箱的大規模并發彈性,結合安全沙箱、智能休眠與喚醒,實現Agent隨需啟用、高效響應。
阿里云人工智能平臺PAI與通義大模型聯合優化,印證了全棧AI的“1+1>2”的效果。在訓練層,針對MoE模型,采用統一調度機制、自適應計算通信掩蓋、EP計算負載均衡和計算顯存分離式并行等優化手段,使得通義千問模型訓練端到端加速比提升3倍以上;升級DiT模型訓練引擎,通義萬相單樣本訓練耗時降低28.1%;在推理層,通過大規模EP、PD/AF分離、權重優化、LLM智能路由在內的全鏈路優化,實現推理效率顯著提升:推理吞吐TPS增加71%,時延TPOT降低70.6%,擴容時長降低97.6%。
“阿里云正在全力打造一臺全新的AI超級計算機,它同時擁有最領先的AI基礎設施和最領先的模型,兩者可以在產品設計和運行架構上高度協同,從而確保在阿里云上調用和訓練通義千問模型時,能達到最高效率。”吳泳銘表示。
截至目前,阿里云運營著中國第一、全球領先的AI基礎設施和云計算網絡,在全球29個地域設有90個可用區。三方機構Omdia2025年上半年數據顯示,中國AI云市場阿里云占比35.8%,超過2到4名總和;在已采用生成式AI的財富中國500強中,超53%企業選擇阿里云,滲透率位列第一。未來3年,阿里巴巴將投入3800億用于建設云和AI基礎設施,總額超過過去十年的總和。