在2025云棲大會現(xiàn)場,阿里云智能首席技術(shù)官周靖人宣布了一系列重大技術(shù)突破。當天,通義大模型家族迎來七項重要更新,覆蓋模型智能水平提升、Agent工具調(diào)用與編程能力優(yōu)化、深度推理強化及多模態(tài)交互等多個領(lǐng)域,標志著人工智能技術(shù)邁向新高度。
作為通義千問系列的核心產(chǎn)品,Qwen3-Max旗艦?zāi)P驼降菆觥T撃P筒捎?6T tokens的預(yù)訓(xùn)練數(shù)據(jù),參數(shù)規(guī)模突破萬億級別,在編程實現(xiàn)與工具調(diào)用領(lǐng)域展現(xiàn)出卓越性能。其強大的代碼生成能力可支持復(fù)雜系統(tǒng)開發(fā),Agent框架則能高效整合第三方工具,為智能化應(yīng)用提供底層支撐。
在基礎(chǔ)架構(gòu)層面,Qwen3-Next系列模型實現(xiàn)重大突破。新一代架構(gòu)在保持與2350億參數(shù)版本相當性能的同時,大幅優(yōu)化計算效率,為大規(guī)模商用部署奠定基礎(chǔ)。專項模型方面,編程專用模型Qwen3-Coder完成迭代升級,在算法優(yōu)化與代碼糾錯能力上取得顯著進展。
多模態(tài)領(lǐng)域同樣亮點紛呈。視覺理解模型Qwen3-VL正式開源,在圖像語義解析與跨模態(tài)推理方面樹立新標桿。全模態(tài)交互模型Qwen3-Omni首次亮相即引發(fā)關(guān)注,該模型在音視頻處理領(lǐng)域創(chuàng)下32項SOTA紀錄,具備類人級的聽說讀寫綜合能力,可適配車載系統(tǒng)、智能眼鏡及移動終端等多樣化場景。
視覺創(chuàng)作領(lǐng)域迎來重要升級,通義萬相推出Wan2.5-preview系列模型,集成文生視頻、圖生視頻、文生圖及圖像編輯四大功能模塊。新版本全面強化中英文字體生成與圖表繪制能力,支持通過自然語言指令實現(xiàn)圖像精細化編輯,大幅降低專業(yè)設(shè)計門檻。
語音交互方面,通義百聆大模型家族正式組建。其中語音識別模型Fun-ASR基于數(shù)千萬小時真實語音數(shù)據(jù)訓(xùn)練,具備上下文感知與行業(yè)適配能力;語音合成模型Fun-CosyVoice提供超百種預(yù)制音色庫,可滿足客服、電商直播、有聲讀物、消費電子等領(lǐng)域的多樣化需求。
截至目前,阿里通義大模型已開源300余個版本,形成覆蓋全尺寸、全模態(tài)的完整生態(tài)。其全球下載量突破6億次,衍生模型達17萬個,在開源社區(qū)影響力持續(xù)領(lǐng)跑全球。從基礎(chǔ)架構(gòu)到垂直領(lǐng)域,從文本處理到多模態(tài)交互,通義大模型正以持續(xù)創(chuàng)新推動AI技術(shù)普惠化進程。