阿里旗下千問APP近日迎來重大更新,同步上線基于萬相2.6視覺大模型的“AI小劇場(chǎng)”功能,首次在國內(nèi)實(shí)現(xiàn)用戶與虛擬角色或真實(shí)人物同框合拍AI短片的創(chuàng)新玩法。該功能依托全球功能最完備的視頻生成模型,不僅支持多鏡頭切換與音畫同步,更突破性地引入聲音驅(qū)動(dòng)角色表演技術(shù),成為國內(nèi)首個(gè)具備角色扮演能力的視頻生成工具。目前僅有OpenAI的Sora2模型具備類似功能,但在音頻驅(qū)動(dòng)生成視頻等細(xì)分領(lǐng)域,萬相2.6已形成技術(shù)優(yōu)勢(shì)。
技術(shù)迭代速度成為千問APP的顯著標(biāo)簽。自公測(cè)啟動(dòng)以來,該應(yīng)用在30天內(nèi)完成18個(gè)版本更新,持續(xù)強(qiáng)化創(chuàng)作、學(xué)習(xí)、辦公三大場(chǎng)景的應(yīng)用能力。數(shù)據(jù)顯示,其用戶增長曲線陡峭:上線首周下載量突破千萬,23天后月活躍用戶數(shù)(涵蓋APP、網(wǎng)頁及PC端)飆升至3000萬,創(chuàng)下全球AI應(yīng)用增長新紀(jì)錄。這種爆發(fā)式增長背后,是阿里全棧自研技術(shù)體系的支撐——從去年9月發(fā)布的萬相2.5模型開始,阿里就持續(xù)在視頻生成領(lǐng)域建立技術(shù)壁壘,其音畫同步技術(shù)曾在權(quán)威評(píng)測(cè)集LMArena中登頂國內(nèi)榜首。
在語言模型領(lǐng)域,阿里千問正形成對(duì)國際巨頭的追趕態(tài)勢(shì)。英偉達(dá)開源的多個(gè)核心模型均基于千問架構(gòu)開發(fā),愛彼迎CEO布萊恩·切斯基公開表示,公司業(yè)務(wù)大量采用千問服務(wù),認(rèn)為其性能優(yōu)于OpenAI同類產(chǎn)品且成本更低。這種技術(shù)實(shí)力直接反映在開源生態(tài)建設(shè)上:阿里已向全球開放300余款模型資源,累計(jì)下載量突破7億次,衍生開發(fā)模型超過18萬個(gè),其千問模型家族正式超越meta的Llama系列,登頂全球開源模型影響力排行榜。
技術(shù)普惠化是本次更新的核心價(jià)值取向。通過將影視級(jí)視覺生成能力下放至消費(fèi)級(jí)應(yīng)用,千問APP正在重塑內(nèi)容創(chuàng)作生態(tài)。普通用戶無需專業(yè)設(shè)備即可生成高質(zhì)量視頻內(nèi)容,這種“技術(shù)平權(quán)”效應(yīng)已引發(fā)創(chuàng)作領(lǐng)域變革。教育場(chǎng)景中,教師可快速制作教學(xué)動(dòng)畫;辦公場(chǎng)景里,企業(yè)能高效生成宣傳素材;而在創(chuàng)意領(lǐng)域,個(gè)人創(chuàng)作者更獲得與專業(yè)團(tuán)隊(duì)同臺(tái)競技的工具支持。這種變革正在模糊專業(yè)與業(yè)余的界限,推動(dòng)AI技術(shù)真正融入大眾生活。
值得注意的是,阿里在模型開源領(lǐng)域的戰(zhàn)略布局已顯現(xiàn)成效。通過構(gòu)建“基礎(chǔ)模型-垂直場(chǎng)景-行業(yè)應(yīng)用”的開放生態(tài),其技術(shù)影響力正從中國向全球擴(kuò)散。這種發(fā)展模式不僅降低了AI技術(shù)使用門檻,更催生出新的商業(yè)模式——超過18萬個(gè)衍生模型中,既有個(gè)人開發(fā)者的創(chuàng)意實(shí)驗(yàn),也有企業(yè)客戶的定制化解決方案,形成技術(shù)賦能產(chǎn)業(yè)的良性循環(huán)。在當(dāng)下全球AI競賽中,這種“技術(shù)開放+場(chǎng)景落地”的雙輪驅(qū)動(dòng)策略,正為中國科技企業(yè)開辟出獨(dú)特的競爭路徑。








