百度搜索近日宣布,旗下文心助手AIGC創(chuàng)作能力迎來重大升級,推出覆蓋AI圖片、視頻、音樂、播客等8種模態(tài)的創(chuàng)作矩陣,并同步發(fā)布行業(yè)首個開放式實時互動數(shù)字人智能體。此次升級標志著搜索引擎從傳統(tǒng)信息檢索工具向“全能創(chuàng)作與服務(wù)平臺”的跨越式轉(zhuǎn)型,突破多項技術(shù)瓶頸,為用戶提供更高效的創(chuàng)作與解決方案。
升級后的文心助手以全棧式創(chuàng)作能力為核心,尤其在視頻生成領(lǐng)域?qū)崿F(xiàn)突破性進展。依托百度蒸汽機(文心專精)模型的技術(shù)迭代,傳統(tǒng)AI視頻10秒左右的時長限制被徹底打破,用戶輸入一段文字即可實時生成3分鐘故事大片,涵蓋情節(jié)設(shè)計、角色建模、鏡頭運鏡及配樂合成全流程,生成速度超越國內(nèi)主流同類模型。平臺還集成“一句話寫歌”“MV制作”“名場面模仿秀”等特色功能,搭配超30種特效模板,形成覆蓋靜態(tài)圖像處理、動態(tài)視頻制作及音頻創(chuàng)作的完整生態(tài)鏈。
數(shù)據(jù)顯示,文心助手用戶日均生成AIGC內(nèi)容已突破千萬量級,多模態(tài)創(chuàng)作工具的規(guī)模化應(yīng)用價值得到充分驗證。即將上線的音樂數(shù)字人分身功能將進一步打通“創(chuàng)作-演繹”全鏈路,實現(xiàn)AI從內(nèi)容生成到個性化演繹的閉環(huán)。
在任務(wù)解決能力方面,文心助手通過構(gòu)建多工具調(diào)用引擎,支持用戶一鍵觸發(fā)跨領(lǐng)域服務(wù),覆蓋生活規(guī)劃、健康咨詢、教育輔導(dǎo)及職場辦公等場景。例如,家長查詢“小學(xué)生科學(xué)實驗方案”時,系統(tǒng)可自動整合實驗步驟文本、器材清單圖片、操作演示短視頻,并生成可打印任務(wù)卡,避免用戶多次切換工具。這一“需求-解決方案”直達模式,體現(xiàn)了文心大模型對用戶意圖的深度理解與資源調(diào)度能力。
同步發(fā)布的開放式實時互動數(shù)字人智能體成為另一大亮點。該技術(shù)基于文心大模型4.5構(gòu)建,融合NOVA數(shù)字人技術(shù)核心優(yōu)勢,具備三大特性:其一,超擬真交互體驗,通過10分鐘真人樣本數(shù)據(jù)即可復(fù)刻聲音特征、動作習(xí)慣與微表情,口型準確率與表情自然度達行業(yè)領(lǐng)先水平;其二,毫秒級響應(yīng)能力,采用云渲染與端渲染雙引擎適配,兼容多終端場景,實時對話延遲控制在百毫秒以內(nèi);其三,開放式服務(wù)生態(tài),已接入法律、情感、旅游等領(lǐng)域?qū)<覕?shù)字分身,用戶可直接就專業(yè)問題展開深度對話,未來還將開放第三方開發(fā)者平臺。











