百度搜索近日宣布,其文心助手AIGC創(chuàng)作能力迎來(lái)全面升級(jí),現(xiàn)已支持AI圖片、視頻、音樂(lè)、播客等八大模態(tài)創(chuàng)作,并具備一鍵調(diào)用多工具解決多場(chǎng)景問(wèn)題的能力。據(jù)統(tǒng)計(jì),目前百度搜索用戶日均生成的AIGC內(nèi)容已突破千萬(wàn)次,展現(xiàn)出強(qiáng)大的創(chuàng)作活力。
此次升級(jí)中,文心助手的任務(wù)解決能力得到顯著提升。用戶可通過(guò)一鍵操作,調(diào)用多工具解決生活、健康、教育、工作等多領(lǐng)域問(wèn)題。同時(shí),在內(nèi)容創(chuàng)作方面,文心助手已支持八大模態(tài)的創(chuàng)作需求,覆蓋從圖片到視頻的多元?jiǎng)?chuàng)作場(chǎng)景。
以視頻創(chuàng)作為例,文心助手推出行業(yè)領(lǐng)先的長(zhǎng)視頻生成功能。用戶只需輸入一段文字描述,即可自動(dòng)生成一部3分鐘的故事大片,涵蓋情節(jié)設(shè)計(jì)、角色塑造、場(chǎng)景搭建、鏡頭運(yùn)鏡及聲音配樂(lè)等全流程。還集成“一句話寫歌”“MV制作”“名場(chǎng)面模仿秀”等特色功能,并提供超30種特效玩法模板。未來(lái),該功能還將上線音樂(lè)數(shù)字人分身,進(jìn)一步滿足用戶從圖片處理到視頻制作的多樣化需求。
在搜索形態(tài)創(chuàng)新方面,百度搜索發(fā)布行業(yè)首個(gè)開(kāi)放式實(shí)時(shí)互動(dòng)的數(shù)字人智能體。該功能基于數(shù)字人技術(shù)、多模態(tài)模型及多智能體協(xié)作,具備高逼真度、低延時(shí)、開(kāi)放式實(shí)時(shí)互動(dòng)及情感識(shí)別能力。用戶可與持證真人專家的數(shù)字分身進(jìn)行1v1對(duì)話,在法律、情感、旅游等場(chǎng)景中獲得專業(yè)陪伴與咨詢服務(wù)。
視頻生成模型“百度蒸汽機(jī)”也迎來(lái)重要升級(jí),首次實(shí)現(xiàn)AI長(zhǎng)視頻實(shí)時(shí)交互生成。依托流式視頻技術(shù),該功能突破傳統(tǒng)AI視頻生成10秒左右的時(shí)長(zhǎng)限制,實(shí)現(xiàn)“無(wú)限時(shí)長(zhǎng)”生成,且生成速度超越國(guó)內(nèi)主流視頻生成模型。用戶上傳單張圖片與一段提示詞后,可實(shí)時(shí)預(yù)覽模型推理內(nèi)容,并在生成過(guò)程中隨時(shí)暫停或修改提示詞,實(shí)現(xiàn)對(duì)視頻劇情、畫面、轉(zhuǎn)場(chǎng)的實(shí)時(shí)控制。











