在華為開(kāi)發(fā)者大會(huì)的熱潮中,一場(chǎng)聚焦音視頻AI多模態(tài)融合的高峰論壇成功吸引了業(yè)界的目光。此次論壇由華為云主辦,以“音視頻AI多模態(tài)融合,媒體重塑行業(yè)數(shù)字化新價(jià)值”為主題,匯聚了華為云、引望、人形機(jī)器人(上海)有限公司、微贊直播及安樸酒店等多家企業(yè)代表,共同探討AI多模態(tài)技術(shù)如何推動(dòng)媒體、智能駕駛、具身智能、直播及酒店等多個(gè)行業(yè)的革新。
華為云媒體服務(wù)產(chǎn)品部總裁呂陽(yáng)明在論壇上發(fā)表開(kāi)場(chǎng)演講,他強(qiáng)調(diào),人工智能正朝著多模態(tài)融合的方向發(fā)展,從簡(jiǎn)單的感知理解進(jìn)化到深度思考與生成創(chuàng)造的新階段。在這一背景下,音視頻產(chǎn)業(yè)也迎來(lái)了智能化、個(gè)性化和互動(dòng)化的全新變革。為此,華為云構(gòu)建了音視頻、傳輸、建模、推理、渲染五大能力引擎,并將AI與媒體能力深度融合,通過(guò)“AI for Media”和“Media for AI”的雙向賦能,重新定義了AI時(shí)代的媒體生產(chǎn)力。
在“AI for Media”方面,華為云通過(guò)編解碼與AI的結(jié)合,顯著提升了畫質(zhì),加速了超高清技術(shù)的普及。同時(shí),渲染與AI的融合實(shí)現(xiàn)了“In-Scene”個(gè)性化廣告,為廣告行業(yè)帶來(lái)了新的增長(zhǎng)點(diǎn)。3DGS與AI的高效結(jié)合,能夠重建毫米級(jí)精度的3D數(shù)字空間,為虛擬現(xiàn)實(shí)領(lǐng)域提供了強(qiáng)有力的支持。而CG與AI的結(jié)合,則突破了數(shù)據(jù)泛化的瓶頸,極大地提升了具身智能的訓(xùn)練效率。
在智能駕駛領(lǐng)域,引望ADS云項(xiàng)目經(jīng)理林凌分享了華為乾崑智駕與華為云音視頻技術(shù)的協(xié)同創(chuàng)新成果。面對(duì)車載場(chǎng)景的復(fù)雜網(wǎng)絡(luò)環(huán)境和數(shù)據(jù)安全監(jiān)管的高要求,他們通過(guò)優(yōu)化網(wǎng)絡(luò)架構(gòu)、開(kāi)發(fā)弱網(wǎng)抗丟包算法以及實(shí)施業(yè)務(wù)分級(jí)傳輸?shù)热?xiàng)技術(shù)攻堅(jiān),成功保障了智駕體驗(yàn)。現(xiàn)在,用戶只需一鍵召喚車輛,手機(jī)就能實(shí)時(shí)查看車載攝像頭畫面,這一創(chuàng)新重新定義了人車關(guān)系,推動(dòng)了智能駕駛從單車智能向多元協(xié)同的轉(zhuǎn)變。
在具身智能領(lǐng)域,人形機(jī)器人(上海)有限公司的尹云鵬博士提出了“模型訓(xùn)推+操作系統(tǒng)+具身應(yīng)用”的新開(kāi)發(fā)范式。他所在的國(guó)家地方共建人形機(jī)器人創(chuàng)新中心打造了全國(guó)首個(gè)虛實(shí)融合異構(gòu)人形機(jī)器人訓(xùn)練場(chǎng),并通過(guò)構(gòu)建虛擬仿真采集場(chǎng)、實(shí)現(xiàn)訓(xùn)練數(shù)據(jù)增廣和仿真數(shù)據(jù)高效生成,完成了智能開(kāi)發(fā)效率的突破。他們還發(fā)布了全球首個(gè)百萬(wàn)量級(jí)、真實(shí)場(chǎng)景、異構(gòu)機(jī)器人平臺(tái)的高質(zhì)量具身數(shù)據(jù)集“白虎數(shù)據(jù)集”,為具身智能的開(kāi)發(fā)提供了強(qiáng)有力的支持。
在直播領(lǐng)域,微贊直播副總裁何祖恒分享了技術(shù)賦能直播營(yíng)銷的實(shí)踐。他們依托華為云技術(shù)底座,打造了一站式私域直播解決方案,為企業(yè)數(shù)字化轉(zhuǎn)型提供了創(chuàng)新路徑與工具。該方案通過(guò)“低延時(shí)網(wǎng)絡(luò)+AI媒體處理”的雙向驅(qū)動(dòng),實(shí)現(xiàn)了高并發(fā)、超低延遲、高清流暢且安全可靠的直播服務(wù)。這一創(chuàng)新不僅顯著降低了播放延遲,確保了流暢實(shí)時(shí)互動(dòng),還通過(guò)AI媒體轉(zhuǎn)碼結(jié)合音視頻大模型,自動(dòng)優(yōu)化了畫質(zhì),提升了直播的效率和呈現(xiàn)效果。
在酒店行業(yè),安樸酒店管理有限公司IT總監(jiān)孫海龍分享了酒店數(shù)字化的新趨勢(shì)和實(shí)踐經(jīng)驗(yàn)。他指出,賓客數(shù)字化體驗(yàn)已成為酒店行業(yè)數(shù)字化的首要目標(biāo),這反映了行業(yè)從“流量爭(zhēng)奪”向“體驗(yàn)深耕”的轉(zhuǎn)變。安樸酒店通過(guò)引入智能交互數(shù)字人管家,打造了酒店行業(yè)的AI創(chuàng)新。這一創(chuàng)新不僅提升了服務(wù)效率,還為賓客帶來(lái)了不一樣的入住體驗(yàn)。數(shù)字人管家在酒店大堂提供禮賓服務(wù),在客房則通過(guò)升級(jí)后的電視成為智慧中樞,為賓客提供了多重角色的服務(wù)體驗(yàn)。
隨著AI與音視頻融合的日益深入,產(chǎn)業(yè)爆發(fā)的臨界點(diǎn)已經(jīng)到來(lái)。當(dāng)技術(shù)創(chuàng)新與行業(yè)痛點(diǎn)深度結(jié)合時(shí),數(shù)字化價(jià)值的釋放才真正開(kāi)始。華為云將持續(xù)開(kāi)放五大引擎能力,與開(kāi)發(fā)者、伙伴共同探索智能交互的新范式,推動(dòng)媒體時(shí)代向更加智能化、個(gè)性化和互動(dòng)化的方向發(fā)展。