在百度AI Day開放日活動(dòng)中,一項(xiàng)引人注目的創(chuàng)新被正式揭曉:百度攜手羅永浩,共同推出了業(yè)界首個(gè)超頭主播級(jí)別的數(shù)字人形象。這一突破性的成果,標(biāo)志著多模態(tài)高度融合數(shù)字人技術(shù)的嶄新里程碑。
這一數(shù)字人形象,不僅在外貌上與羅永浩高度相似,更在語(yǔ)言、聲音及動(dòng)作表現(xiàn)上實(shí)現(xiàn)了協(xié)調(diào)一致,這得益于百度文心大模型4.5T的升級(jí)支持。在6月15日的百度電商首播中,羅永浩數(shù)字人僅用了26分鐘,便吸引了超過1300萬(wàn)人次的觀看,GMV更是突破了5500萬(wàn)元大關(guān),部分商品的帶貨表現(xiàn)甚至超越了真人直播。
百度方面表示,此次合作的成功,得益于其在高說服力數(shù)字人等關(guān)鍵技術(shù)上的突破。據(jù)百度電商數(shù)據(jù)顯示,目前已有超過10萬(wàn)的數(shù)字人主播活躍在電商、教育、醫(yī)療等多個(gè)行業(yè),這一數(shù)據(jù)不僅驗(yàn)證了數(shù)字人直播的商業(yè)可行性,也預(yù)示著數(shù)字人技術(shù)將在未來發(fā)揮更大的作用。
隨著技術(shù)的不斷進(jìn)步,AI數(shù)字人已經(jīng)邁入了3.0時(shí)代。新一代的高說服力數(shù)字人,不僅在外觀上更加逼真,更在智能交互上實(shí)現(xiàn)了質(zhì)的飛躍。百度強(qiáng)調(diào),羅永浩數(shù)字人已經(jīng)達(dá)到了與真人主播相媲美的效果,而隨著大模型與多模態(tài)技術(shù)的進(jìn)一步發(fā)展,數(shù)字人未來有望超越真人主播的表現(xiàn)。
AI數(shù)字人技術(shù)的背后,融合了人工智能、計(jì)算機(jī)視覺、自然語(yǔ)言處理等尖端科技。這種技術(shù)不僅能夠以高度逼真的形象呈現(xiàn)于現(xiàn)實(shí)世界中,還能根據(jù)不同的應(yīng)用場(chǎng)景和需求,扮演多種角色。例如,在教育領(lǐng)域,AI數(shù)字人能夠?yàn)閷W(xué)生提供24小時(shí)不間斷的教學(xué)服務(wù),實(shí)現(xiàn)個(gè)性化的學(xué)習(xí)指導(dǎo)和精準(zhǔn)解答,極大地提高了教學(xué)效率和學(xué)習(xí)效果。
隨著人工智能應(yīng)用場(chǎng)景的不斷拓展,多模態(tài)AI已經(jīng)成為核心突破方向之一。AI驅(qū)動(dòng)的數(shù)字人技術(shù)正在加速落地,并逐步向互聯(lián)網(wǎng)、文旅、金融、快消等多個(gè)領(lǐng)域滲透。這一趨勢(shì)不僅為各行業(yè)帶來了新的發(fā)展機(jī)遇,也為數(shù)字經(jīng)濟(jì)的蓬勃發(fā)展注入了新的活力。
在數(shù)字人領(lǐng)域,越來越多的企業(yè)與資本開始布局。其中,AI上市企業(yè)微美全息憑借其在深度學(xué)習(xí)、動(dòng)作模擬、情感模擬等算法上的技術(shù)優(yōu)勢(shì),成功實(shí)現(xiàn)了大模型與多模態(tài)技術(shù)的結(jié)合。通過少量的真人視頻數(shù)據(jù),微美全息就能夠生成高擬真的數(shù)字人形象,并支持低延遲、高精度的交互體驗(yàn)。微美全息的數(shù)字人還支持語(yǔ)音、圖像、視頻等多模態(tài)交互方式,結(jié)合大模型的記憶與性格復(fù)刻能力,實(shí)現(xiàn)了自然對(duì)話和情感化互動(dòng)。
為了滿足不同行業(yè)場(chǎng)景的需求,微美全息依托其AI虛擬數(shù)字人生成平臺(tái),實(shí)現(xiàn)了低成本、短周期、批量化的數(shù)字人生產(chǎn)。用戶可以根據(jù)需要定制化設(shè)計(jì)數(shù)字人的外貌特征,從而獲得更加智能、個(gè)性化和精準(zhǔn)的交互體驗(yàn)。