2025世界互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會期間,人工智能成為核心議題。在“互聯(lián)網(wǎng)之光”博覽會上,以“AI共生 智啟未來”為主題的展區(qū)集中展示了人工智能在生產(chǎn)生活領(lǐng)域的創(chuàng)新成果。同期舉辦的“人工智能的浙江探索與實踐主題展”則聚焦前沿技術(shù),呈現(xiàn)了浙江在人工智能領(lǐng)域的戰(zhàn)略布局與產(chǎn)業(yè)實踐。
作為浙江本土科技企業(yè)的代表,相芯科技在峰會上展示了其自主研發(fā)的AI數(shù)字人技術(shù)。在博覽會A1館,一款以卡通形象呈現(xiàn)的數(shù)字人講解員吸引了眾多觀眾。該數(shù)字人基于相芯科技的弱輸入智能建模與多模態(tài)自然交互技術(shù),用戶僅需上傳一張肖像照片,即可生成可實時互動的3D卡通數(shù)字化身。這一技術(shù)不僅支持個性化形象定制,還實現(xiàn)了捏臉、換裝等功能,并通過文本、語音、單目攝像頭等多模態(tài)交互方式,為用戶提供了沉浸式的AI體驗。
事實上,這并非相芯數(shù)字人首次亮相世界互聯(lián)網(wǎng)大會。早在2023年,相芯科技的真人級數(shù)字人講解員就已投入使用,為超過20萬名觀眾提供了智能導覽服務。該數(shù)字人通過上傳3-5分鐘真人口播視頻,即可生成具備“自助式”內(nèi)容生產(chǎn)和智能問答能力的數(shù)字化身,其形象、表情與聲音與真人高度一致,目前已廣泛應用于講解導覽、電商直播、新聞播報等場景。
兩款數(shù)字人講解員的核心技術(shù)均源自相芯科技自主研發(fā)的AvatarX平臺。作為全球首個全鏈條數(shù)字人平臺,AvatarX深度融合了人工智能與建模、驅(qū)動、交互等核心技術(shù),實現(xiàn)了從數(shù)字人生產(chǎn)到應用的全流程效率提升。針對傳統(tǒng)數(shù)字人建模周期長、成本高的痛點,AvatarX基于單張照片可在3秒內(nèi)生成高精度數(shù)字形象,大幅降低了建模門檻;在驅(qū)動穩(wěn)定性方面,該平臺通過提升魯棒性與實時動畫計算效率,使數(shù)字人在表情、肢體、頭發(fā)等全要素上表現(xiàn)出高精度、擬人化的穩(wěn)定效果;AvatarX還支持多終端適配,結(jié)合自研輕量化實時渲染引擎,可無縫適配手機、大屏、VR等設(shè)備,提供靈動的交互體驗。
憑借技術(shù)突破,AvatarX平臺入選了工信部先進技術(shù)產(chǎn)品目錄,部分技術(shù)成果榮獲浙江省科學技術(shù)進步一等獎。在今年的“人工智能的浙江探索與實踐主題展”中,相芯科技的數(shù)字人技術(shù)成果作為浙江人工智能創(chuàng)新發(fā)展的標桿案例亮相,向全球展示了AI數(shù)字人應用的鮮活實踐。
隨著AI技術(shù)的普及,數(shù)字人已從展廳中的“黑科技”轉(zhuǎn)化為產(chǎn)業(yè)與生活中的核心生產(chǎn)力。相芯科技通過打通“建模-驅(qū)動-交互-渲染”全棧技術(shù)體系,形成了高度定制化和智能化的全鏈條數(shù)字人服務能力。其提供的解決方案涵蓋卡通、視頻、超寫實、仿真與全真五大品類,可廣泛適配不同場景需求。
在商業(yè)效率領(lǐng)域,相芯數(shù)字人已成為企業(yè)降本增效的“數(shù)字勞動力”。在直播、金融等場景中,數(shù)字人可承擔重復性、標準化任務,幫助電商直播客戶實現(xiàn)單場超千萬GMV的轉(zhuǎn)化,并使金融業(yè)務處理效率提升約10%。在個人生活場景中,部署于手機、汽車等智能終端的AI助手通過增強形象化與智能化,提升了用戶粘性與品牌辨識度,目前已覆蓋數(shù)億臺設(shè)備。在社交與內(nèi)容創(chuàng)作領(lǐng)域,數(shù)字化身的日常化應用正推動人機交互進入更具溫度的新階段。
截至目前,相芯科技的數(shù)字人技術(shù)已服務國內(nèi)外2000余家企業(yè),覆蓋手機、電商、汽車、金融、互娛等20余個重點領(lǐng)域。作為浙江人工智能產(chǎn)業(yè)發(fā)展的先行者,相芯科技將持續(xù)深化AI與數(shù)字人的融合創(chuàng)新,推動更高效、智能的數(shù)字人應用場景落地,助力浙江打造具有全球影響力的人工智能新高地。











