在2025科大訊飛1024開發者節現場,一款具備突破性交互能力的多模態數字人成為焦點。這款名為"小飛"的數字導覽員不僅實現了從簡單問答到復雜場景服務的跨越,更通過個性化功能重新定義了人機交互的邊界。
據現場演示,"小飛"突破了傳統數字人的功能局限。其搭載的八項核心技術包括遠場語音識別、3D空間感知和情感語義分析,使它能同時與多位用戶展開自然對話。更引人注目的是其記憶功能——通過分析訪客歷史交互數據,"小飛"能主動提供個性化提醒,例如根據用戶過往偏好推薦展覽路線。
形象定制能力是該數字人的另一大亮點。技術人員現場展示其快速切換虛擬形象的功能,僅需幾秒即可從標準形象轉變為"林黛玉"等經典角色。這種多形態服務模式不僅提升了用戶體驗,更為文旅、教育等場景開辟了新的應用可能。
科大訊飛董事長劉慶峰在主題演講中強調:"我們正在見證AI從工具向伙伴的進化。'小飛'的核心價值在于它能理解物理空間中的情感需求,提供有溫度的服務。"這種進化體現在技術架構的革新上——通過融合多模態感知系統,數字人具備了環境適應能力和上下文理解能力。
同步發布的"百變聲音復刻"技術同樣引發關注。該技術基于星火語音大模型,用戶僅需提供10秒語音樣本即可完成音色克隆,配合風格轉換算法能生成新聞播報、卡通配音等多樣化聲線。這項突破將使內容創作者擁有專屬"聲音庫",在有聲讀物、數字人配音等領域催生新的商業模式。
技術團隊透露,兩項創新成果均已進入商用階段。"小飛"數字人系統正在博物館、科技館等場所進行實地測試,其多語言支持功能特別受到國際游客好評。而聲音復刻技術則計劃在年內開放個人用戶接口,預計將引發內容創作領域的變革。











