在2025科大訊飛1024開發者節上,一款名為“小飛”的多模態數字人導覽員正式亮相并投入使用。這款由科大訊飛研發的數字人突破了傳統問答交互的局限,通過整合遠場語音識別、3D視覺感知及情感語義理解等八大核心技術,實現了與多人同步對話、跨語種交流的能力。
據現場演示,“小飛”不僅具備個性化記憶功能,能根據訪客歷史交互記錄提供定制化服務,還可通過動態形象切換技術,在“林黛玉”等經典虛擬角色間自由轉換。這種多模態交互能力使其能夠適應博物館導覽、商業綜合體服務等復雜場景,為使用者帶來更具溫度的智能體驗。
科大訊飛董事長劉慶峰在發布會上強調,該產品的核心突破在于將AI服務從虛擬界面延伸至物理空間。通過情感計算模塊的深度優化,“小飛”能夠識別用戶情緒并作出相應反饋,這種“類人”交互模式標志著人工智能從工具屬性向伙伴屬性的轉變。
同期發布的另一項創新技術“百變聲音復刻”同樣引發關注。基于星火語音大模型,用戶僅需提供10秒音頻樣本即可完成高精度音色克隆,結合風格遷移算法可生成新聞播報、卡通配音等多樣化聲紋。這項技術預計將在數字人配音、有聲內容制作等領域催生新的應用場景。











