科大訊飛近日正式推出新一代多模態數字人“小飛”,這款具備高度交互能力的智能導覽員已投入實際應用場景。據官方介紹,“小飛”突破了傳統數字人單一問答模式,通過多模態交互技術實現自然流暢的多人對話,并支持中英文等多種語言實時切換。
該數字人的核心優勢在于個性化服務能力。系統內置的記憶模塊可自動記錄訪客歷史交互信息,在后續對話中主動調用相關數據,提供定制化提醒服務。例如當用戶再次到訪時,“小飛”能準確識別身份并主動詢問:“您上次咨詢的XX問題,需要我為您更新最新進展嗎?”
同步發布的“百變聲音復刻”技術引發行業關注。基于星火語音大模型的創新應用,用戶僅需提供10秒語音樣本即可完成音色克隆,通過參數調節可生成不同年齡、性別、情緒的聲音風格。這項技術將數字人語音交互的真實感提升至全新維度,同時為有聲內容創作開辟了新路徑。
在應用場景拓展方面,科大訊飛展示了多領域解決方案。博物館導覽場景中,“小飛”可同時服務數十名游客,根據展品自動切換講解語言;教育領域可定制學科專屬語音包,為在線課程注入個性化教學元素;企業服務場景則支持會議紀要實時轉寫與多語言翻譯同步輸出。
技術團隊透露,該系統采用動態神經網絡架構,在保持低延遲響應的同時,支持持續學習優化。目前已在文旅、教育、金融等多個行業完成首批部署,用戶可通過科大訊飛開放平臺申請體驗。更多技術細節與應用案例可通過官方網站獲取。











