在第八屆世界聲博會暨2025科大訊飛全球1024開發者節上,科大訊飛以“更懂你的AI”為主題,發布了訊飛星火大模型最新技術升級及系列創新產品,全面展現了AI技術從實驗室走向產業化的清晰路徑。科大訊飛董事長劉慶峰在發布會上指出,AI技術的規模化應用需突破自主可控、軟硬一體、行業縱深和個性化四大核心挑戰,目前已在多個領域取得實質性進展。

此次發布的深度推理大模型訊飛星火X1.5成為技術亮點。該模型采用MoE架構,總參數量達293B,激活參數量30B,推理效率較前代提升100%。其六大核心能力——語言理解、文本生成、知識問答、邏輯推理、數學能力和代碼能力——全面對標國際主流模型,其中數學能力持續保持領先。多語言支持覆蓋130個語種,整體性能達到GPT-5的95%以上,在拉美、東盟等14個重點語言場景中表現尤為突出。更值得關注的是,星火X1.5在國產算力平臺上攻克了兩大技術瓶頸:長思維鏈強化學習訓練效率從30%提升至84%以上,MoE模型全鏈路訓練效率實現質的飛躍,為自主可控的AI發展奠定了堅實基礎。
在原創技術領域,科大訊飛全球首發非自回歸語音大模型架構,通過并行輸出技術將推理效率提升16%,同時降低520%的推理成本。這一突破使得語音交互更加高效經濟,為大規模商用提供了可能。星火X1.5還首發了個性化記憶與百變聲音復刻兩大功能。前者通過構建用戶記憶庫,實現長期畫像、近期反饋和短期對話的綜合理解;后者基于星火語音大模型,僅需一句錄音即可復刻任意音色,并支持指令式風格創造。
軟硬一體化解決方案是此次發布的另一大重點。科大訊飛推出了融合AI與多傳感器陣列的軟硬件一體方案,覆蓋麥克風、揚聲器、攝像頭和視覺呈現等多個維度。例如,訊飛智能辦公本X5采用上4下4環八麥克風陣列,在高噪環境下識別準確率達95.08%,遠超iPhone 17 Pro;訊飛AI翻譯耳機首創單耳三麥多感融合降噪系統,復雜噪聲下識別準確率高達97.1%;訊飛雙屏翻譯機2.0在90dB噪音下識別率達98.69%。業界首個軟硬一體的訊飛同傳麥克風支持自動翻譯免切換,首響延遲低于2秒,并可私有化部署。

在揚聲器陣列技術方面,科大訊飛通過自研硬件算法實現了立體空間聲場重構。搭載該技術的智能座艙音響方案iFLYSOUND已在19家車企量產,出貨量超100萬臺,車內音效媲美百萬豪車。視覺健康領域同樣取得突破:訊飛AI黑板搭載全球首款圓偏類自然光護眼大屏,視覺疲勞降低50%,顯示角度達130度;訊飛AI學習機集成微納米類紙屏等多項技術,獲得國內外10余項護眼認證。
多模態交互能力的提升是AI融入真實世界的關鍵。數字人導覽“小飛”展示了八項突破性技術:麥克風遠場識別、3D視覺感知、多人主動交互、類人舉止反饋、視聽覺融合理解、超擬人數字人、個性化記憶和情感語義。這些技術的聯動使AI不再局限于軟件層面,而是成為更具情感深度和應用價值的伙伴。劉慶峰強調:“超擬人多模態交互將是未來AI進入家庭的標準配置。”
在應用場景方面,科大訊飛展示了AI在教育、醫療、汽車、辦公和情感陪伴等領域的深度實踐。教育領域,星火大模型構建了由3大類、3層級、4000+標簽構成的錯因體系,通過智能批閱機和教師助手實現作業批改到課堂因材施教的“小時級閉環”。醫療領域,星火醫療大模型達到主任級醫師水平,人機協同使診斷合理率從87%提升至96%,病歷書寫時間減半。汽車領域,星火智慧座艙2.0融合13個攝像頭和54維記憶錨點,提供5項體征實時監測,打造“第三空間”。辦公領域,訊飛聽見APP和智能辦公本X5支持說話人識別自動生成會議紀要,手寫紀要與AI紀要深度融合。情感陪伴方面,“AI星朋友”擁有高保真聲音克隆和160種人設模型,通過自學習情感模型主動互動,讓科幻場景成為現實。
為推動AI生態繁榮,科大訊飛啟動了“星火點亮全球”計劃,并與多國合作伙伴簽署協議。該計劃依托星火的多語言和自主可控技術,為全球提供AI發展的“第二種選擇”。同時,科大訊飛全面開源首個原生支持RPA的智能體平臺Astron,將Agent與RPA結合,提供八大行業智能體,助力開發者跨越AI應用鴻溝。目前,訊飛開放平臺開發者總數達968萬,近一年新增200萬,大模型企業開發者增長125%,AI開發者大賽吸引來自17個國家的36,898個團隊參與,涌現出4,622個垂類智能體。














