在第八屆世界聲博會(huì)暨2025科大訊飛全球1024開發(fā)者節(jié)上,科大訊飛正式推出深度推理大模型“訊飛星火X1.5”,同步展示多項(xiàng)AI軟硬件融合創(chuàng)新成果及行業(yè)應(yīng)用場(chǎng)景。該模型采用混合專家架構(gòu),總參數(shù)量達(dá)2930億,激活參數(shù)300億,在語言理解、邏輯推理、數(shù)學(xué)運(yùn)算及代碼生成等核心能力上實(shí)現(xiàn)顯著突破,支持130余種語言交互。
據(jù)技術(shù)團(tuán)隊(duì)披露,星火X1.5通過優(yōu)化長(zhǎng)思維鏈強(qiáng)化學(xué)習(xí)機(jī)制,將深度推理訓(xùn)練效率從30%提升至84%以上,同時(shí)重構(gòu)MoE訓(xùn)練鏈路,在保持性能的前提下降低能耗與成本。值得關(guān)注的是,科大訊飛同步發(fā)布非自回歸架構(gòu)語音大模型,該模型可并行輸出完整文本序列,推理效率提升16%,成本降幅達(dá)520%,為實(shí)時(shí)語音交互場(chǎng)景提供技術(shù)支撐。
科大訊飛董事長(zhǎng)劉慶峰重點(diǎn)演示了模型的兩大創(chuàng)新功能:其一是基于用戶畫像的個(gè)性化記憶系統(tǒng),通過構(gòu)建動(dòng)態(tài)記憶庫,模型可綜合分析用戶長(zhǎng)期偏好、近期反饋及短期對(duì)話內(nèi)容,實(shí)現(xiàn)精準(zhǔn)交互;其二是百變聲音復(fù)刻技術(shù),依托星火語音大模型,僅需1秒錄音即可復(fù)刻任意音色,并支持跨語言風(fēng)格遷移,滿足影視配音、虛擬主播等多元化需求。
在應(yīng)用落地層面,科大訊飛推出多款智能終端產(chǎn)品:智能辦公本X5集成多模態(tài)交互能力,支持會(huì)議紀(jì)要自動(dòng)生成;AI翻譯耳機(jī)實(shí)現(xiàn)83種語言實(shí)時(shí)互譯;雙屏翻譯機(jī)則針對(duì)商務(wù)場(chǎng)景優(yōu)化跨語言溝通效率。醫(yī)療領(lǐng)域,智醫(yī)助理醫(yī)院版1.0可輔助醫(yī)生進(jìn)行診斷決策并自動(dòng)生成電子病歷;教育場(chǎng)景中,訊飛學(xué)習(xí)機(jī)與AI批閱系統(tǒng)通過分析學(xué)生作業(yè)數(shù)據(jù),提供個(gè)性化學(xué)習(xí)路徑規(guī)劃。
面向開發(fā)者生態(tài),科大訊飛發(fā)布國(guó)內(nèi)首個(gè)支持RPA的智能體平臺(tái)“Astron”,該平臺(tái)已聯(lián)合行業(yè)頭部企業(yè)打造300余個(gè)智能體應(yīng)用。其中“星火行業(yè)分析師”通過工信部認(rèn)證,可自動(dòng)完成市場(chǎng)調(diào)研、數(shù)據(jù)可視化等復(fù)雜任務(wù)。數(shù)據(jù)顯示,截至2025年10月,訊飛開放平臺(tái)開發(fā)者數(shù)量突破968萬,年內(nèi)新增200萬,大模型相關(guān)開發(fā)者增長(zhǎng)125%,形成覆蓋金融、醫(yī)療、教育等20余個(gè)行業(yè)的解決方案庫。











