滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 業(yè)界動(dòng)態(tài) > 正文內(nèi)容

階躍星辰Step-Audio-EditX來(lái)襲：30億參數(shù)開(kāi)啟語(yǔ)音編輯“活文本”新時(shí)代

時(shí)間：2025-11-10 14:21:05 來(lái)源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評(píng)論無(wú)障礙通道

國(guó)內(nèi)AI領(lǐng)域迎來(lái)突破性進(jìn)展——階躍星辰（StepStepFun AI）近日推出全球首個(gè)LLM級(jí)音頻編輯模型Step-Audio-EditX，以自然語(yǔ)言指令驅(qū)動(dòng)語(yǔ)音編輯的創(chuàng)新模式，徹底打破傳統(tǒng)音頻制作的技術(shù)壁壘。用戶通過(guò)簡(jiǎn)單指令如“將語(yǔ)氣調(diào)整為東北喜劇腔調(diào)”或“在結(jié)尾添加3秒羞澀笑聲”，即可實(shí)現(xiàn)音色、情感、節(jié)奏的精準(zhǔn)調(diào)控，讓語(yǔ)音編輯變得像修改文字一樣直觀。

該模型的核心競(jìng)爭(zhēng)力源于其獨(dú)特的參數(shù)壓縮技術(shù)。研發(fā)團(tuán)隊(duì)將原始130億參數(shù)的模型壓縮至30億規(guī)模，在降低90%部署成本的同時(shí)，性能指標(biāo)實(shí)現(xiàn)逆勢(shì)提升。其零樣本語(yǔ)音克隆功能僅需10秒?yún)⒖家纛l，即可高精度復(fù)現(xiàn)目標(biāo)音色；多輪迭代編輯特性支持用戶通過(guò)“再增加20%語(yǔ)速”“強(qiáng)化憤怒情緒”等細(xì)化指令，逐步逼近理想效果。

在中文語(yǔ)境適配方面，Step-Audio-EditX展現(xiàn)出顯著優(yōu)勢(shì)。模型深度理解普通話、四川話、粵語(yǔ)及英語(yǔ)的方言特質(zhì)，能自然呈現(xiàn)川渝方言的市井幽默感、粵語(yǔ)語(yǔ)氣詞的微妙情感變化。第三方盲測(cè)顯示，其方言表現(xiàn)力評(píng)分較同類(lèi)產(chǎn)品高出17%，情感傳遞準(zhǔn)確率達(dá)93.7%，音色還原度達(dá)98.1%，在自然度、情感表達(dá)、音色保真三大維度全面領(lǐng)先Minimax、字節(jié)跳動(dòng)Doubao等閉源方案。

技術(shù)突破正催生多元化應(yīng)用場(chǎng)景。短視頻創(chuàng)作者可一鍵切換“霸道總裁”“軟萌學(xué)妹”等個(gè)性化聲線；有聲書(shū)制作實(shí)現(xiàn)單人演繹多角色情感對(duì)話；方言內(nèi)容通過(guò)AI轉(zhuǎn)譯可快速適配國(guó)際市場(chǎng)，如將四川話脫口秀轉(zhuǎn)化為美式喜劇風(fēng)格；聽(tīng)障群體的語(yǔ)音合成系統(tǒng)首次具備情感溫度，告別機(jī)械刻板的表達(dá)方式。

行業(yè)分析師指出，Step-Audio-EditX重新定義了音頻內(nèi)容的生產(chǎn)范式。當(dāng)語(yǔ)音從“一次性錄制”轉(zhuǎn)變?yōu)榭煞磸?fù)雕琢的動(dòng)態(tài)文本，創(chuàng)作者將獲得前所未有的表達(dá)自由。目前該模型已開(kāi)放線上體驗(yàn)入口（https://stepaudiollm.github.io/step-audio-editx/），若未來(lái)通過(guò)API接口或手機(jī)系統(tǒng)集成，這項(xiàng)“語(yǔ)音魔法工具”有望成為全民創(chuàng)作的標(biāo)配。

11-10

中國(guó)移動(dòng)入局新石器無(wú)人車(chē)D輪融資，生態(tài)合作共探自動(dòng)駕駛新未來(lái)

11-10

第10000臺(tái)沃爾沃XC70浙江臺(tái)州工廠下線插混動(dòng)力續(xù)航超1200km 26.99萬(wàn)起售

11-10

特斯拉磁懸浮Cybertruck車(chē)模11月12日中國(guó)官網(wǎng)開(kāi)售，1:24比例精準(zhǔn)復(fù)刻實(shí)車(chē)細(xì)節(jié)

11-10

嵐圖泰山第30萬(wàn)輛整車(chē)下線 11月18日上市配四激光雷達(dá)及三腔空氣懸架

11-10

11月18日正式登場(chǎng)！吉利第5代帝豪全方位升級(jí)，尺寸加長(zhǎng)還配1.5T新動(dòng)力

11-10

一汽奧迪攜手浙江德奧集團(tuán) 2026年底前超10家銷(xiāo)售網(wǎng)點(diǎn)將啟幕

11-10

智行者牽頭項(xiàng)目獲2024北京市科技進(jìn)步一等獎(jiǎng) 助力智能車(chē)輛產(chǎn)業(yè)升級(jí)

11-10

“朱雀三號(hào)”11月中下旬首飛在即獲馬斯克盛贊引國(guó)際關(guān)注

11-10

京東攜手廣汽寧德時(shí)代推埃安UT super 售價(jià)親民續(xù)航強(qiáng)智能體驗(yàn)佳

11-10

長(zhǎng)安啟源A06上市，800V高壓平臺(tái)加持，均衡性能重塑新能源家轎新標(biāo)桿

11-10

京東攜手廣汽寧德時(shí)代，埃安UT super發(fā)布，低價(jià)入市引關(guān)注

11-10

2026武漢新能源汽車(chē)展來(lái)襲，氫能電動(dòng)與智能駕駛共繪綠色出行新藍(lán)圖

11-10

福特探險(xiǎn)者昆侖穿越版36.98萬(wàn)元上市，硬核配置助力越野穿越新體驗(yàn)

11-10

雷諾Twingo E-Tech動(dòng)力平平，卻憑時(shí)尚設(shè)計(jì)成純電小車(chē)顏值擔(dān)當(dāng)？

11-10

點(diǎn)擊查看更多 +

全站最新

第10000臺(tái)沃爾沃XC70浙江臺(tái)州工廠下線插混動(dòng)力續(xù)航超1200km 26.99萬(wàn)起售

特斯拉磁懸浮Cybertruck車(chē)模11月12日中國(guó)官網(wǎng)開(kāi)售，1:24比例精準(zhǔn)復(fù)刻實(shí)車(chē)細(xì)節(jié)

嵐圖泰山第30萬(wàn)輛整車(chē)下線 11月18日上市配四激光雷達(dá)及三腔空氣懸架

11月18日正式登場(chǎng)！吉利第5代帝豪全方位升級(jí)，尺寸加長(zhǎng)還配1.5T新動(dòng)力

一汽奧迪攜手浙江德奧集團(tuán) 2026年底前超10家銷(xiāo)售網(wǎng)點(diǎn)將啟幕

京東攜手廣汽寧德時(shí)代推埃安UT super 售價(jià)親民續(xù)航強(qiáng)智能體驗(yàn)佳

熱門(mén)內(nèi)容

本欄最新

京東攜手廣汽寧德時(shí)代推埃安UT super 售價(jià)親民續(xù)航強(qiáng)智能體驗(yàn)佳

長(zhǎng)安啟源A06上市，800V高壓平臺(tái)加持，均衡性能重塑新能源家轎新標(biāo)桿

京東攜手廣汽寧德時(shí)代，埃安UT super發(fā)布，低價(jià)入市引關(guān)注

2026武漢新能源汽車(chē)展來(lái)襲，氫能電動(dòng)與智能駕駛共繪綠色出行新藍(lán)圖

福特探險(xiǎn)者昆侖穿越版36.98萬(wàn)元上市，硬核配置助力越野穿越新體驗(yàn)

雷諾Twingo E-Tech動(dòng)力平平，卻憑時(shí)尚設(shè)計(jì)成純電小車(chē)顏值擔(dān)當(dāng)？

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類(lèi)資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

階躍星辰Step-Audio-EditX來(lái)襲：30億參數(shù)開(kāi)啟語(yǔ)音編輯“活文本”新時(shí)代

日本精品一区二区三区高清久久