滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

Stable Audio 2.5正式發(fā)布：2秒生成3分鐘音頻，新增修補(bǔ)能力支持本地部署

時間：2025-09-15 06:59:36 來源：IT之家編輯：快訊團(tuán)隊 IP：北京 發(fā)表評論無障礙通道

近日，人工智能領(lǐng)域迎來重要進(jìn)展——Stability AI正式推出企業(yè)級音頻生成工具Stable Audio 2.5。這款升級版模型在音樂結(jié)構(gòu)合理性、生成效率及功能擴(kuò)展性方面實現(xiàn)突破，尤其以"2秒生成3分鐘完整曲目"的技術(shù)指標(biāo)引發(fā)行業(yè)關(guān)注。

技術(shù)團(tuán)隊重點優(yōu)化了音樂生成的邏輯架構(gòu)，使生成內(nèi)容更符合專業(yè)編曲規(guī)范。新模型能夠自動構(gòu)建包含前奏、發(fā)展段和結(jié)尾的完整曲式結(jié)構(gòu)，在旋律過渡與段落銜接上展現(xiàn)出更高水準(zhǔn)。同時，針對用戶輸入的提示詞，尤其是情緒描述類指令，系統(tǒng)響應(yīng)準(zhǔn)確度提升40%，可精準(zhǔn)呈現(xiàn)"激昂的搖滾樂"或"憂郁的爵士小調(diào)"等復(fù)雜要求。

生成效率的革命性提升得益于ARC（相對對抗-對比訓(xùn)練）算法的突破。該技術(shù)通過動態(tài)調(diào)整對抗訓(xùn)練與對比判別的權(quán)重比例，在保持192kHz高清音質(zhì)的前提下，將GPU推理耗時壓縮至傳統(tǒng)模型的1/15。這種效率躍升使即時音樂創(chuàng)作成為可能，創(chuàng)作者可在2秒內(nèi)獲得可用于商業(yè)發(fā)布的完整音軌。

功能創(chuàng)新方面，音頻修補(bǔ)技術(shù)成為最大亮點。用戶上傳自有音頻后，系統(tǒng)可智能識別曲風(fēng)特征與段落結(jié)構(gòu)，在指定位置實現(xiàn)無縫延長。這項技術(shù)特別適用于影視配樂、廣告音效等需要精確時長控制的場景，經(jīng)測試，延展內(nèi)容的風(fēng)格一致性達(dá)到92%以上。

在版權(quán)保護(hù)層面，平臺建立雙重防護(hù)機(jī)制。用戶上傳內(nèi)容需通過AI內(nèi)容識別系統(tǒng)的版權(quán)篩查，同時生成音頻自動嵌入數(shù)字水印。目前該服務(wù)已開放網(wǎng)頁端即時體驗與本地化部署雙模式，但明確禁止處理任何受版權(quán)保護(hù)的音樂素材。技術(shù)文檔顯示，系統(tǒng)對流行、電子、古典等23種音樂風(fēng)格的識別準(zhǔn)確率均超過85%。

更多>同類資訊

魏少軍直指算力命脈：ASIC能否為中國AI裝上“自主心臟”？

09-15

人形機(jī)器人賽道添新軍，拓斯達(dá)攜拓星紀(jì)系列開啟工業(yè)場景新征程

今年上半年，拓斯達(dá)先后完成了雙臂智能機(jī)器人、具身智能碼垛工作站等產(chǎn)品驗證和實地應(yīng)用，為人形機(jī)器人的機(jī)械臂本體硬件、運動控制系統(tǒng)以及端到端大模型等算法做出充足的準(zhǔn)備。拓斯達(dá)在2017年開設(shè)了該板塊，主要是提供…

09-15

Snap邁向2026關(guān)鍵年：AR眼鏡Specs領(lǐng)航，AI賦能與組織創(chuàng)新并進(jìn)

Specs不僅是Snap當(dāng)前發(fā)展的核心重點，在斯皮格爾看來，AR眼鏡與人工智能的深度結(jié)合，更將從根本上改變?nèi)藗児ぷ鳌W(xué)習(xí)與娛樂的方式，開啟全新的生活與生產(chǎn)模式。斯皮格爾表示，這些實體商品的功能未來可通過“…

09-15

當(dāng)AI深度介入親密關(guān)系：一場關(guān)于情感依賴與心理失控的警示

09-15

權(quán)益基金發(fā)行升溫：多只規(guī)模超10億，科技成長或成未來經(jīng)濟(jì)新引擎

09-15

當(dāng)AI成為親密關(guān)系“替身”：我們?nèi)绾卧谔摂M溫柔鄉(xiāng)里守住真實？

09-15

?研究人員推出集成AI同行評審的預(yù)印本平臺，助力構(gòu)建科研新生態(tài)與出版新范式?

09-15

博士CEO領(lǐng)路探秘：上海創(chuàng)智學(xué)院里，優(yōu)秀青年共筑AI創(chuàng)新夢

09-15

張朝陽橫渡海灣后談互聯(lián)網(wǎng)：視頻自媒體熱度不減，倡導(dǎo)長期主義與創(chuàng)新賽道

09-15

“海馬emoji”究竟存不存在？ChatGPT等AI陷入集體認(rèn)知“迷局”

09-15

《服貿(mào)·2025》來襲！以游戲之姿探秘服貿(mào)會上的機(jī)器人“天團(tuán)”

今年服貿(mào)會迎來版本更新，將“數(shù)智領(lǐng)航，服貿(mào)煥新”作為年度主題。本屆服貿(mào)會更加注重科技化、智能化應(yīng)用，利用AI+會展模式突出科技辦展特點。記者帶你用游戲視角，解鎖服貿(mào)會上的機(jī)器人“天團(tuán)”。新華社音視頻部制…

09-15

?2025世界機(jī)器人大賽山東省賽在濱城開賽近300名青少年競技展風(fēng)采?

世界機(jī)器人大賽作為全球極具影響力的青少年科技競技平臺，本次高水平賽事的舉辦，讓青少年在競技技能比拼中，生動展現(xiàn)科技教育的發(fā)展，既是青少年創(chuàng)新實踐成果的集中展示，也是點燃科學(xué)夢想、培育未來英才的重要載體，更是濱…

09-15

螞蟻開源外灘大會發(fā)布報告：AI編程工具崛起，中美開源生態(tài)路線分化明顯

09-15

螞蟻開源發(fā)布2025大模型全景圖：中美AI開發(fā)路線分化，AI編程工具迎來爆發(fā)增長

09-15

螞蟻開源外灘大會發(fā)布2025大模型全景圖，展現(xiàn)AI開發(fā)新生態(tài)與中美路線分化等趨勢

9 月 13 日，在 2025 Inclusion·外灘大會AI開源見解論壇上，螞蟻開源聯(lián)合Inclusion AI 發(fā)布了全新的《全球大模型開源開發(fā)生態(tài)全景與趨勢告》。本次發(fā)布的大模型開源開發(fā)生態(tài)全景圖共…

09-14

點擊查看更多 +

全站最新

魏少軍直指算力命脈：ASIC能否為中國AI裝上“自主心臟”？

蘋果iPhone 17系列首搭自研N1芯片，Wi-Fi 7帶寬160MHz未達(dá)標(biāo)準(zhǔn)規(guī)格

京東方發(fā)布頂級LCD屏！驍龍8至尊2代+萬毫安電池，LCD黨期待的真機(jī)要來了

8月中大型SUV銷量TOP15揭曉：小米YU7領(lǐng)跑，自主品牌電動車成主力

2025年新能源優(yōu)選：三款車?yán)m(xù)航強(qiáng)勁智能出色，帶你開啟全新駕駛之旅

華中科技大學(xué)官網(wǎng)撤下王騰資料小米前高管因違規(guī)違紀(jì)被辭退引關(guān)注

熱門內(nèi)容

本欄最新

魏少軍直指算力命脈：ASIC能否為中國AI裝上“自主心臟”？

人形機(jī)器人賽道添新軍，拓斯達(dá)攜拓星紀(jì)系列開啟工業(yè)場景新征程

Snap邁向2026關(guān)鍵年：AR眼鏡Specs領(lǐng)航，AI賦能與組織創(chuàng)新并進(jìn)

當(dāng)AI深度介入親密關(guān)系：一場關(guān)于情感依賴與心理失控的警示

當(dāng)AI成為親密關(guān)系“替身”：我們?nèi)绾卧谔摂M溫柔鄉(xiāng)里守住真實？

?研究人員推出集成AI同行評審的預(yù)印本平臺，助力構(gòu)建科研新生態(tài)與出版新范式?

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

Stable Audio 2.5正式發(fā)布：2秒生成3分鐘音頻，新增修補(bǔ)能力支持本地部署

日本精品一区二区三区高清久久