滾動資訊

當(dāng)前位置：首頁 > 資訊 > 手機快報 > 正文內(nèi)容

Stable Audio Open Small：手機秒變音頻創(chuàng)作站，7秒生成11秒高質(zhì)量立體聲

時間：2025-05-19 10:09:03 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

近期，Stability AI攜手Arm共同揭曉了一款革命性的文本轉(zhuǎn)音頻模型——“穩(wěn)定音頻開放小型”。這款模型以其緊湊高效的設(shè)計，能夠在短短7秒內(nèi)創(chuàng)造出長達(dá)11秒的高保真立體聲音頻，并且專為在智能手機等便攜設(shè)備上流暢運行而優(yōu)化。

這項技術(shù)的核心突破得益于加州大學(xué)伯克利分校研究團隊的創(chuàng)新成果——“對抗相對對比”（ARC）技術(shù)。在高端硬件平臺，如Nvidia H100 GPU上，該模型的性能更是令人矚目，僅需75毫秒即可完成44kHz立體聲頻的合成，幾乎達(dá)到了實時音頻生成的境界。

相較于去年推出的擁有11億參數(shù)的Stable Audio Open原版，此次發(fā)布的精簡版模型參數(shù)量大幅縮減至3.41億，顯著降低了對計算資源的需求，使其能夠輕松駕馭消費級硬件。這一成就標(biāo)志著Stability AI與Arm自今年3月宣布合作以來的首個重大里程碑。

為了實現(xiàn)在智能手機上的無縫運行，開發(fā)團隊對模型架構(gòu)進行了全面革新，巧妙地將系統(tǒng)劃分為三大核心組件：負(fù)責(zé)壓縮音頻數(shù)據(jù)的自動編碼器、解析文本提示的嵌入模塊，以及生成最終音頻的擴散模型。這一精妙設(shè)計確保了模型在資源受限的環(huán)境下依然能保持高效能。

Stability AI指出，該模型在音效模擬和現(xiàn)場錄音再現(xiàn)方面展現(xiàn)出了卓越的能力，但在音樂創(chuàng)作，特別是歌聲處理上仍存在局限性，且目前主要支持英語文本輸入。盡管如此，其在特定領(lǐng)域內(nèi)的表現(xiàn)已足夠令人印象深刻。

在模型訓(xùn)練過程中，開發(fā)團隊精心挑選了來自Freesound數(shù)據(jù)庫的約472,000個符合CC0、CC-BY或CC-Sampling+許可協(xié)議的音頻片段。通過一系列嚴(yán)格的自動化檢查，確保了訓(xùn)練數(shù)據(jù)的版權(quán)合規(guī)性，有效避免了潛在的版權(quán)爭議。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

聯(lián)發(fā)科天璣9500搶跑：或先于驍龍8 Elite 2，成最強Soc？

06-10

iPad mini 5也能用臺前調(diào)度？iPadOS 26新功能大放送

06-10

谷歌賬號安全漏洞：手機號碼遭暴力破解，安全人員獲獎5000美元

06-10

REDMI K80至尊版來襲：豪華性能無妥協(xié)，王騰透露滿滿誠意

06-10

薇婭低調(diào)“回歸”？“謙尋超級會員”小程序頻現(xiàn)其身影

有網(wǎng)友在社交平臺發(fā)文稱，一個名為“謙尋超級會員”的微信小程序悄然上線，背后有著薇婭夫婦的身影，薇婭本人更是在視頻中做出鏡模特。據(jù)悉，薇婭的丈夫董海鋒于5月22日在其抖音發(fā)布紀(jì)念薇婭直播九周年的視頻，隨后在…

06-10

iOS 26測試版液態(tài)玻璃設(shè)計引熱議：圖標(biāo)文字疊加，可讀性成問題？

6月10日，多位博主在社交平臺上分享了iPhone升級至iOS 26測試版的體驗。盡管該版本引入了全新的液態(tài)玻璃（LiquidGlass）設(shè)計，但在實際使用中出現(xiàn)了問題。博主們指出，控制中心的背景高斯模糊…

06-10

李佳琦直播十年路：迷茫氣餒未曾棄，堅持熱愛見風(fēng)景

6月10日，在合肥舉辦的2025年中國網(wǎng)絡(luò)文明大會上，李佳琦回顧了自己的直播經(jīng)歷。他提到：“我們其余的六位同行，也一個一個的選擇離開，那段時間里，我也很迷茫，也很懷疑，甚至也有了氣餒。所幸我最初沒有放棄?！薄?/div>

06-10

聯(lián)想凈利潤大幅下滑，研發(fā)投入不足華為十分之一，轉(zhuǎn)型之路何在？

06-10

蘋果iOS 26遭三星嘲諷：新功能似曾相識，AI競賽落后了嗎？

06-10

iPadOS26重磅來襲！多任務(wù)與文件管理革新，iPad體驗直逼Mac

06-10

鴻蒙版小紅書新升級，華為Pura 80系列用戶社交體驗再提升

06-10

Windows 11新開始菜單大變身：可滾動、可定制，還有手機互聯(lián)新功能！

06-10

真我GT7阿斯頓馬丁F1限量版開箱：性能與奢華的完美碰撞！

06-10

蘋果macOS 26液態(tài)玻璃設(shè)計，是否讓你想起了Windows Vista的Aero Glass？

06-10

紅魔電競平板3 Pro來襲，姜超透露價格不夸張或有驚喜

06-10

點擊查看更多 +

全站最新

上汽大眾5月銷量回暖，油電并進策略成效顯著！

中聯(lián)重科中非經(jīng)貿(mào)博覽會“硬核”亮相，共譜中非合作新未來！

滴滴商旅新升級：AI助手讓差旅管理既高效又貼心

上海毫米波雷達(dá)芯片巨頭，如何領(lǐng)跑UWB新標(biāo)準(zhǔn)？

小鵬汽車追責(zé)自媒體：違反保密協(xié)議泄露G7拍攝內(nèi)容

芯聯(lián)集成：四大引擎驅(qū)動成長，毛利率轉(zhuǎn)正，盈利拐點已至？

熱門內(nèi)容

本欄最新

聯(lián)發(fā)科天璣9500搶跑：或先于驍龍8 Elite 2，成最強Soc？

iPad mini 5也能用臺前調(diào)度？iPadOS 26新功能大放送

REDMI K80至尊版來襲：豪華性能無妥協(xié)，王騰透露滿滿誠意

薇婭低調(diào)“回歸”？“謙尋超級會員”小程序頻現(xiàn)其身影

iOS 26測試版液態(tài)玻璃設(shè)計引熱議：圖標(biāo)文字疊加，可讀性成問題？

李佳琦直播十年路：迷茫氣餒未曾棄，堅持熱愛見風(fēng)景

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

主站蜘蛛池模板：蓬安县| 浦县| 凤翔县| 清水河县| 云南省| 昌邑市| 普洱| 柳河县| 和静县| 海伦市| 鄂伦春自治旗| 武邑县| 安新县| 吉木萨尔县| 昭觉县| 舒兰市| 伊宁市| 正阳县| 涞源县| 高清| 灌阳县| 商南县| 班玛县| 桑日县| 镇巴县| 邢台市| 哈尔滨市| 沿河| 阿坝| 水城县| 鸡西市| 永嘉县| 特克斯县| 苍梧县| 徐水县| 襄垣县| 鹤峰县| 海晏县| 右玉县| 海晏县| 法库县|

日本精品一区二区三区高清 久久

Stable Audio Open Small：手機秒變音頻創(chuàng)作站，7秒生成11秒高質(zhì)量立體聲

日本精品一区二区三区高清久久

Stable Audio Open Small：手機秒變音頻創(chuàng)作站，7秒生成11秒高質(zhì)量立體聲