日本精品一区二区三区高清久久

ITBear科技資訊
手機版
二維碼
內容搜索
無障礙通道
語言：中文 EN

ITBear旗下自媒體矩陣：

滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

英偉達與MIT合作推出Audio-SDS：AI音效生成迎來參數化控制新突破

時間：2025-05-13 14:29:39 來源：ITBEAR編輯：快訊團隊 發表評論無障礙通道

近日，科技界傳來一項新的合作成果，英偉達與麻省理工學院（MIT）攜手推出了Audio-SDS技術，這是一項基于文本條件的音頻擴散模型擴展技術，為音頻生成領域帶來了新突破。

音頻擴散模型在近年來憑借其生成高質量音頻的能力備受矚目。然而，這類模型的一個顯著局限在于難以對明確且可解釋的參數進行優化，這限制了其在實際應用中的靈活性和廣泛性。

為了克服這一挑戰，英偉達與MIT的科研團隊首次將Score Distillation Sampling（SDS）方法引入到音頻領域。他們結合了預訓練模型的強大生成能力與參數化音頻表示，從而無需依賴大規模特定數據集，即可應用于FM合成器參數校準、物理沖擊音合成以及音源分離等三大關鍵任務。

SDS技術此前已在文本生成3D圖像和圖像編輯領域得到了廣泛應用。英偉達此次將SDS技術與音頻生成相結合，推出了Audio-SDS。該技術能夠利用預訓練模型的先驗知識，直接根據高級文本提示調整FM合成參數、沖擊音模擬器或分離掩碼，從而實現了更加靈活和精準的音頻生成。

在實驗中，研究團隊采用了基于解碼器的SDS、多步去噪以及多尺度頻譜圖等方法。實驗結果表明，Audio-SDS在主觀聽覺測試和客觀指標（如CLAP分數、信號失真比SDR）上均展現出了卓越的性能。

Audio-SDS的一大創新之處在于，它僅需一個預訓練模型即可支持多種音頻任務，從而極大地降低了對大規模領域特定數據集的依賴。這一特性使得Audio-SDS在音頻生成領域具有更廣泛的應用前景。

然而，研究團隊也指出了Audio-SDS目前仍面臨的一些挑戰，包括模型覆蓋范圍有限、潛在編碼偽影以及優化敏感性等問題。他們表示，未來將繼續致力于解決這些問題，以進一步提升Audio-SDS的性能和應用范圍。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

谷神星一號再創佳績，海射型遙五火箭成功升空完成第20次飛行任務！

05-19

臺積電2nm晶圓漲價在即，海外建廠成本上升成主因

05-19

微軟展望AI智能體未來：協同作業修bug，記憶用戶指令繪交互圖

05-19

鵲橋二號中繼星在軌14月，科學探測成果斐然，助力嫦娥六號月背取樣

05-19

市集經濟熱潮下，如何解鎖新“流量密碼”？

青年市集品牌主理人“沒事找市”李紫陽則告訴驚蟄研究所，“在市集參與擺攤的群體里，除了部分有一定創業經驗的專業攤主外，還有另外一部分是出于興趣愛好或者對新鮮體驗的好奇而加入其中的，這部分群體在擺攤初期往往充滿…

05-19

娃哈哈今麥郎代工風波：品牌信任危機下的透明化拷問

娃哈哈這邊，雖然及時終止代工，回歸自產，但品牌信任的微妙損耗難以忽視；而今麥郎這邊，失去代工訂單，水廠產能再度閑置，更有人擔憂，娃哈哈的聲明是說今麥郎生產質量不行嗎？泉陽泉為戴永紅、盒馬代工、康師傅為百事可…

05-19

廈門國資巨頭建發系：四年重組五家上市公司，能否撬動利潤新增長點？

和建發相似，象嶼的主營業務也是供應鏈管理，但其金屬資源品類更為突出，2024年金屬礦產業務營收就達到2149億元，占比接近六成。破產重整中，建發、象嶼可以憑借資本優勢，以打骨折的低價收購各行各業的資產，但…

05-19

高強度運動下，你的大腦真的會讓時間“慢下來”嗎？

05-19

廣州移動加速萬兆光網布局，20個標桿小區園區即將誕生！

05-19

小米破獲網絡黑公關案，雷軍力挺：堅決法律維權！

小米法務部發文稱，2025年5月15日，從司法機關處獲悉，此前報案的一起有組織、有預謀的網絡黑公關案件，已經告破。目前，公安機關已依法對多名犯罪嫌疑人采取刑事強制措施，案件還在進一步調查。…

05-19

于東來欲“放手”胖東來，資產贈團隊，立志傳播科學生活理念

胖東來創始人于東來發文稱，非常想今后跟胖東來企業沒有任何關系，所有的資產都屬于現有的團隊，然后他就專心的給喜歡胖東來文化理念的人分享科學的生活方式和生活方法，讓更多人規避痛苦，活在輕松自信自由美麗的生命狀態…

05-19

馬云、李子園等攜手成立江西雙園食品，注冊資本高達兩千萬

天眼查App顯示，近日，江西雙園食品有限公司成立，法定代表人為汪偉，注冊資本2000萬人民幣，經營范圍含食品生產、調味品生產、生鮮乳收購、食品互聯網銷售、食品用塑料包裝容器工具制品生產、食品銷售等。股東信息…

05-19

國產鏡頭自動對焦新紀元，展會新品大放異彩！

05-19

微軟控制面板再“瘦身”，語言設置遷入新家園

05-19

余承東高燒不退仍堅持演講，拼搏精神獲網友點贊

05-19

點擊查看更多 +

全站最新

娃哈哈今麥郎代工風波：品牌信任危機下的透明化拷問

廈門國資巨頭建發系：四年重組五家上市公司，能否撬動利潤新增長點？

華為nova 14系列及鴻蒙電腦發布，何剛余承東共掀科技浪潮！

華為nova 14系列震撼登場：星耀環設計+紅楓影像，售價僅2699元起

華為HarmonyOS 5.0.1升級啟動，首批覆蓋超20款熱門機型！

高強度運動下，你的大腦真的會讓時間“慢下來”嗎？

熱門內容

本欄最新

娃哈哈今麥郎代工風波：品牌信任危機下的透明化拷問

廈門國資巨頭建發系：四年重組五家上市公司，能否撬動利潤新增長點？

高強度運動下，你的大腦真的會讓時間“慢下來”嗎？

廣州移動加速萬兆光網布局，20個標桿小區園區即將誕生！

于東來欲“放手”胖東來，資產贈團隊，立志傳播科學生活理念

馬云、李子園等攜手成立江西雙園食品，注冊資本高達兩千萬

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

主站蜘蛛池模板：长丰县| 合肥市| 南宫市| 方正县| 莱阳市| 泽普县| 长武县| 奇台县| 高陵县| 蕉岭县| 莲花县| 弋阳县| 博白县| 仪征市| 临汾市| 景德镇市| 东辽县| 手机| 东乌珠穆沁旗| 冀州市| 龙海市| 马公市| 宁夏| 泊头市| 黄山市| 平昌县| 大厂| 周至县| 扶绥县| 房山区| 安吉县| 中西区| 伊川县| 景德镇市| 奇台县| 武宁县| 甘孜县| 石阡县| 广河县| 龙泉市| 运城市|

日本精品一区二区三区高清 久久

英偉達與MIT合作推出Audio-SDS：AI音效生成迎來參數化控制新突破

日本精品一区二区三区高清久久