滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

英偉達用 AI 給紀錄片配音：情緒節奏穩穩拿捏，不說根本聽不出來

時間：2021-09-01 16:11:13 來源：量子位編輯：星輝 發表評論無障礙通道

雖然日常和你對話的 Siri 聲音機械，還常常胡亂斷句，但實際上，最新的技術進展顯示，AI 的語音合成能力已經可以說得上是以假亂真。

比如英偉達，最近就發布了一個更懂節奏、更具感情的語音合成 AI。

在英偉達的紀錄片中，她的自我介紹口齒清晰自不必說，氣息頓挫、情緒把控，播音員范兒絕對夠正。

幀級控制合成語音

英偉達將在 9 月 3 日的語音技術頂會 Interspeech 2021 上展示該項目的最新成果。

不過，其背后的技術，此前就已經幫助自家數字人在 SIGGRAPH Real-Time Live 上摘下了最佳展示獎。

核心是名為 RAD-TTS 的語音合成方法。

這是一個并行的端到端 TTS 模型。與此前的并行方法不同，RAD-TTS 將語音節奏作為一個單獨的生成分布來建模。如此，在推理過程中，語音的持續時間就能被更好地控制。

從 RAD-TTS 的演示界面中也可以看出，用戶可以在幀級別上控制合成語音的音調、持續時間和節奏力度。

研究人員還介紹，RAD-TTS 既可以將任意文本轉換成說話人的聲音，也可以將一個說話人的聲音(甚至是歌聲)轉換成另一個人的聲音。

也就是說，合成語音的制作人可以像指導配音演員一樣去“指導”AI，讓它學會哪個單詞應該重點突出、節奏如何把控更符合創作基調等等。

機器語音能有多真實?

其實，不只是英偉達，此前，小冰也發布過超級自然語音技術。

把一句人類的語音混進小冰的語音里，你能分辨到底哪一句來自真正的人類嗎?

不過，小冰公司 CEO 李笛此前曾表示，AI 的聲音太接近真人，就很有可能被濫用。因此小冰禁止為普通個人訓練聲音。

但這樣的技術，也正在通過電臺、便利店等更多商業場景，走進人們的日常生活。

參考鏈接：

[1] 論文地址：https://openreview.net/forum?id=0NQwnnwAORi

[2]https://blogs.nvidia.com/blog/2021/08/31/conversational-ai-research-speech-synthesis-interspeech/

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

測測達人攜手FARMER BOB：春日治愈行動，讓情緒找到回響

04-18

閃迪創作者系列全新上市，專業存儲方案賦能內容創作者高效產出

04-18

AI造游戲，路還長嗎？

04-18

智譜AI獲多方青睞，北京基金再追投2億助力開源生態建設

04-18

智平方AlphaBot 2升級亮相：DeepSeek技術賦能，開啟通用智能新篇章

04-18

谷歌Gemini 2.5 Flash突破性發布：成本大幅降低，性能依舊強勁

04-18

關稅風暴中，全球AI產業如何破局前行？

此外，由于對等關稅大棒給全球經濟體都造成了沖擊，由此產生對美國技術生態體系的不信任，或許也是一個中國AI合縱連橫的窗口期，來增強中國AI技術生態的韌性，比如，吸引海外開發者使用國產化AI框架、開發工具、AI…

04-18

銀行業科技投入分化，大模型應用深度融入核心業務成亮點

對此，鈦媒體App重點梳理了10家銀行（包括國有六大行和招行、中信、平安、興業4家股份行）財報，以此一窺國內頭部銀行的最新科技故事。總的來說，雖然智能客服、代碼助手等已是普遍應用，但上述銀行在專業領域的深…

04-18

訊飛雙屏翻譯機2.0新品發布：智能升級，讓跨境溝通無界高效！

04-18

蘿卜快跑海南布局再落一子，新公司注冊資本達百萬

04-18

AMD GPU大飛躍！Stable Diffusion模型性能提升最高達3.8倍

04-18

芯明慕尼黑電子展大放異彩：空間智能如何重塑人形機器人未來？

04-18

智譜連發三款開源模型，豪擲3億支持全球AI開源社區，加速生態建設

智東西4月18日報道，今天，智譜總裁王紹蘭向智東西等媒體詳細介紹了智譜開源模型的最新進展，并宣布智譜Z基金出資3億元，以支持全球范圍內的AI開源社區發展，任何基于開源模型（不局限于智譜開源模型）的創業項目均…

04-18

5G加速跑！我國5G基站累計建成開通已超439萬個

04-18

蘋果新款Apple TV 4K即將發布，四大升級能否重塑智能客廳體驗？

04-18

點擊查看更多 +

全站最新

“成都世運號”首飛！世運會元素涂裝飛機亮相雙流機場

上海車展看點十足！合資進口新車齊上陣，哪款能打動你的心？

上汽大眾朗逸Pro全新升級，雙前臉設計曝光，能否再掀家轎熱潮？

2025上海車展亮點新車搶先看：極氪9X“杭州灣庫里南”能否驚艷全場？

比亞迪方程豹鈦3震撼登場，年輕人的智能SUV新寵兒！

阿維塔06明日上市：純電增程雙選擇，智能配置引期待

熱門內容

本欄最新

測測達人攜手FARMER BOB：春日治愈行動，讓情緒找到回響

閃迪創作者系列全新上市，專業存儲方案賦能內容創作者高效產出

AI造游戲，路還長嗎？

智譜AI獲多方青睞，北京基金再追投2億助力開源生態建設

智平方AlphaBot 2升級亮相：DeepSeek技術賦能，開啟通用智能新篇章

關稅風暴中，全球AI產業如何破局前行？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

英偉達用 AI 給紀錄片配音：情緒節奏穩穩拿捏，不說根本聽不出來

日本精品一区二区三区高清久久