滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

通義千問Qwen3-TTS語音合成模型發布：3秒克隆音色，還能定制專屬聲音

時間：2025-12-25 01:17:36 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

通義千問近日正式推出新一代語音合成技術Qwen3-TTS，并同步上線兩款創新模型：音色創造模型Qwen3-TTS-VD-Flash與音色克隆模型Qwen3-TTS-VC-Flash。這項突破性技術將傳統語音合成從“復刻聲音”升級為“設計聲音”，為用戶提供前所未有的語音創作自由度。

在音色設計領域，Qwen3-TTS-VD-Flash實現了自然語言驅動的精細化控制。用戶可通過文本指令同時調節音色基底、情感表達、語速節奏甚至角色特征，例如指定“帶有磁性嗓音的年輕男性用歡快語氣講述童話故事”。這種多維調控能力使語音生成突破了預設音色的限制，真正實現“按需定制”。第三方評測顯示，該模型在InstructTTS-eval基準測試中綜合得分領先GPT-4o-mini-tts和Mimo-audio-7b-instruct，角色扮演場景下的表現更超越Gemini-2.5-pro-preview-tts。

針對音色克隆需求，Qwen3-TTS-VC-Flash展現出驚人的技術突破。僅需3秒原始音頻樣本，即可完成高保真音色克隆，并支持中、英、日、韓、法、德、西、意、葡、俄等十種語言的跨語種輸出。在MiniMax多語種測試集中，該模型在語音穩定性和詞錯誤率（WER）兩項核心指標上均優于MiniMax、ElevenLabs及GPT-4o-Audio-Preview等主流方案。

技術團隊特別強化了模型的場景適應能力。通過語義理解引擎，系統能自動匹配文本情緒調整語音特征，在長篇敘述或多人對話場景中保持自然流暢的擬人化表達。其文本解析模塊可處理復雜句式和非規范輸入，確保在真實應用環境中保持穩定輸出。例如在數字人直播場景中，系統能同時管理多個角色的語音特征，實現無縫切換。

為提升實用價值，開發團隊構建了音色管理系統，支持用戶將定制音色保存至云端庫，實現跨項目復用。這項功能特別適用于需要持續語音輸出的場景，如虛擬客服的長期服務或系列有聲內容的制作。目前相關技術已通過阿里云Model Studio開放API接口，開發者可快速集成至各類應用中，為智能交互、內容生產等領域注入新的語音能力。

更多>同類資訊

順豐退出抖音電商退貨賽道：低毛利高成本下的戰略收縮與行業變局

12-25

泡泡瑪特悉尼旗艦店啟航，以藝術體驗打造南半球潮玩新地標

12-25

以淚為引開啟情緒冒險，Crybaby特展上海打造冬日治愈新地標

12-25

小米汽車智駕路線全預研：不“一刀切”選技術，以用戶感知為判斷標準

12-25

比亞迪方程豹2025年銷量目標達成主力車型鈦7成現象級爆款

12-25

京東送福利啦！12月25日至27日全北京下單七鮮小廚，4萬份歌帝梵巧克力先到先得

12-25

內存成本飆升致漲價小米17 Ultra高端旗艦或邁入7000元新門檻

12-25

iPhone 17e量產在即：或配靈動島設計 2026年春登場鞏固中端布局

12-25

京東方或為蘋果iPhone 17e供應OLED屏今年供應量已達3500萬塊

12-25

豆包AI手機引關注，中興通訊攜手字節跳動推進合作，已收大模型廠邀約

12-25

中興通訊詳解與字節合作：戰略同頻共筑AI手機新未來

12-24

OPPO姜昱辰談AI手機：開放合作，1月將官宣新伙伴共探生態新路

12-24

谷歌母公司330億收購能源商，加速AI基建布局與能源技術革新

12-24

字節跳動Seed Prover 1.5模型亮相，數學競賽證明能力達金牌水準

12-24

小米汽車新專利：智能感知環境精準調控車輛提示音適配場景

12-24

點擊查看更多 +

全站最新

捷豹F-Pace最后一輛下線，燃油時代落幕，電動新篇待啟

全新寶馬純電M3諜照來襲，肌肉感身姿吸睛，性能參數與挑戰并存

長安汽車回應網絡謠言：廢輕鐵拍賣致國資流失為不實信息

福建廈門社保科創基金登記成立出資額200億

歐普康視與三只羊合資公司注銷

包頭市比亞迪礦用車更名為電池公司

熱門內容

本欄最新

AI智能媒體助理數據分析賦能：從流量迷茫到精準變現的破局之道

2025年AI大模型：技術革新、市場重構與應用新生態全解析

2025阿里媽媽未來商業獎終審：AI賦能品牌，解鎖未來高質增長新路徑

抖音洗浴消費報告：冬日“暖經濟”升溫，90后主力00后增速領跑

2025阿里媽媽未來商業獎終審收官，AI賦能品牌探索高質增長新路徑

2026年比亞迪火力全開！多款新車來襲，覆蓋多領域沖擊全球市場

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

通義千問Qwen3-TTS語音合成模型發布：3秒克隆音色，還能定制專屬聲音

日本精品一区二区三区高清久久