滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

千問語音合成模型Qwen3-TTS 發布，支持3秒克隆音色和音色定制

時間：2025-12-24 20:30:51 來源：鞭牛士編輯：快訊 IP：北京 發表評論無障礙通道

AIPress.com.cn報道

12月24日，據官方消息，通義千問發布了新一代語音合成模型Qwen3-TTS，并同步推出兩款核心模型：音色創造模型 Qwen3-TTS-VD-Flash與音色克隆模型 Qwen3-TTS-VC-Flash。相比傳統 TTS 產品主要依賴預設音色或簡單復刻，Qwen3-TTS 將語音能力進一步擴展到“音色設計”層面。

在音色創造方面，Qwen3-TTS-VD-Flash 支持通過復雜自然語言指令直接定義聲音特征。用戶不僅可以描述音色本身，還可對韻律、情感、語氣、人設等進行精細化控制，實現從“說什么”到“如何說”的全面調控。這種方式使語音生成不再局限于已有音色或固定模板，而是可以按需求“創造聲音”。

評測數據顯示，在InstructTTS-eval中，Qwen3-TTS的綜合表現顯著優于 GPT-4o-mini-tts 和 Mimo-audio-7b-instruct；在角色扮演測試中，其表現也超過 Gemini-2.5-pro-preview-tts，體現出更強的可控性和一致性。

在音色克隆能力上，Qwen3-TTS 支持3 秒級音色克隆，并可基于克隆音色生成中文、英文、德語、意大利語、葡萄牙語、西班牙語、日語、韓語、法語、俄語等10 種主流語言。在 MiniMax TTS Multilingual Test Set 上，該模型在多語種內容穩定性和平均詞錯誤率（WER）指標上，整體優于 MiniMax、ElevenLabs 以及 GPT-4o-Audio-Preview。

兩款模型均強調高表現力與穩定性。Qwen3-TTS 可根據文本語義自動調整語氣與節奏，在長文本、多角色對話等復雜場景中，保持自然、生動的擬人化表達。同時，其文本解析能力覆蓋復雜結構和非規范化輸入，在實際應用中具備較高魯棒性。

Qwen3-TTS 支持將已創建的音色進行持久化存儲與重復調用，可用于多輪、多角色的長篇對話生成，為數字人、虛擬客服、內容創作等場景提供更靈活的語音底層能力。目前，相關模型已通過阿里云 Model Studio 提供 API 接口，面向開發者開放使用。

更多>同類資訊

這個業務，順豐不想干了

12-24

泡泡瑪特悉尼旗艦店亮相，成為南半球面積最大門店

12-24

抖音：截至11月共攔截1.2億條網暴評論，處置違規賬號超41萬個

12-24

對話麗江市古城區旅拍行業協會：小紅書過去一年讓當地旅拍行業損失超500萬，將發起集體訴訟

12-24

潮玩IP化身情感符號，Crybaby特展登陸上海

12-24

格力電器：暫時沒有空調鋁代銅計劃

12-24

徠卡紅標首次外授權小米17 Ultra定義影像旗艦新標準

12-24

作家集體起訴OpenAI等六大AI公司：指控盜版書籍訓練模型構成"故意侵權"

12-24

京東：未來3天，全北京下單七鮮小廚送巧克力

12-24

特斯拉能源存儲業務在英國再獲大單合同金額2.75億美元

12-24

小米17 Ultra確認漲價高端旗艦起售價或沖擊7000元檔

12-24

iPhone 17e已量產：傳屏幕升級靈動島 2026年春季上市

12-24

消息稱京東方將為蘋果iPhone 17e供應OLED顯示屏

12-24

繼豆包AI手機后，中興通訊相關人士稱目前已收到部分大模型廠合作邀約

12-24

影石無人機新品遭惡意抹黑，劉靖康：攻擊越猛越證方向正確

12-24

點擊查看更多 +

全站最新

嵐圖盧放直指新能源車內卷癥結：回歸用戶創新經營方破局

電動汽車充電站“高可靠性”如何衡量？行業標準與實現路徑何在？

沃爾沃XC70與理想L7對決：混動技術、安全與乘坐感受誰更優？

東風日產NX8實車亮相！增程純電雙動力，定價多少能成爆款？

吉利銀河M7實車曝光！近4米8車身+1.5L插混，續航最高155km引期待

2026年上市！昊鉑S600增程版亮相寬敞空間+長續航瞄準家庭用車市場

熱門內容

本欄最新

影石無人機新品遭惡意抹黑，劉靖康：攻擊越猛越證方向正確

科技巨頭“北京聚首”：從雷軍賠罪紅酒到李在镕訪廠，小米改寫行業規則

小米17 Ultra首發徠卡2億像素光學變焦長焦 1英寸主攝加持或成影像新標桿

小米17Ultra徠卡版正式官宣融合百年影像精髓開啟專業攝影新篇章

12.98萬起售的銳勝M8：大空間高配置，家庭商用皆宜的MPV新選擇

環球園藝沖刺港交所：小花盆“盆”出大生意，60%毛利率能否撐起全球夢？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

千問語音合成模型Qwen3-TTS 發布，支持3秒克隆音色和音色定制

日本精品一区二区三区高清久久