近期,Qwen-TTS語音合成技術取得了顯著進步,通過Qwen API平臺發布了其最新版本,極大地豐富了用戶的語音合成體驗。
新版本中,Qwen-TTS實現了對三種中文方言的突破性支持,涵蓋了北京話、上海話和四川話,這一創新拓展了其應用場景的邊界。該模型基于龐大的語料庫訓練而成,語料庫規模超過300萬小時,確保了合成語音的自然度和表現力接近人類水平。Qwen-TTS不僅具備高精度的語音合成能力,還能智能調整韻律、節奏和情緒,使得生成的語音更加生動、富有感染力。
在音色方面,Qwen-TTS提供了多樣化的選擇,現已支持七種中英雙語音色,包括Cherry、Ethan等通用音色,以及專為方言設計的特色音色,如北京話的Dylan、上海話的Jada和四川話的Sunny。用戶可以根據實際需求,輕松選擇最適合的音色進行語音合成。
實際應用中,Qwen-TTS展現出了卓越的性能。無論是描繪日常生活場景,還是傳達細膩復雜的情感,它都能生成自然且流暢的語音。例如,使用Dylan音色合成關于童年游戲的北京話語音時,充滿了童真與活力;而采用Jada音色合成上海話的生活瑣事對話,則彰顯出地道的上海風情。
Qwen-TTS的開發團隊還透露,他們致力于持續優化模型性能,并計劃未來引入更多語言和語音風格,以滿足用戶日益增長的多樣化需求。同時,團隊提供了簡潔易用的API接口,方便開發者將Qwen-TTS集成至各類應用中,進一步拓寬了其應用場景。
有關Qwen-TTS的更多信息,可訪問官方幫助文檔:https://help.aliyun.com/zh/model-studio/qwen-tts