近期,Qwen-TTS語(yǔ)音合成技術(shù)取得了顯著進(jìn)步,通過(guò)Qwen API平臺(tái)發(fā)布了其最新版本,極大地豐富了用戶的語(yǔ)音合成體驗(yàn)。
新版本中,Qwen-TTS實(shí)現(xiàn)了對(duì)三種中文方言的突破性支持,涵蓋了北京話、上海話和四川話,這一創(chuàng)新拓展了其應(yīng)用場(chǎng)景的邊界。該模型基于龐大的語(yǔ)料庫(kù)訓(xùn)練而成,語(yǔ)料庫(kù)規(guī)模超過(guò)300萬(wàn)小時(shí),確保了合成語(yǔ)音的自然度和表現(xiàn)力接近人類(lèi)水平。Qwen-TTS不僅具備高精度的語(yǔ)音合成能力,還能智能調(diào)整韻律、節(jié)奏和情緒,使得生成的語(yǔ)音更加生動(dòng)、富有感染力。
在音色方面,Qwen-TTS提供了多樣化的選擇,現(xiàn)已支持七種中英雙語(yǔ)音色,包括Cherry、Ethan等通用音色,以及專(zhuān)為方言設(shè)計(jì)的特色音色,如北京話的Dylan、上海話的Jada和四川話的Sunny。用戶可以根據(jù)實(shí)際需求,輕松選擇最適合的音色進(jìn)行語(yǔ)音合成。
實(shí)際應(yīng)用中,Qwen-TTS展現(xiàn)出了卓越的性能。無(wú)論是描繪日常生活場(chǎng)景,還是傳達(dá)細(xì)膩復(fù)雜的情感,它都能生成自然且流暢的語(yǔ)音。例如,使用Dylan音色合成關(guān)于童年游戲的北京話語(yǔ)音時(shí),充滿了童真與活力;而采用Jada音色合成上海話的生活瑣事對(duì)話,則彰顯出地道的上海風(fēng)情。
Qwen-TTS的開(kāi)發(fā)團(tuán)隊(duì)還透露,他們致力于持續(xù)優(yōu)化模型性能,并計(jì)劃未來(lái)引入更多語(yǔ)言和語(yǔ)音風(fēng)格,以滿足用戶日益增長(zhǎng)的多樣化需求。同時(shí),團(tuán)隊(duì)提供了簡(jiǎn)潔易用的API接口,方便開(kāi)發(fā)者將Qwen-TTS集成至各類(lèi)應(yīng)用中,進(jìn)一步拓寬了其應(yīng)用場(chǎng)景。
有關(guān)Qwen-TTS的更多信息,可訪問(wèn)官方幫助文檔:https://help.aliyun.com/zh/model-studio/qwen-tts