豆包App近日完成重要功能升級(jí),推出方言語音對(duì)話服務(wù),支持粵語、四川話、東北話及陜西話四種方言的實(shí)時(shí)交互。用戶通過文字或語音輸入指令后,可選用新增的“溫柔桃子”音色進(jìn)行對(duì)話,系統(tǒng)能根據(jù)對(duì)話場(chǎng)景自動(dòng)切換方言模式。該功能基于方言遷移技術(shù)實(shí)現(xiàn)單一音色多方言輸出,經(jīng)測(cè)試顯示,方言識(shí)別準(zhǔn)確率與回應(yīng)流暢度均達(dá)到實(shí)用標(biāo)準(zhǔn),尤其為方言使用頻率較高的老年群體提供了便利。
技術(shù)層面,方言交互功能依托自動(dòng)語音識(shí)別(ASR)系統(tǒng),支持包括上海話、南京話在內(nèi)的18種方言理解。研發(fā)團(tuán)隊(duì)介紹,該系統(tǒng)通過優(yōu)化聲學(xué)模型與語言模型,顯著提升了復(fù)雜語境下的識(shí)別效率,在嘈雜環(huán)境或非標(biāo)準(zhǔn)發(fā)音場(chǎng)景中仍能保持穩(wěn)定性能。項(xiàng)目負(fù)責(zé)人表示,方言功能的開發(fā)旨在打破語言壁壘,讓科技產(chǎn)品更貼近不同地域用戶的使用習(xí)慣。
在產(chǎn)品更新同期,字節(jié)跳動(dòng)宣布完成2025年度獎(jiǎng)學(xué)金計(jì)劃評(píng)選工作。本屆獎(jiǎng)學(xué)金評(píng)選規(guī)模較往年擴(kuò)大,共20名博士研究生獲得每人20萬元科研資助,總獎(jiǎng)金池達(dá)400萬元。該計(jì)劃自2021年啟動(dòng)以來,已累計(jì)支持67名青年學(xué)者,覆蓋人工智能、計(jì)算機(jī)視覺、自然語言處理等多個(gè)技術(shù)領(lǐng)域。獲獎(jiǎng)?wù)叱@得資金支持外,還將獲得字節(jié)跳動(dòng)研發(fā)團(tuán)隊(duì)的聯(lián)合培養(yǎng)機(jī)會(huì),促進(jìn)學(xué)術(shù)成果向產(chǎn)業(yè)應(yīng)用的轉(zhuǎn)化。
據(jù)獎(jiǎng)學(xué)金評(píng)審委員會(huì)介紹,本屆評(píng)選新增“產(chǎn)業(yè)影響力”評(píng)估維度,重點(diǎn)考察候選人的研究成果在真實(shí)場(chǎng)景中的落地潛力。獲獎(jiǎng)項(xiàng)目中,涉及多模態(tài)大模型優(yōu)化的研究占比達(dá)40%,醫(yī)療AI輔助診斷系統(tǒng)開發(fā)、跨語言機(jī)器翻譯等方向成為關(guān)注焦點(diǎn)。字節(jié)跳動(dòng)相關(guān)負(fù)責(zé)人表示,將持續(xù)加大科研投入,通過產(chǎn)學(xué)研協(xié)同機(jī)制推動(dòng)技術(shù)創(chuàng)新與人才培養(yǎng)的深度融合。









