滾動資訊

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內(nèi)容

英偉達(dá)推出Parakeet TDT 0.6B，高效ASR模型引領(lǐng)語音轉(zhuǎn)錄新時代

時間：2025-05-07 15:21:56 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

英偉達(dá)公司近期公布了一項重大技術(shù)突破，一款名為Parakeet TDT 0.6B的先進(jìn)自動語音識別（ASR）模型已在Hugging Face平臺上全面開放源代碼。據(jù)行業(yè)內(nèi)部消息透露，這款新模型在語音處理速度和轉(zhuǎn)錄準(zhǔn)確性方面均達(dá)到了前所未有的水平。

Parakeet TDT 0.6B的亮點之一在于其卓越的處理效率。該模型能夠在短短1秒內(nèi)完成長達(dá)60分鐘的音頻文件處理，這一速度是當(dāng)前主流開源ASR模型的50倍之多。在Hugging Face的Open ASR排行榜上，Parakeet TDT 0.6B的字錯率僅為6.05%，在同類開源模型中表現(xiàn)優(yōu)異。這一性能使得該模型在實時語音轉(zhuǎn)錄、語音內(nèi)容分析、呼叫中心智能化以及音視頻內(nèi)容索引等多個企業(yè)級應(yīng)用場景中極具競爭力。

技術(shù)層面，Parakeet TDT 0.6B采用了Transformer架構(gòu)，并經(jīng)過高質(zhì)量的轉(zhuǎn)錄數(shù)據(jù)訓(xùn)練與微調(diào)。同時，該模型在英偉達(dá)硬件平臺上進(jìn)行了深度優(yōu)化，以實現(xiàn)更高的運算效率。其技術(shù)特點包括6億參數(shù)的編碼-解碼結(jié)構(gòu)、支持量化與融合內(nèi)核以提升計算性能、采用TDT（Transducer Decoder Transformer）架構(gòu)，以及具備精確的時間戳、數(shù)字格式化和標(biāo)點恢復(fù)能力。

尤為Parakeet TDT 0.6B首次實現(xiàn)了對歌曲內(nèi)容的歌詞轉(zhuǎn)錄功能，這一功能在同類模型中極為罕見。通過結(jié)合英偉達(dá)的TensorRT和FP8量化技術(shù)，該模型在實際運行中的實時率（RTF）高達(dá)3386，展現(xiàn)出強大的實時處理能力。這一特性為音樂內(nèi)容索引和媒體平臺提供了新的應(yīng)用場景和可能性。

除了高效的處理速度和準(zhǔn)確的識別能力外，Parakeet TDT 0.6B還集成了多項實用功能。例如，它能夠?qū)⒏枨纛l轉(zhuǎn)化為歌詞文本，適用于音樂和媒體行業(yè)的多種需求；支持?jǐn)?shù)字與時間戳的格式化輸出，極大提升了會議記錄、法律文檔和醫(yī)療報告等內(nèi)容的可讀性；而標(biāo)點恢復(fù)功能則有助于后續(xù)自然語言處理（NLP）任務(wù)的順利進(jìn)行。這些附加功能不僅提高了語音轉(zhuǎn)文字的整體質(zhì)量，還減少了后期編輯和人工干預(yù)的需求，使得該模型特別適合大規(guī)模的企業(yè)級應(yīng)用。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

廣晟集團深圳布局低空產(chǎn)業(yè)，新控股公司成立注冊資本達(dá)5000萬

05-27

黃子韜新動向：朵玥科技公司寧波成立，專注衛(wèi)生巾領(lǐng)域發(fā)展

05-27

“天都一號”地月探險：精準(zhǔn)變軌，首入3:1共振軌道！

05-27

順豐與上海迪士尼強強聯(lián)手，游客將享快遞新體驗！

05-27

中國發(fā)布軟件開發(fā)AI智能體新標(biāo)準(zhǔn)，20余家企業(yè)共筑技術(shù)基石

05-27

沃飛長空民航科創(chuàng)展大放異彩：eVTOL適航運營雙突破引領(lǐng)低空經(jīng)濟

05-27

男頻微短?。簭牡凸鹊骄罚芊裼瓉碚嬲绕穑?/a>

這兩部作品憑借新穎的題材和精良的制作團隊，成功在以女頻內(nèi)容主導(dǎo)的市場中突圍，彰顯了男頻微短劇的強勁勢頭。不同于傳統(tǒng)男頻劇中"嘴炮王者"的套路故事情節(jié)，何朗在處理家庭、社會矛盾，依舊秉持著理性克制的處事態(tài)度，成…

05-27

盈都更名后行動：批量撤回“胖都來”商標(biāo)申請，意欲何為？

05-27

快手端午公告：攜手合作商，共筑廉潔商業(yè)環(huán)境

05-27

興業(yè)銀行實控企業(yè)眾多，曾因違規(guī)行為被整改，風(fēng)險防控何在？

05-27

礪算科技自研GPU芯片點亮成功，國產(chǎn)高性能GPU未來可期！

05-27

谷歌LMEval框架：一鍵解決AI模型評測難題

05-27

“一焙一化”技術(shù)突破，「國瑞新材」B輪融資數(shù)億元加速產(chǎn)能擴張

05-27

順豐攜手上海迪士尼，打造度假區(qū)購物郵寄新體驗！

05-27

谷歌AI搜索現(xiàn)廣告，聲稱對用戶有幫助，真相究竟如何？

05-27

點擊查看更多 +

全站最新

多平臺漲粉迅猛！“房東的肥四”及“煥然臆新”CP熱度飆升

廣晟集團深圳布局低空產(chǎn)業(yè)，新控股公司成立注冊資本達(dá)5000萬

小米雙旗艦震撼登場，閃回科技攜手共赴換新盛宴！

廣汽本田P7試駕體驗：科技與舒適并存，新能源車也能開出本田味？

黃子韜新動向：朵玥科技公司寧波成立，專注衛(wèi)生巾領(lǐng)域發(fā)展

吉利布局未來出行，申請“千里浩瀚智行”商標(biāo)引關(guān)注

熱門內(nèi)容

本欄最新

廣晟集團深圳布局低空產(chǎn)業(yè)，新控股公司成立注冊資本達(dá)5000萬

黃子韜新動向：朵玥科技公司寧波成立，專注衛(wèi)生巾領(lǐng)域發(fā)展

“天都一號”地月探險：精準(zhǔn)變軌，首入3:1共振軌道！

順豐與上海迪士尼強強聯(lián)手，游客將享快遞新體驗！

中國發(fā)布軟件開發(fā)AI智能體新標(biāo)準(zhǔn)，20余家企業(yè)共筑技術(shù)基石

沃飛長空民航科創(chuàng)展大放異彩：eVTOL適航運營雙突破引領(lǐng)低空經(jīng)濟

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

英偉達(dá)推出Parakeet TDT 0.6B，高效ASR模型引領(lǐng)語音轉(zhuǎn)錄新時代

日本精品一区二区三区高清久久