滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

聲網開源TEN VAD與Turn Detection，賦能Voice Agent對話更自然流暢

時間：2025-05-20 14:35:19 來源：ITBEAR編輯：快訊團隊 IP：北京 發表評論無障礙通道

聲網與RTE開發者社區攜手，近期宣布了兩項重要成果：TEN VAD與TEN Turn Detection模型的開源。這兩款模型是聲網基于其超過十年的實時語音技術研究，以及超低延遲技術積累所打造的，旨在大幅提升AI Agent的交互體驗，使其更加自然流暢。作為開源項目，全球開發者均可自由使用、修改和貢獻代碼，它們也將作為開源對話式AI生態體系TEN的核心組件，持續進行優化迭代。

TEN VAD，一款輕量級、高性能的語音活動檢測模型，憑借其超低延遲、低功耗和高準確率的特點，在語音輸入大語言模型前的預處理階段發揮著重要作用。它能夠精確識別音頻中的人聲，并有效過濾掉背景噪音和靜音段，不僅提升了語音識別（STT）的準確性，還顯著降低了處理成本。與WebRTC Pitch VAD和Silero VAD相比，TEN VAD在公開測試集上展現出了更優越的表現，特別是在延遲方面，TEN VAD能夠快速檢測語音與非語音的切換，避免了因延遲導致的交互不暢。

TEN VAD已在Hugging Face和GitHub上開源，并配備了人工精標的數據集，方便開發者進行模型推理和評估。實際應用中，一個真實用戶案例顯示，使用TEN VAD后，音頻傳輸數據量減少了62%，語音服務成本大幅降低。

另一款模型，TEN Turn Detection，則專注于解決人機對話中的一大難題：判斷用戶何時停止說話。在真實交流中，AI需要準確區分用戶的“中途停頓”與“表達完畢”，以避免插話打斷或回應遲緩。TEN Turn Detection支持全雙工語音交互，允許用戶和AI同時說話，使對話更加自然。該模型通過分析語言模式，判斷說話者的狀態，從而智能決定AI是“說”還是“聽”，支持中英文，可供所有Voice Agent開發者使用。

在多場景測試數據集上，TEN Turn Detection與其他同類開源模型相比，表現出了優越的性能。當TEN VAD與TEN Turn Detection結合使用時，可以打造出更自然、反應更迅速、成本更低的Voice Agent。這兩款模型都基于聲網深厚的實時語音研究經驗，擁有超低延遲、低功耗和高準確率的特點，且完全開源，采用Apache 2.0許可證。

使用這兩款模型，AI Agent能夠正確處理“打斷”、“停頓”、“回應”等人類式交互，極大提升用戶體驗。同時，由于VAD能夠準確識別語音幀，有效減少語音識別調用量，實測結果顯示，兩者合用能大幅降低總系統成本。這兩款模型還可以作為TEN framework的插件模塊使用，對于已經使用TEN framework的開發者，支持無縫集成；對于正在選型AI Agent框架的團隊，TEN無疑是具備最佳VAD和輪次檢測能力的選擇之一。

為了快速體驗這兩款模型，開發者可以登錄Hugging Face，打開TEN Agent Demo，進行模型測試和評估。這一開源舉措，不僅為開發者提供了高質量的語音處理工具，也推動了對話式AI技術的進一步發展。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

別克GL8陸尚再添新色，“云柔米”“煙霞灰”內飾來襲，售價24.99萬起

06-23

月之暗面Kimi-Researcher登頂HLE，AI智能體新強者來襲！

06-23

直播電商“職業彈幕人”案首罰，北京某公司因虛假宣傳被罰十萬

06-23

阿里大動作：餓了么、飛豬正式并入中國電商事業群

06-23

冒險再啟程！快手團綜《帶你趣戶外2025》官宣定檔

熱血冒險，步履不停。近日，由快手平臺出品的首檔戶外互動競技直播團綜《帶你趣戶外》正式宣布回歸定檔。據悉，今年再度啟航的《帶你趣戶外2025》將邀請快手主播加盟，開啟《帶你趣巴厘島》與《帶你趣香港》的冒險新篇章，分別于6月21日與7月5日分別開播。節目中，快手

06-23

快手618購物節：全域經營驅動行業增長，成交破億商品數同比增長475%

全域經營帶動快手618購物節實現突破性增長。6月19日，快手電商發布2025快手618購物節收官戰報，貨架場持續高速增長，泛貨架商品卡GMV同比增長超53%，搜索GMV同比增長超143%，快手商城大牌大補頻道百萬GMV單品數同比增長超124%，內容場消費繁榮，掛車短視頻GMV同比增長超

06-23

掀翻傳統推薦！OneRec端到端模型如何同時"吞噬"效果與成本雙難題

AI大模型(LLM)掀起的生成式革命，正重塑各行各業，連我們每天刷到的推薦系統也不例外。傳統推薦系統像一條多環節的“流水線”(級聯架構)，容易導致算力浪費、目標沖突，制約了發展。要突破瓶頸，關鍵在于用LLM技術進行“一體化”重構，實現效果提升和成本降低。快手技術

06-23

從“鬼子專業戶”到實力派，蘆芳生的演藝蛻變之路

在這部劇中，蘆芳生的表演也讓很多人對他刮目相看，不僅僅是因為劇情的優秀，更因為劇中人物的復雜性深深吸引了觀眾的注意。那時，他也曾對自己的選擇產生過懷疑，直到在《永不磨滅的番號》中，他成功塑造了日本人“山下奉武…

06-23

稀宇科技MiniMax：Voice Design上線，語音合成迎來個性化定制新時代

06-23

B2B軟件開發優選誰？數商云：以專業實力引領行業新風尚

06-23

A+H股熱潮涌動！6月近30家A股公司公布赴港上市新進展

據財聯社不完全統計，截至發稿，6月迄今包括濰柴動力、瀾起科技、奧普光電、凌云光、兆易創新、三花智控、海天味業、美格智能、宇信科技、山金國際、兆威機電、臥龍電驅、視源股份、沃爾核材、新奧股份、三達膜、大族數控、…

06-23

襄垣新能源企業互通悅步：綠色智造引領出行新風尚，發展駛入快車道

06-23

“洞洞鞋鼻祖”Crocs，緣何風光不再？

盡管被調侃本質仍是一雙洞洞鞋，但Crocs在 2023 年創造了銷售奇跡：全年賣出1.2億雙，平均每分鐘售出228雙。2005年，Crocs在《名利場》和《滾石》雜志上刊登了一句口號：“丑也可以美。” 2…

06-23

秦將軍指紋鎖密碼修改失敗？這些排查方法或許能幫到你！

確保輸入的舊密碼完全正確，區分大小寫或特殊符號。重啟指紋鎖（通常通過拆卸電池或長按復位鍵），等待系統重置后再試。

06-23

安信新常態股票A基金凈值更新，持倉亮點與投資策略引關注！

這一表現為投資者提供了重要的參考依據，特別是在當前波動的市場環境中。在當前經濟環境下，這些企業的表現將直接影響到安信新常態股票A基金的未來收益。在短期內，市場波動可能對基金的表現產生影響，但從長期來看，安信新…

06-23

點擊查看更多 +

全站最新

日產Leaf全新換代，純電續航達604km，能否在國內市場站穩腳跟？

日系電車逆襲！東風日產N7與廣汽豐田鉑智3X熱銷，雜牌標簽能否摘除？

安徽首顆商用光學遙感衛星將升空，助力區域高質量發展

太空之家一周新進展：航天醫學、智能協作與設備維護齊頭并進

2026款MG5煥新上市！新增車色與豪華配置，沉浸式音效等你來體驗

五菱星光730來襲！7座MPV汽油插混純電全都有

熱門內容

本欄最新

別克GL8陸尚再添新色，“云柔米”“煙霞灰”內飾來襲，售價24.99萬起

從“鬼子專業戶”到實力派，蘆芳生的演藝蛻變之路

A+H股熱潮涌動！6月近30家A股公司公布赴港上市新進展

襄垣新能源企業互通悅步：綠色智造引領出行新風尚，發展駛入快車道

“洞洞鞋鼻祖”Crocs，緣何風光不再？

秦將軍指紋鎖密碼修改失敗？這些排查方法或許能幫到你！

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

聲網開源TEN VAD與Turn Detection，賦能Voice Agent對話更自然流暢

日本精品一区二区三区高清久久