在人工智能語音客服領(lǐng)域,一項(xiàng)長(zhǎng)期存在的技術(shù)難題——延遲和對(duì)話不自然的問題,近日被一項(xiàng)創(chuàng)新合作所攻克。人工智能電話服務(wù)提供商Phonely、推理優(yōu)化平臺(tái)Maitai,以及芯片制造商Groq攜手,共同研發(fā)出了一套能夠快速切換模型、反應(yīng)速度媲美人類的電話AI系統(tǒng),這一突破標(biāo)志著語音AI進(jìn)入了全新的擬人化發(fā)展階段。
據(jù)合作方透露,通過此次深度協(xié)作,Phonely的響應(yīng)速度實(shí)現(xiàn)了顯著提升,增幅超過70%。同時(shí),AI對(duì)話的準(zhǔn)確率也大幅躍升,從原先的81.5%提高到了99.2%,這一成績(jī)甚至超越了GPT-4o的94.7%基準(zhǔn)。這一顯著進(jìn)步的背后,得益于Groq的“零延遲LoRA熱插拔”技術(shù),該技術(shù)通過Maitai的動(dòng)態(tài)編排平臺(tái),能夠在多個(gè)微調(diào)模型間實(shí)現(xiàn)無縫切換,整個(gè)過程無需重新訓(xùn)練,也不會(huì)引入任何額外的延遲。
Groq的芯片是專為語言推理而設(shè)計(jì)的,其獨(dú)特的語言處理單元(LPU)、流式架構(gòu)以及高速片上內(nèi)存等先進(jìn)技術(shù),使得模型能夠在極短的時(shí)間內(nèi),即亞秒級(jí)內(nèi),做出響應(yīng)。具體而言,“首個(gè)響應(yīng)令牌時(shí)間”從原來的661毫秒縮短至176毫秒,整體完成時(shí)間也從1446毫秒減少到了339毫秒,這使得AI電話與真人之間的差別幾乎難以察覺。
Phonely的首席執(zhí)行官Will Bodewes對(duì)此表示:“目前,超過70%的用戶已經(jīng)無法區(qū)分我們的系統(tǒng)中是AI還是人類。延遲問題曾經(jīng)是AI電話最明顯的標(biāo)志之一,但現(xiàn)在這一問題已經(jīng)幾乎不存在了。”
這一合作成果的效果立竿見影,僅在本月,Phonely就成功幫助一家客戶替代了350個(gè)人工坐席。得益于其快速的部署能力,企業(yè)無需對(duì)API進(jìn)行任何改動(dòng),便能在一天內(nèi)完成遷移并上線,而且在一周內(nèi)就能看到性能的顯著提升。
此次合作不僅大幅提升了客戶服務(wù)的體驗(yàn),也預(yù)示著企業(yè)AI發(fā)展趨勢(shì)的轉(zhuǎn)變。企業(yè)不再僅僅追求“大而全”的通用大模型,而是開始轉(zhuǎn)向更快、更準(zhǔn)、更靈活的多模型微調(diào)系統(tǒng)。Maitai的創(chuàng)始人Christian DalSanto指出:“我們相信,企業(yè)AI的未來將由由專用模型組成的精細(xì)系統(tǒng)所主導(dǎo),而不是依賴于孤立的單一大型模型。”
對(duì)于企業(yè)而言,這一變革不僅僅是性能上的提升,更是成本結(jié)構(gòu)的深刻變革。企業(yè)無需再為排班、培訓(xùn)和管理龐大的客服團(tuán)隊(duì)而煩惱,AI客服成為了更為高效和經(jīng)濟(jì)的選擇。同時(shí),Groq與Maitai所提供的低延遲、高可控的架構(gòu),也為AI在保險(xiǎn)、法律、汽車等多個(gè)領(lǐng)域的廣泛應(yīng)用掃清了障礙。