在生成式人工智能席卷全球的浪潮中,國(guó)內(nèi)AI領(lǐng)域正經(jīng)歷著從性能比拼到應(yīng)用落地的深刻轉(zhuǎn)變。在這場(chǎng)變革中,智能硬件,尤其是具身機(jī)器人產(chǎn)品,以其獨(dú)特的方式融入了人們的日常生活,展現(xiàn)了人機(jī)共生的未來(lái)圖景。
眾所周知,AI如同一位高智商的“偏科生”,在理性邏輯方面表現(xiàn)出色,但在情商方面卻顯得力不從心。傳統(tǒng)的語(yǔ)音交互技術(shù),盡管在復(fù)雜環(huán)境下已實(shí)現(xiàn)了較高的識(shí)別率,但一次失敗的體驗(yàn)就足以讓用戶心生退意。科大訊飛,作為中國(guó)人工智能產(chǎn)業(yè)的先行者,深諳此道。在語(yǔ)音技術(shù)領(lǐng)域深耕二十余年后,科大訊飛于6月12日的智能交互產(chǎn)品升級(jí)發(fā)布會(huì)上,推出了AIUI、機(jī)器人超腦、虛擬數(shù)字人和訊飛星辰四大全面升級(jí)的開(kāi)發(fā)平臺(tái)。
全新的AIUI平臺(tái),以訊飛星火大模型為引擎,實(shí)現(xiàn)了技術(shù)上的飛躍。發(fā)布會(huì)上亮相的全雙工擬人交互方案,不僅能在嘈雜環(huán)境中精準(zhǔn)捕捉指令,還賦予了硬件產(chǎn)品情緒識(shí)別、創(chuàng)意生成與深度語(yǔ)義理解等類(lèi)人多模態(tài)能力。這一方案的應(yīng)用,使得智能音箱等消費(fèi)級(jí)智能語(yǔ)音交互產(chǎn)品,在多人場(chǎng)景中能夠屏蔽非人聲環(huán)境音,準(zhǔn)確識(shí)別指令,并在用戶遲疑、等待時(shí)主動(dòng)延長(zhǎng)拾音,提供更高效、更具溫度的智能體驗(yàn)。
而在智能眼鏡產(chǎn)品上,科大訊飛展示了最新的“三麥陣列降噪”方案,專(zhuān)為戶外移動(dòng)場(chǎng)景設(shè)計(jì)。在清晰收音的基礎(chǔ)上,智能眼鏡能夠在大模型能力的加持下,在實(shí)時(shí)翻譯、專(zhuān)業(yè)導(dǎo)游、健康助理等多重角色間無(wú)縫切換,仿佛一位同行的真人伙伴。
面對(duì)兒童陪伴成長(zhǎng)的場(chǎng)景,科大訊飛推出了兒童專(zhuān)屬交互方案。這一方案針對(duì)幼兒發(fā)音模糊、疊字代替正常詞匯等特征進(jìn)行強(qiáng)化訓(xùn)練,實(shí)現(xiàn)了邏輯跳躍、音字不準(zhǔn)的識(shí)別,以及情緒信號(hào)與認(rèn)知邏輯的匹配。這使得智能玩具與孩子的對(duì)話更像玩伴間的親密互動(dòng),而非簡(jiǎn)單的發(fā)號(hào)施令。
除了消費(fèi)級(jí)場(chǎng)景,科大訊飛同樣關(guān)注產(chǎn)業(yè)側(cè)的賦能。在具身智能機(jī)器人賽道上,訊飛機(jī)器人超腦平臺(tái)成為了眾多機(jī)器人客戶的共同選擇。宇樹(shù)G1機(jī)器人在發(fā)布會(huì)上的表現(xiàn)令人驚艷,它揮舞著金屬手臂,歡快地跟觀眾打招呼,背后的奧秘正是訊飛機(jī)器人超腦平臺(tái)上的“智能語(yǔ)音背包”。這一方案無(wú)需改造硬體,即插即用,為機(jī)器人提供了即時(shí)的語(yǔ)音交互能力。
訊飛機(jī)器人超腦平臺(tái)不僅為機(jī)器人提供了能聽(tīng)會(huì)說(shuō)、能理解會(huì)行動(dòng)的中樞系統(tǒng),還構(gòu)建了“端-云協(xié)同”的AI架構(gòu)。在端側(cè),平臺(tái)提供多模態(tài)降噪、人臉識(shí)別等本地感知與計(jì)算能力;在云端,則依托語(yǔ)音大模型與具身智能技術(shù),實(shí)現(xiàn)類(lèi)人化交互與復(fù)雜任務(wù)理解。這一架構(gòu)的應(yīng)用,使得機(jī)器人在工廠巡檢、服務(wù)機(jī)器人等領(lǐng)域展現(xiàn)出了強(qiáng)大的能力。
科大訊飛還推出了虛擬人交互平臺(tái)和星辰Agent智能體構(gòu)建平臺(tái)。虛擬人交互平臺(tái)依托領(lǐng)先的多模態(tài)感知與生成技術(shù),實(shí)現(xiàn)了數(shù)字人構(gòu)建的“極簡(jiǎn)革命”。用戶只需輸入一句錄音、上傳一張圖片,即可生成專(zhuān)屬的數(shù)字分身。而星辰Agent平臺(tái)則是一站式的大模型精調(diào)與智能體構(gòu)建平臺(tái),廣泛兼容業(yè)界主流的開(kāi)源大模型,助力企業(yè)高效構(gòu)建專(zhuān)屬大模型和智能應(yīng)用。
依托這些平臺(tái),科大訊飛在AI大模型落地場(chǎng)景上取得了顯著成果。在C端市場(chǎng)上,科大訊飛覆蓋了11個(gè)核心賽道,推出了27款A(yù)I應(yīng)用;在To B和To G市場(chǎng)上,更是領(lǐng)跑同行,累計(jì)中標(biāo)項(xiàng)目超130個(gè),總金額突破14億元。科大訊飛以星火大模型為核心,將各項(xiàng)語(yǔ)音智能技術(shù)融會(huì)貫通,構(gòu)建起了一棵代表人機(jī)智能交互的生態(tài)大樹(shù)。