近日,人工智能領域傳來新動態,Anthropic公司為其Claude聊天機器人應用增添了一項名為“語音模式”的創新功能,標志著人機交互體驗邁入新階段。
據Anthropic在社交媒體X及官方網站的最新公告顯示,這一尚處于測試階段的“語音模式”功能,能夠讓Claude移動應用的用戶享受到前所未有的“全程語音交互體驗”。據悉,該功能將以英文版本率先在未來數周內逐步推出。
已有用戶在本周二晚間確認獲得了該語音模式的嘗鮮機會。該模式默認搭載Anthropic的Claude Sonnet 4模型,旨在為用戶提供更加便捷、自然的對話方式。
官方支持頁面詳細介紹道:“語音模式讓用戶只需開口說話,即可與Claude進行對話并接收語音回復,這對于雙手忙碌卻思維活躍的用戶而言,無疑是一大福音。該模式不僅革新了用戶與Claude的互動模式,更在Claude發言時于屏幕上同步展示關鍵信息,使用戶得以直接語音交流并聆聽Claude的語音反饋。”
值得注意的是,多家AI巨頭如OpenAI等亦在語音聊天領域發力,如谷歌的Gemini Live、xAI的Grok語音模式等,均致力于通過語音交互提升用戶體驗,使聊天機器人更加貼近人類日常溝通習慣。
在Anthropic的語音模式下,用戶不僅能夠就文檔、圖像等內容與Claude展開交流,還能從五種語音選項中自由選擇。用戶還能在文本與語音模式間靈活切換,并在對話結束后查閱完整的文字記錄及摘要,確保信息無遺漏。
然而,該功能亦設有一定限制。語音對話將計入用戶的日常使用配額,Anthropic透露,多數免費用戶每日大約可享受20至30次語音對話。同時,僅付費用戶能夠享受Google Workspace連接功能,借此通過語音模式訪問Google日歷及Gmail郵件(Google Docs整合功能則專為Claude企業版用戶開放)。
早在今年3月初,Anthropic首席產品官Mike Krieger在接受《金融時報》采訪時便透露了團隊正為Claude開發語音功能的計劃。彼時,報道還提及Anthropic正與重要投資者兼合作伙伴亞馬遜,以及專注于語音技術的AI初創公司ElevenLabs探討潛在合作,以期在語音功能方面取得突破。
至于上述合作是否已取得實質性進展,目前尚不明朗。