近期,ChatGPT的Android應用程序迎來了一次重大更新,新增了一項備受矚目的功能——語音模式下的實時字幕顯示。用戶只需輕觸界面上的“更多”按鈕,并選擇“開啟字幕”選項,即可在語音對話過程中同步查看對話內容的文字轉錄。這一創新不僅顯著增強了應用的易用性,還為聽力受限或在嘈雜環境中使用應用的用戶帶來了極大的便利。
據了解,字幕功能的實現依托于OpenAI先進的Whisper語音轉文本技術,能夠準確捕捉用戶的語音輸入以及ChatGPT的回復內容,并將其迅速轉化為文字。用戶在體驗該功能后紛紛表示,字幕的清晰度和實時性都達到了令人滿意的水平,為語音交互體驗增添了更多的實用性和包容性。字幕內容還會在對話結束后自動保存到聊天記錄中,便于用戶隨時查閱。
除了字幕功能外,此次更新還對ChatGPT的后臺監聽功能進行了優化。在語音模式下,用戶可以讓應用保持后臺運行,即使暫時停止對話,ChatGPT也會持續監聽用戶的語音。當用戶再次開口時,應用能夠迅速響應并繼續對話,無需重新激活語音模式。這一功能的改進使得語音交互更加流暢自然,特別適合在開車或處理多任務等需要間歇性交互的場景中使用。
隨著AI語音助手市場的競爭日益激烈,ChatGPT此次的更新無疑為市場注入了新的活力。Google Gemini Live和Microsoft Copilot Voice等競爭對手也推出了類似的可視化交互改進,試圖通過多模態功能吸引更多用戶。然而,ChatGPT通過字幕和后臺監聽的優化,不僅提升了用戶體驗,還在可訪問性和實時性方面樹立了行業的新標桿。
自2023年11月向免費用戶開放以來,ChatGPT移動端的語音模式已經吸引了數百萬用戶的青睞。對于Plus用戶而言,他們還能享受到基于GPT-4o的高級語音功能,包括情緒感知和低延遲響應等。這些功能的推出不僅展示了ChatGPT在AI語音交互領域的領先地位,也為用戶帶來了更加智能、便捷的使用體驗。