蘋果公司近期在其2025年WWDC全球開發者大會上推出的Speech API,在科技媒體macstories的實際測試中展現出了驚人的性能。這一技術被用于轉錄一段長達34分鐘、文件大小達到7GB的4K視頻,僅用時45秒便完成了整個轉錄過程,速度之快超乎想象。
在WWDC大會上,蘋果公司宣布了Speech API的兩個核心模塊:SpeechAnalyzer和SpeechTranscriber。macstories團隊利用這兩個模塊開發的Yap應用工具,對Speech API的轉錄性能進行了深入測試。測試結果顯示,Yap在處理大型視頻文件時,其速度遠超當前市場上的其他主流轉錄工具。
在與市場上其他競爭對手的對比測試中,Yap的優勢尤為明顯。在同樣的測試條件下,Yap完成轉錄所需的時間僅為45秒,而OpenAI的Whisper(MacWhisper V3Turbo版本)則需要101秒,速度慢了近56%。其他工具如VidCap和MacWhisper V2的轉錄時間分別為1分55秒和3分55秒,進一步凸顯了Yap在轉錄速度上的領先地位。
盡管在專有名詞識別方面,所有工具都存在一定的誤差,例如將“AppStories”識別錯誤,但Yap憑借其強大的本地化運算能力,在處理速度上展現出了無可匹敵的優勢。這意味著,對于需要頻繁處理視頻文件的用戶來說,使用Yap將能夠顯著提升工作效率,節省大量時間。
蘋果的這一創新不僅提升了轉錄技術的效率,更為創作者、教育工作者和內容制作者帶來了極大的便利。隨著Speech API技術的不斷普及和應用,我們有理由相信,未來將有更多的企業在視頻處理和內容生成方面受益于這一技術。蘋果的這一新技術無疑為語音轉錄領域帶來了一次革命性的突破。