OpenAI近期對Agents SDK實施了一輪重大革新,為開發者社群帶來了多項關鍵性的功能增強。此次升級不僅拓寬了編程語言的支持范圍,更是在語音交互技術領域取得了突破性進展。
尤為Agents SDK現已全面擁抱Typescript,其功能與Python版本保持高度一致。這意味著開發者可以利用精細的控制機制和人工審核功能,對AI代理的行為實施更為精確的管理。該SDK精心打造,旨在優化多代理工作流程,配備了可自定義的語言模型、便捷的代理切換功能、內嵌的安全控制機制以及全面的分析工具集。
在語音交互領域,新推出的RealtimeAgent功能無疑是此次升級的一大亮點。開發者現在能夠創造出既能在客戶端運行,也能在服務器端部署的語音代理,這些代理支持語音中斷功能,并能在對話進程中即時調用各類工具,極大地提升了交互的靈活性和實用性。
與此同時,“Traces”儀表板也迎來了重大更新,它能夠實時展示語音代理的運行數據,涵蓋音頻流狀態、工具使用情況以及中斷次數的統計信息,為開發者提供了詳盡的性能監控手段,有助于他們更好地優化和調整代理的表現。
OpenAI還對支撐這些功能的底層語言模型進行了優化升級。新版本的“GPT-4O-Realtime-Preview-2025-06-03”在指令執行精度、工具調用穩定性和中斷處理的流暢性方面均實現了顯著提升,并且已經通過實時和聊天API向開發者開放,為他們提供了更加強大的技術支持。
在API戰略層面,OpenAI透露了未來的規劃。公司計劃在2026年中期實現功能對等后,將逐步淘汰現有的Assistants API,全面轉向功能更為強大的Responses API。同時,Chat Completions API將繼續為那些不需要工具集成的開發者提供服務,但OpenAI鼓勵開發者盡早過渡到Responses API,以充分利用其提供的更廣泛和更強大的功能。
Agents SDK與OpenAI API以及遵循Chat Completions標準的第三方模型提供商保持完全兼容,為開發者提供了極大的靈活性和選擇空間,使他們能夠根據自己的需求,構建出更加高效和智能的應用程序。