在近期的一次技術分享會上,專家深入探討了亞馬遜云科技在推動大模型驅動智能體(Agentic AI)技術方面的最新進展。智能體這一概念,源自強化學習領域,它通過與環境的交互,執行動作并接收狀態反饋,展現出高度的智能特性。
智能體技術的發展,與圖靈測試的演進緊密相關。圖靈測試1.0聚焦于人機對話的難以分辨性,而圖靈測試2.0則進一步要求人工智能在執行任務時,讓人無法區分其與人類的差異。若大量智能體存在,它們將可能重塑社會組織結構,特別是企業形態。例如,一個擁有1000個智能體的10人企業,其管理架構將與傳統千人企業截然不同。
智能體的核心在于大模型與工具的集成。大模型作為智能體的“大腦”,具備記憶與進化能力,使得整個系統能夠不斷優化。在問答場景中,智能體能夠將復雜問題分解為可執行步驟,調用不同工具獲取答案。然而,智能體如何識別工具、如何調用工具,成為亟待解決的問題。通過提示詞告知智能體工具信息,并根據上下文生成調用參數,智能體得以執行工具并返回結果。
隨著工具數量的增加,工具之間的正交性和邊界清晰度成為挑戰。此時,模型-上下文協議(MCP)應運而生。MCP定義了客戶端與服務端的交互協議,簡化了工具管理。在初始化階段,客戶端從MCP服務器獲取工具列表,配置給大模型。大模型根據上下文調用工具,客戶端向服務器發出請求,獲取結果后返回給大模型。MCP的優勢在于降低了工程復雜度,確保了工具間的正交性。
在智能體生態系統中,越來越多的企業加入其中,提供平臺、應用、大模型蒸餾等服務。代碼智能體成為熱門方向,旨在模擬人類項目開發過程,通過對話式編程等方式,將問題分解為可執行步驟。然而,智能體在連續上下文中如何避免錯誤放大,產生一致可靠的結果,仍是當前面臨的主要挑戰。人工干預和限制工作流復雜度是當前的主流解決方案。
智能體架構分為單智能體和多智能體兩種形式。單智能體包括通過推理形成動作序列的React Agent和工作流模式。React Agent的難點在于推理出合理可執行的步驟并穩定執行,而工作流模式則預先定義好執行順序。多智能體架構則采用路由器+專家、編排器+協調者等模式,通過分工和協調完成復雜任務。與單個復雜智能體相比,多智能體架構更具變形和模塊化優勢。
亞馬遜云科技在智能體技術方面提供了豐富的解決方案。Bedrock Agent能夠完整輸出智能體的每一步執行過程,幫助開發者診斷和優化。Amazon SageMaker提供了Q Business和Q Developer等智能體解決方案。Q Business支持用戶通過自然語言查詢獲取分析報告,而Q Developer則允許開發者自定義構建智能體應用,增強可觀測性。Bedrock Agent還內置了多種組織架構模板,開發者可通過API輕松構建。
在演講現場,專家還分享了智能體技術的實際應用案例。例如,通過智能體處理數據合成任務,讓多個模型分別生成數學題目答案,再由另一個模型評估并選擇最優答案。專家還強調了智能體技術在企業組織形態方面的潛在影響,以及實現通用人工智能的可能性。
亞馬遜云科技在推動智能體技術發展方面投入巨大。公司計劃投入1000億美元在AI算力、云基礎設施等領域,旨在通過領先的技術實力和豐富的經驗,助力企業在AI時代實現突破。
此次技術分享會不僅展示了亞馬遜云科技在智能體技術方面的最新成果,還為參會者提供了深入了解智能體技術發展的機會。隨著智能體技術的不斷進步,我們有理由期待它在未來發揮更大的作用,為企業和社會帶來深遠的影響。