亞馬遜云科技近日宣布,在旗下完全托管的AI模型服務平臺Amazon Bedrock上新增五款開放權重模型,其中包括四款Qwen3系列模型和一款DeepSeek-V3.1模型。這是繼年初上架DeepSeek-R1后,該平臺再次引入中國技術團隊開發的大模型,也是Qwen系列首次登陸Amazon Bedrock。此次擴展使平臺上的開放權重模型陣容進一步壯大,目前全球用戶均可通過亞馬遜云科技服務使用這些模型。
新增的五款模型各具特色,針對不同應用場景進行了優化。Qwen3-Coder-480B-A3B-Instruct和Qwen3-Coder-30B-A3B兩款模型專注于復雜軟件工程領域,支持多種編程語言的代碼生成與理解,并能自主調用外部工具和應用程序。Qwen-3-235B-A22B-Instruct-2507則是一款通用推理模型,采用“混合專家”(MoE)架構,在代碼、數學和通用推理任務中表現優異,同時通過按需激活部分參數實現高效運行。Qwen3-32B(Dense)模型適用于計算資源有限的環境,提供穩定可預測的性能。
DeepSeek-V3.1模型擁有6850億參數,每次任務僅調用相關知識部分,在保持強大性能的同時優化了運行成本。該模型在推理能力和Agentic技能方面較前代有顯著提升,支持多語言處理,尤其在軟件開發、數學推理和數據分析領域表現突出。它還能高效處理各類編程和技術挑戰,適合構建AI Agents和流程自動化等任務。
這些模型具備處理長上下文窗口的能力,其中Qwen3-Coder-30B-A3B-Instruct和Qwen-3-235B-A22B-Instruct-2507可即刻處理高達262K token的上下文長度,相當于單次對話中處理約20萬個字符或兩部完整長篇小說的內容量。所有模型均支持多步驟工作流規劃,可與工具和API集成,部分通用模型還提供“思考”和“非思考”推理模式。
亞馬遜云科技強調,開放權重模型代表AI創新的重要前沿。公司不斷投入資源,致力于成為安全、規模化且具有成本效益地運行這些模型的最佳平臺。Amazon Bedrock總監Luis Wang指出,沒有單一模型能適用于所有場景,許多客戶偏好開源模型,因其提供更大的靈活性和定制空間。
與專有模型不同,開放權重模型允許開發者深入了解模型權重,根據需求進行定制。例如,在MoE架構下,客戶可以查看激活的專家參數,從而推算算力和成本。這種透明性對部分客戶至關重要。客戶還能基于開放權重模型,利用自身數據進行二次訓練,獲得更大的靈活性。
通過Amazon Bedrock使用這些模型,客戶可獲得企業級安全保障,包括數據加密和嚴格的訪問控制,確保數據隱私和合規要求。客戶對其數據擁有完全控制權,亞馬遜云科技不會與模型提供商共享客戶的模型輸入和輸出數據,這些數據也不會用于基礎模型的改進。客戶還可設置安全保障措施,如Amazon Bedrock Guardrails來檢測和防止模型幻覺。
值得注意的是,此次發布的Qwen3和DeepSeek-V3.1模型完整集成了Amazon Bedrock上的企業級功能,包括agent相關能力、Amazon Bedrock Guardrails和模型評估等。這與單純提供模型下載或調用的服務有本質區別,Amazon Bedrock更注重幫助客戶將模型真正應用到生產環境中。
目前,Amazon Bedrock不僅提供開源權重模型,也提供專業(商業)模型,如Amazon Nova和Anthropic Claude等閉源模型。通過與AI公司合作,該平臺已提供超過一百個基礎模型。亞馬遜云科技大中華區產品部總經理陳曉建表示,此次發布進一步豐富了平臺上的模型選擇,能更好地服務全球客戶。公司未來將繼續擴展模型陣容,為更多客戶提供就近服務。