近日,人工智能領(lǐng)域迎來重要進(jìn)展,Anthropic公司隆重推出了Claude系列的最新成員——Claude Opus 4與Claude Sonnet 4。這兩款模型憑借卓越的表現(xiàn),迅速吸引了全球范圍內(nèi)的廣泛關(guān)注,被譽(yù)為“編碼領(lǐng)域的翹楚”。
作為Anthropic的重要合作伙伴及投資方,亞馬遜云科技迅速響應(yīng),在Amazon Bedrock平臺(tái)上率先部署了Claude Opus 4和Claude Sonnet 4。這一舉措無(wú)疑將進(jìn)一步推動(dòng)AI技術(shù)的創(chuàng)新與應(yīng)用。
據(jù)亞馬遜云科技透露,Claude系列模型在用戶中享有極高聲譽(yù)。以Claude Sonnet 3.7為例,該模型發(fā)布后的短短五周內(nèi),Amazon Bedrock客戶的使用率較上一代模型激增300%。這一數(shù)據(jù)充分證明了Claude系列模型的受歡迎程度及其市場(chǎng)潛力。
Anthropic公司強(qiáng)調(diào),Claude Opus 4與Claude Sonnet 4的推出,標(biāo)志著AI系統(tǒng)正逐步成為人類不可或缺的協(xié)作伙伴,特別是在創(chuàng)意與知識(shí)工作領(lǐng)域。這兩款模型不僅能夠根據(jù)需求靈活切換響應(yīng)模式,還能在復(fù)雜推理任務(wù)中保持卓越性能。
Claude Opus 4被譽(yù)為“編程領(lǐng)域的巔峰之作”,它能夠在長(zhǎng)時(shí)間運(yùn)行的任務(wù)和智能體工作流中保持穩(wěn)定表現(xiàn),獨(dú)立完成從規(guī)劃到執(zhí)行的復(fù)雜編碼項(xiàng)目。該模型還能生成長(zhǎng)篇?jiǎng)?chuàng)意內(nèi)容,為金融行業(yè)客戶提供agent搜索與研究支持,為營(yíng)銷類客戶實(shí)現(xiàn)多渠道營(yíng)銷活動(dòng)的自主管理。
Claude Sonnet 4則是對(duì)Claude Sonnet 3.7的重大升級(jí),它以編程和推理能力為核心,同時(shí)提升了對(duì)用戶提示詞的響應(yīng)精度。該模型在性能與成本之間取得了完美平衡,特別適合高吞吐量的業(yè)務(wù)場(chǎng)景。無(wú)論是實(shí)時(shí)客服agents還是日常開發(fā)工作,Claude Sonnet 4都能游刃有余。它還能作為任務(wù)專用的子agents,同時(shí)處理搜索、數(shù)據(jù)分析或內(nèi)容合成等多類任務(wù),為旅游與酒店行業(yè)客戶提供近乎實(shí)時(shí)的個(gè)性化響應(yīng)。
在權(quán)威編程基準(zhǔn)測(cè)試SWE-bench Verified上,Claude Opus 4與Claude Sonnet 4的得分分別高達(dá)79.4%和80.2%,遠(yuǎn)超OpenAI Codex-1、OpenAI o3、OpenAI GPT-4.1、Gemini 2.5 Pro等模型。在編程、工具使用、視覺推理、數(shù)學(xué)等領(lǐng)域的基準(zhǔn)測(cè)試中,這兩款模型同樣表現(xiàn)出色,超越了OpenAI o3。而在多語(yǔ)言問答、研究生級(jí)別推理任務(wù)上,Claude Opus 4與OpenAI o3平分秋色。
Claude 4系列模型的自主性得到了顯著提升。相較于Claude 3.7最多只能自主運(yùn)行45分鐘,Claude 4能夠獨(dú)立運(yùn)行數(shù)小時(shí),最長(zhǎng)可達(dá)7小時(shí)。這意味著AI系統(tǒng)能夠承擔(dān)更大比例的項(xiàng)目工作,減輕人類用戶的負(fù)擔(dān)。
Anthropic增長(zhǎng)與營(yíng)收負(fù)責(zé)人Kate Jensen表示:“Claude Opus 4和Claude Sonnet 4將AI從單純的工具轉(zhuǎn)變?yōu)檎嬲膮f(xié)作伙伴。它們不再僅僅生成內(nèi)容,而是更像專業(yè)的虛擬助手,專注于復(fù)雜任務(wù)、保留上下文,并在無(wú)需持續(xù)指導(dǎo)的情況下提供完整的解決方案。這一能力將徹底改變企業(yè)應(yīng)對(duì)各種挑戰(zhàn)的方式?!?/p>
目前,Amazon Bedrock平臺(tái)已經(jīng)上線了Claude Opus 4和Claude Sonnet 4這兩款最新大模型。用戶可以通過Bedrock Converse API進(jìn)行編碼,并輕松選擇所需的模型。亞馬遜云科技建議使用Converse API,因?yàn)樗峁┝艘恢碌腁PI接口,可與所有支持消息的Amazon Bedrock模型兼容。這意味著用戶只需編寫一次代碼,即可在不同模型之間自由切換。
Claude Opus 4目前已在北美地區(qū)的多個(gè)AWS區(qū)域上線,包括美國(guó)東部(俄亥俄州、弗吉尼亞州北部)和美國(guó)西部(俄勒岡州)。而Claude Sonnet 4的覆蓋范圍更廣,不僅在北美地區(qū)上線,還涵蓋了亞太地區(qū)和歐洲地區(qū),包括美國(guó)東部、美國(guó)西部、亞太地區(qū)(海得拉巴、孟買、大阪、首爾、新加坡、悉尼、東京)和歐洲(西班牙)。
亞馬遜云科技表示,Claude Opus 4和Claude Sonnet 4在Amazon Bedrock的推出,為客戶提供了更多選擇,幫助他們利用Anthropic最先進(jìn)的模型進(jìn)行AI創(chuàng)新,打造更出色、更具變革性的應(yīng)用。同時(shí),這些模型還具備企業(yè)級(jí)安全防護(hù)和負(fù)責(zé)任的AI管控體系,確??蛻裟軌虬残氖褂谩?/p>