滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

AI新紀元：Claude Opus 4連續工作7小時，SWE-Bench得分領跑行業

時間：2025-05-23 17:51:09 來源：ITBEAR編輯：快訊團隊 發表評論無障礙通道

近日，人工智能領域迎來了重大突破，Anthropic公司隆重推出了其旗艦級AI模型Claude Opus 4及其輕量級版本Claude Sonnet 4，這一舉動標志著AI能力的新里程碑，預示著行業或將迎來顛覆性的變革。

在與日本電商樂天（Rakuten）的聯合測試中，Claude Opus 4展現出了前所未有的持久力。它能夠在一個復雜的開源重構項目中，連續工作近七個小時而不中斷，始終保持高度的邏輯清晰度和任務專注度。這一表現與以往AI模型僅能維持幾分鐘的“注意力”形成鮮明對比，意味著AI終于具備了全天候協作的能力。

在軟件工程測試集SWE-Bench上，Claude Opus 4更是以72.5%的高分刷新了記錄，這一成績遠超今年4月推出的OpenAI GPT-4.1的54.6%得分。這一卓越表現將Anthropic推上了與OpenAI、谷歌、xAI等巨頭同臺競技的舞臺。

2025年，AI行業正經歷從快速應答型模型向深度推理型模型的轉變，而Claude Opus 4無疑是這一趨勢中的領航者。它摒棄了傳統的“問答式”模式，采用“類人類”的推理過程，通過收集信息、分析矛盾、整理邏輯，真正實現了從“回答者”到“思考者”的跨越。

為了提升用戶體驗，Anthropic在Claude 4系列中引入了動態雙模式架構，使AI既能對簡單問題迅速響應，又能對復雜任務進行深入推理。Claude 4還具備上下文記憶功能，能夠跨會話保持知識連貫性，為長期項目的實施提供了有力支持。

為了滿足企業開發需求，Anthropic推出了Claude Code工具鏈，該工具鏈支持VS Code、JetBrains等主流IDE插件，并與GitHub Actions兼容。GitHub Copilot最新版本已內置Claude Sonnet 4作為其新一代代碼代理的基礎模型，這一舉措表明微軟正在積極調整其AI合作策略。

Claude Code工具鏈的新功能包括代碼執行引擎、文件API和MCP連接器，以及最長可達一小時的Prompt緩存。這些功能使得Claude能夠更順暢地融入企業工作流，成為企業長期的AI合作伙伴。

然而，隨著AI模型能力的不斷增強，一個老問題再次浮出水面：AI越強大，其“黑箱”特性就越明顯。Anthropic在4月的一項研究中指出，Claude Sonnet 3.7在推理時僅有25%的時間會主動解釋其用到的關鍵線索。這引發了人們對未來高性能AI決策路徑難以審計或復現的擔憂。

Claude Opus 4所展現的連續專注能力，正在悄然改變“工作”這一概念。它不僅是工具，更是開始扮演真正的“數字同事”角色——無需監督，能夠獨立完成復雜任務，甚至逐步形成跨天的項目記憶與知識體系。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

Anthropic開源新工具：神經網絡追蹤，歸因圖助你透視AI大模型“思考”過程

06-02

渤海億噸級油田墾利10-2，海上平臺建造圓滿收官！

06-02

Duolingo“AI-first”戰略遇阻，用戶不滿引發刪App潮，信任危機何解？

據報道，語言學習平臺Duolingo因轉向“AI-first”戰略，宣布用人工智能取代部分人工，引發大量用戶不滿，出現刪App、取消訂閱潮。CEOLuis von Ahn試圖通過清空社交媒體內容、發布神秘視…

06-02

軟銀英特爾聯手打造AI內存芯片，電力消耗或降一半引領數據中心變革

6月2日，據報道，軟銀集團與英特爾公司合作，通過新成立的Saimemory公司共同開發AI專用內存芯片。該芯片采用新型堆疊式DRAM設計，有望將電力消耗減半，降低AI數據中心運營成本。項目基于英特爾技術和日本…

06-02

vivo如何破局：市場陣地、內卷挑戰與新賽道突圍的三重考驗

06-02

微軟ZeniMax QA團隊工會合同達成，7月起加薪13.5%，游戲從業者勝利？

06-02

商湯集團高層調整：徐冰轉崗AI芯片業務，楊帆、王征擬接任執行董事

日前，商湯集團發布公告稱，聯合創始人徐冰將于2025年6月26日股東周年大會結束后卸任執行董事及董事會秘書職務，轉任AI芯片業務負責人，專注推動公司戰略性新興業務發展。同時，商湯提議聯合創始人、大裝置事業群總…

06-02

美律師法庭文件引用ChatGPT虛構案例，遭制裁并賠償

06-02

敦煌文物數字重聚，“數字藏經洞”平臺正式發布

06-02

商湯徐冰卸任執行董事及董秘，楊帆王征接任，AI芯片業務迎新布局

根據商湯公告，截至公告日期，楊帆擁有39,002,779股B股股份（占商湯科技公司已發行股份總數約0.11%），包括：(i)通過SenseTalentManagement Limited（「SenseTa…

06-02

蘋果WWDC 2025 AI內容或平淡？古爾曼預測或令人失望

06-01

五一視界沖刺港股，年營收近3億卻運營虧損超7千萬，商湯等眾星云集

06-01

AI版寶可夢訓練師O3來襲，能否在紅版中征服終極四天王？

06-01

三部門聯手凈化高考網絡環境，嚴打AI涉考虛假信息

06-01

谷歌不服在線搜索反壟斷裁決，宣布將提起上訴

06-01

點擊查看更多 +

全站最新

BJ40增程領銜，北京越野2025粵港澳車展展現硬派越野新魅力！

BJ40增程領跑市場，北京越野粵港澳車展展現越野新魅力

仰望U8L粵港澳車展“鼎”級亮相，中國高端豪華車新標桿？

BJ40增程領跑市場，北京越野2025粵港澳車展展現越野新魅力

上汽奧迪雙品牌閃耀2025灣區車展，智能豪華新境界震撼登場！

蔚來5月新車交付量穩健增長，技術收獲季全面開啟

熱門內容

本欄最新

Anthropic開源新工具：神經網絡追蹤，歸因圖助你透視AI大模型“思考”過程

渤海億噸級油田墾利10-2，海上平臺建造圓滿收官！

微軟ZeniMax QA團隊工會合同達成，7月起加薪13.5%，游戲從業者勝利？

美律師法庭文件引用ChatGPT虛構案例，遭制裁并賠償

敦煌文物數字重聚，“數字藏經洞”平臺正式發布

商湯徐冰卸任執行董事及董秘，楊帆王征接任，AI芯片業務迎新布局

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

AI新紀元：Claude Opus 4連續工作7小時，SWE-Bench得分領跑行業

日本精品一区二区三区高清久久