滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

Vercel CEO實測：Kimi K2智能體場景運行速度超GPT5等5倍，準確率領先50%

時間：2025-10-21 22:13:53 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

近日，美國科技公司Vercel首席執行官吉列爾莫在一篇技術分析文章中披露，其內部研發的智能體測試框架對多款主流大模型進行了實景任務性能評估。結果顯示，中國團隊開發的開源模型Kimi K2在效率與精度方面展現出顯著優勢，引發行業對開源模型技術突破的關注。

根據公布的測試數據，在涉及復雜邏輯推理與多步驟操作的場景中，Kimi K2完成任務的平均耗時僅為2分鐘，較GPT5的8分鐘和Claude Sonnet4.5的10分鐘縮短80%。精度表現方面，該模型達到62%的任務完成準確率，分別超出GPT5（38%）和Sonnet4.5（47%）24和15個百分點。這種量級的技術代差在高端模型對決中較為罕見。

值得關注的是，Vercel團隊特別強調了Kimi K2與現有技術棧的兼容特性。通過標準化接口設計，開發人員可在不修改底層架構的前提下，實現模型的無縫切換。這種"即插即用"的特性，結合開源社區的持續迭代能力，為中小企業采用先進AI技術提供了可行路徑。

行業分析師指出，此次測試結果打破了"閉源模型必然領先"的固有認知。雖然測試場景具有特定性，但Kimi K2在關鍵指標上的突破，證明開源生態通過架構創新與工程優化，完全有能力在特定領域實現技術反超。隨著更多企業加入開放技術協作，AI領域的競爭格局或將迎來新的變量。

更多>同類資訊

谷歌Gemini 3將發布，能否借此改寫AI格局引行業關注

11-17

阿里Qwen Code v0.2.1上線，實用與效率雙提升，開啟AI工程化新篇

11-17

阿里“千問”APP公測上線，以先進模型打造AI生活新入口

11-17

阿里千問APP：以AI原生應用之姿，探尋中國C端超級入口新路徑

11-17

阿里巴巴“千問”APP公測版上架，朱嘯虎盛贊或成AI生活新入口

11-17

小米超級小愛AI大模型“隨心修圖”上線，一句話輕松實現照片風格變換

11-17

商湯醫療再獲數億元融資蓄力加碼開啟新征程啟航盛典

11-17

阿里巴巴發布千問App公測版，憑Qwen3模型強勢入局AI to C市場

據了解，千問App公測版目前已在各大應用商店上架，并同步提供網頁和PC版。自2023年全面開源以來，阿里Qwen已經超越Llama、Deepseek等模型，成為全球性能最強、應用最廣泛的開源大模型。據透露…

11-17

阿里千問App公測上線，以開源模型為基劍指全球AI to C市場

阿里千問Qwen是全球第一開源模型，模型性能媲美頂級的閉源模型，已成為開發者和企業級市場的首選。基于全球領先的AI云計算基礎設施，從全球第一的開源模型，到覆蓋全球的App應用，阿里正以千問Qwen為核心出擊…

11-17

全國“人工智能+”創新大賽在蓉啟幕成都項目多點開花展現硬核實力

11月14日，百模論劍·第二屆全國“人工智能+”行業應用創新大賽頒獎暨人工智能賦能新型工業化深度行（成都站）啟動大會在成都舉辦。大賽評出了一等獎5項、二等獎7項、三等獎13項，來自成都的多個項目獲獎。本屆大…

11-17

阿里千問APP公測開啟，對標ChatGPT，生活多場景接入引期待

千問APP公測版使用的核心模型，是阿里最新版的Qwen3系列。在今年9月召開的2025云棲大會上，阿里最新發布了旗艦模型Qwen3-Max，其性能指標超越GPT5、ClaudeOpus 4等國際主流模型，…

11-17

具身智能新突破！我國首個手語交互系統機器人適配多款靈巧手

據介紹，這是搭載了我國首個手語交互系統的具身智能機器人，通過具身智能模型，可以讓普通的具備靈巧手功能的機器人，擁有手語的交互能力。作為科研項目，團隊從 2008 年就開始設計這套手語庫，隨著具身智能的發展…

11-17

智能驅鳥機器人亮相杭州機場：AI賦能，筑牢航空安全新防線

近日，一款名為“智能驅鳥機器人”的系統在杭州蕭山國際機場投入實際應用，其獨特的運作模式和技術集成，引發了業界的廣泛關注。機場驅鳥機器人的成功應用，是申昊科技將其技術積累從傳統工業領域，延伸至航空安全這一特殊…

11-17

OpenAI新研究：以稀疏模型探索語言機制鋪就理解模型內部行為新路徑

與普通模型不同，OpenAI發現可以從該稀疏模型中提取出簡單、易于理解的部件來執行特定任務，例如在代碼中正確結束字符串或跟蹤變量類型。對于簡單行為，OpenAI 發現使用其方法訓練的稀疏模型包含小型、解耦…

11-17

AI泡沫論遭駁斥！周鴻祎：泡沫與革命并存，AI正催生真實變革

文章給出一組數據，95%的公司用AI都在虧錢，OpenAI半年就燒了135億，但英偉達的市值卻被炒到了5萬億美元。這些基礎設施就像2000年互聯網泡沫留下的光纖和數據中心一樣。周鴻祎判斷，我們正處在泡沫中…

11-17

點擊查看更多 +

全站最新

中國電車別再只卷價格！山姆模式或成破局新思路

吉利旗下上海吉津機電設備公司注銷

上拉如今年5月退出與小英關聯公司

廣東順豐電子商務公司增資至4億增幅3900%

華潤雪花啤酒長春公司注銷

奇瑞汽車增資至約58.1億增幅約6%

熱門內容

本欄最新

東風奕派eπ007+深圳煥新登場：14萬級激光雷達加持，四驅轎跑新選擇

24.9萬起售！全新奔馳純電CLA攜四大突破，重塑豪華純電新標桿

東風奕派兩周年獻禮，eπ007+攜四大優勢登場，助力新能源賽道加速跑

東風奕派兩周年獻禮：eπ007+攜四大優勢登場，為年輕人出行注入新動力

東風奕派eπ007+高能登場，以“奕派速度”為年輕人解鎖百萬級出行新體驗

嵐圖泰山來襲：外觀大氣內飾豪華能否在高端SUV市場分一杯羹？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

Vercel CEO實測：Kimi K2智能體場景運行速度超GPT5等5倍，準確率領先50%

日本精品一区二区三区高清久久