滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

中國信通院推出“方升”3.0基準測試，助力AI評測升級與行業創新發展

時間：2025-10-10 00:31:34 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

中國信息通信研究院（以下簡稱“信通院”）近日宣布，其自主研發的“方升”人工智能基準測試體系已完成3.0版本升級，標志著我國AI評測能力邁入新階段。此次升級不僅擴展了基礎測試維度，更首次將全模態理解、長期記憶等十項高級智能能力納入評測范圍，為工業制造、金融科技、基礎研究等領域提供了更具針對性的評估框架。

據介紹，3.0版本在原有評測體系基礎上新增了模型底層特征評估模塊，涵蓋參數規模、推理效率等核心指標。針對未來AI發展方向，體系特別設計了高級智能測試單元，重點考察模型在復雜場景下的多模態交互、自主決策等能力。信通院相關負責人表示，這種分層設計既能反映當前技術水平，又能為前沿研究提供方向指引。

為保障評測結果的權威性，信通院同步推進了三大基礎設施建設項目。首先是測試數據資源擴容，計劃新增300萬條涵蓋多語言、多任務的標準化數據，以滿足不同場景下的評測需求。其次是測試方法創新，重點攻關高質量數據合成、動態質量評估等關鍵技術。第三是構建智能評測基座，通過引入多智能體交互仿真環境，實現對復雜系統協同能力的精準評估。

在最新完成的季度評測中，141個大模型和7個智能體接受了全面檢驗。測試覆蓋基礎認知、邏輯推理、代碼生成、多模態理解四大維度。結果顯示，OpenAI的GPT-5在綜合性能上保持領先，但國內模型表現可圈可點——阿里巴巴的Qwen3-Max-Preview和月之暗面的Kimi K2在特定場景下已接近國際先進水平。值得注意的是，多模態模型在圖像識別領域取得突破，但在需要多步驟推理的任務中仍存在提升空間。

代碼應用能力專項測試暴露出行業共性問題。雖然參評模型在簡單函數實現上表現優異，但在真實項目開發中的架構設計、錯誤處理等方面明顯不足。專家指出，這反映出當前AI工具從實驗室到產業應用的轉化過程中，仍需突破工程化能力瓶頸。

隨著評測體系持續完善，信通院已建立雙月評測機制，定期發布技術分析報告。相關負責人透露，下一步將重點加強評測標準國際化建設，通過與全球研究機構合作，推動中國AI評測體系獲得更廣泛的國際認可，為技術創新和產業升級提供有力支撐。

更多>同類資訊

雙11智能眼鏡熱銷背后：AI技術賦能，人機交互新入口崛起

11-13

AI“理解”世界新突破：世界模型如何開啟AI未來新篇章？

11-13

百度2025世界大會發布AI新成果，李彥宏：AI內化將引爆生產力革命

李彥宏在大會上表示，“我們用AI重構搜索結果頁，不是簡單地在搜索結果中插入AI摘要，而是把搜索從一個以文字內容和鏈接為主的互聯網應用，轉化為一個以圖片視頻等富媒體內容為主的AI應用。” 在李彥宏看來，AI數字…

11-13

百度世界大會官宣：“羅永浩”同款慧播星數字人技術全球開放，互動升級加速出海

后續，還將發力東南亞、美國等重點國家和區域市場，積極拓展 Shopee、Lazada 等平臺。 IT之家注意到，在今年 6 月舉行的百度 AIDay 活動上，百度副總裁、百度電商總經理平曉黎宣布，羅永浩將擔…

11-13

李彥宏2025百度世界大會發聲：AI邁向效果涌現產業構建倒金字塔生態

11月13日舉辦的2025百度世界大會上，百度創始人李彥宏圍繞 AI 技術發展階段與產業生態發表觀點，指出 AI正從技術演示走向實際應用，產業結構也在發生根本性轉變。在 AI 產業結構層面，李彥宏表示該領…

11-13

AI從“智能涌現”邁向“效果涌現”，李彥宏：百度引領AI產業結構新變革

李彥宏在大會上表示，“我們用AI重構搜索結果頁，不是簡單地在搜索結果中插入AI摘要，而是把搜索從一個以文字內容和鏈接為主的互聯網應用，轉化為一個以圖片視頻等富媒體內容為主的AI應用。” 在李彥宏看來，AI數字…

11-13

百度世界大會發布“自我演化”超級智能體百度伐謀助力多領域尋“最優解”

在11月13日舉辦的百度世界大會上，百度正式發布全球首個可商用的“自我演化”超級智能體百度伐謀。百度創始人李彥宏表示，百度伐謀的主要應用場景是在真實的產業場景中尋找“全局最優解”，可被應用于交通、能源、金融、…

11-13

2025百度世界大會：文心大模型5.0發布，多領域表現達全球領先水平

文心5.0基礎能力全面升級，在多模態理解、指令遵循、創意寫作、事實性、智能體規劃與工具應用等方面表現突出，擁有強大的理解、邏輯、記憶和說服力。不同于業界多數的多模態模型采用后期融合的方式，文心5.0的技術路…

11-13

2025百度世界大會聚焦AI發展：成果發布，內化能力引領新質生產力變革

本屆大會以“效果涌現”為主題，聚焦國產芯片最新進展、大模型升級、AI應用創新與全球出海，呈現了百度作為中國人工智能領軍企業，如何將AI技術內化為產業發展的原生動能，為加快形成新質生產力提供可落地的“百度方案”…

11-13

李彥宏2025百度世界大會發聲：搜索AI化革新，AI API開放賦能合作

11-13

00后少年黃一：攜全開源雙足機器人，與馬斯克共赴開源未來之約

11-13

百度文心大模型5.0發布：2.4萬億參數領跑全球，用戶即刻體驗

11-13

百度AI進化論：打破常態偏見，以原生之力重構產業未來版圖

11-13

三星Galaxy S26系列尺寸全揭秘：輕薄與大屏兼得超大杯厚度再減

11-13

消息透露iPhone 18 Pro Max機身或增厚增重裸機重量有望創蘋果Max機型新高

11-13

點擊查看更多 +

全站最新

三星Galaxy S26系列尺寸全揭秘：輕薄與大屏兼得超大杯厚度再減

消息透露iPhone 18 Pro Max機身或增厚增重裸機重量有望創蘋果Max機型新高

影視颶風CEO潘天鴻“扮初中學歷”相親引熱議網友：婚戀該看標簽還是潛力？

華為Mate 80系列或推Pro Max新機：主動散熱成亮點 11月登場

榮耀500 Pro核心配置揭秘：驍龍8至尊版加持 2億主攝+8000mAh大電池

百度文心大模型5.0發布：原生全模態，多項能力達全球領先水平

熱門內容

本欄最新

三星Galaxy S26系列尺寸全揭秘：輕薄與大屏兼得超大杯厚度再減

消息透露iPhone 18 Pro Max機身或增厚增重裸機重量有望創蘋果Max機型新高

影視颶風CEO潘天鴻“扮初中學歷”相親引熱議網友：婚戀該看標簽還是潛力？

華為Mate 80系列或推Pro Max新機：主動散熱成亮點 11月登場

榮耀500 Pro核心配置揭秘：驍龍8至尊版加持 2億主攝+8000mAh大電池

百度文心大模型5.0發布：原生全模態，多項能力達全球領先水平

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

中國信通院推出“方升”3.0基準測試，助力AI評測升級與行業創新發展

日本精品一区二区三区高清久久