滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

阿里Qwen3大模型登頂開源榜首，235B參數展現強勁實力

時間：2025-05-15 02:09:34 來源：ITBEAR編輯：快訊團隊 發表評論無障礙通道

近日，阿里巴巴正式揭曉了其新一代大模型Qwen3系列的技術細節，通過一份詳盡的技術報告，向公眾展示了該系列模型的混合推理架構、獨特的訓練策略以及令人矚目的評測成績。報告顯示，Qwen3系列的旗艦模型Qwen3-235B-A22B在數學推理、代碼生成等多個核心評測領域，超越了包括DeepSeek-R1和Grok-3在內的國際頂尖模型。

Qwen3系列大模型于4月29日正式發布，涵蓋了6款稠密模型和2款MoE模型，參數規模從0.6B到235B不等。其中，旗艦模型Qwen3-235B-A22B憑借22B的激活參數，實現了235B的總參數量，并在編程、數學推理等基準測試中表現出色，超越了全球多個頂尖模型。

Qwen3系列的核心創新在于其雙系統推理架構。面對復雜的數學證明、代碼生成等任務時，模型會啟動“慢思考”深度推理模塊，支持高達38K token的動態思考預算，進行多步驟邏輯鏈分析。而在日常對話場景下，模型則以“快思考”模式運行，僅需激活20%的參數，從而實現了60%的響應速度提升和40%的算力消耗降低。

Qwen3系列模型的后訓練流程設計圍繞兩大核心目標：一是“思考控制”，通過集成“非思考”與“思考”兩種模式，用戶可以根據需求靈活選擇模型是否進行推理，并通過指定token預算來控制思考深度；二是“慢思考”，旨在簡化和優化輕量級模型的后訓練過程，借助大規模模型的知識，大幅降低構建小規模模型所需的計算成本和工作量。

在性能評測方面，旗艦模型Qwen3-235B-A22B表現出色。在數學推理的AIME25奧數測評中，該模型獲得了81.5分的高分，刷新了開源模型的紀錄，遠超DeepSeek-R1等頂尖模型。在代碼生成的LiveCodeBench評測中，Qwen3-235B-A22B同樣表現出色，得分超過70分，超越了Grok-3-Beta和DeepSeek-R1等主流模型。

Qwen3系列模型還支持跨模態任務，集成了視覺（Qwen3-VL）和音頻（Qwen3-Audio）模塊，能夠應用于醫學影像分析等領域。在硬件與效率優化方面，MoE模型采用動態激活專家策略，僅需4張H20加速卡便能實現235B旗艦模型的部署。Qwen3系列模型在參數效率、推理成本、多語言支持及AI Agent開發等多個維度均展現出顯著優勢。

Qwen3-235B-A22B于今年5月6日成功登頂國際權威大模型測評榜LiveBench開源大模型性能的榜首，進一步證明了其卓越的性能和實力。Qwen3系列模型通過混合推理架構與高效訓練策略，樹立了開源模型的新標桿，正在逐步縮小與頂尖閉源產品的差距。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

青少年科技盛宴落幕：第五屆全國科技教育成果展示大賽區域賽圓滿結束

06-03

微軟碳排放不降反升，2030年減碳目標面臨嚴峻挑戰

06-03

IBM布局AI再落一子，收購企業數據問答平臺Seek AI

06-03

猶他州律師栽在ChatGPT上，AI輔助法律文件需謹慎

06-03

蘋果藏有1500億參數AI強模，為何拒不公開展示？

06-03

Salesforce連下兩城，繼Informatica后再攬Moonhub強化AI智能體平臺

06-03

Hot Chips 2025日程亮點：英特爾Clearwater Forest處理器等重磅登場

06-03

OpenAI欲借ChatGPT挑戰Siri，打造全方位智能生活助手

06-03

xAI計劃3億美元股票出售，估值達1130億，后續或迎更大規模融資？

知情人士消息報道，馬斯克的人工智能公司xAI計劃啟動一項價值3億美元的股票出售，對公司的估值達到1130億美元。消息稱，此次交易將允許員工向新投資者出售股票。知情人士還透露，股票出售交易完成后預計將進行一輪更…

06-03

蘋果WWDC25開發者大會6月啟幕，iOS 19界面將迎來大變革？

06-03

英偉達消費者級AI超算DGX Spark七月來襲，性能如何？

06-03

OpenAI新藍圖：ChatGPT將成超級助手，劍指Siri市場地位

06-03

微軟CEO：6000人崗位調整系強化AI戰略，非解雇員工

微軟CEO薩提亞-納德拉（Satya Nadella）強調，公司近期崗位調整旨在強化AI優先戰略，而非懲罰員工。他澄清約6000個職位的削減源于業務重心向新興領域轉移，與個人績效無關。這位掌舵人解釋稱，團隊與…

06-03

Meta力推2026年廣告全面AI化，廣告巨頭股價承壓

06-03

蘋果“快捷指令”將迎AI升級，自動化操作更便捷，明年上線！

6月2日，據報道，蘋果公司正為其“快捷指令（Shortcuts）”應用引入AppleIntelligence功能，預計新版應用將在明年上線，不會在本月的WWDC 2025中亮相。屆時，用戶只需通過自然語言提…

06-03

點擊查看更多 +

全站最新

沃爾沃全新S90上市，尊享價30.09萬起，豪華與安全再升級！

東風納米06正式上市，7.99萬起售，高顏值科技范兒十足，你心動了嗎？

OMEN暗影精靈11：高性能游戲筆記本，暢玩3A大作的不二選擇！

AMD RX 9060 XT顯卡：8GB版主打1080p，價差雖小市場定位明確！

綠源液冷電機引領兩輪電動車進入耐用新時代！

旭化成氫能戰略：本土合作深化，綠氫市場搶灘布局

熱門內容

本欄最新

青少年科技盛宴落幕：第五屆全國科技教育成果展示大賽區域賽圓滿結束

微軟碳排放不降反升，2030年減碳目標面臨嚴峻挑戰

IBM布局AI再落一子，收購企業數據問答平臺Seek AI

Hot Chips 2025日程亮點：英特爾Clearwater Forest處理器等重磅登場

蘋果WWDC25開發者大會6月啟幕，iOS 19界面將迎來大變革？

英偉達消費者級AI超算DGX Spark七月來襲，性能如何？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

阿里Qwen3大模型登頂開源榜首，235B參數展現強勁實力

日本精品一区二区三区高清久久