滾動資訊

當前位置：首頁 > 資訊 > 手機快報 > 正文內容

蘋果杜克聯手突破！AI交錯推理讓Qwen2.5模型響應飆升80%

時間：2025-05-30 15:10:31 來源：ITBEAR編輯：快訊團隊 發表評論無障礙通道

近期，蘋果公司與杜克大學的一項合作研究引起了科技界的廣泛關注。這項研究提出了一種名為交錯推理的全新強化學習方法，旨在增強大語言模型的推理能力。

在以往，大型語言模型在處理復雜的多步驟問題時，通常采用一種線性的推理方式，即先完成整個推理過程，再給出答案。然而，這種方式存在明顯缺陷：一方面，它導致了較長的響應時間，無法滿足即時交互的需求；另一方面，一旦推理過程中的某個環節出錯，最終答案的準確性也會大打折扣。

與人類的對話習慣不同，語言模型往往不會在推理過程中分享任何中間想法，而是等待全部推理完成后再一次性輸出結果。這種“閉門造車”的方式，無疑降低了模型的效率。

為了克服這一難題，蘋果與杜克大學的研究人員共同研發了交錯推理技術。這一技術允許模型在推理過程中交替進行內部計算和輸出中間答案，從而極大地提升了速度和實用性。

交錯推理技術基于強化學習框架，采用了一種特殊的訓練模板，其中包含了特定的標簽，以確保模型在關鍵推理節點上能夠輸出中間結果。研究團隊還設計了一套基于規則的獎勵機制，包括格式正確性、最終答案準確率和條件性中間準確率，以引導模型注重整體推理的準確性。

在實際測試中，交錯推理技術在Qwen2.5模型（包括1.5B和7B參數版本）上取得了顯著成效。與傳統方法相比，響應速度提升了超過80%，準確率也提高了高達19.3%。更令人矚目的是，該方法僅在問答和邏輯數據集上進行了訓練，卻能夠在MATH、GPQA、MMLU等更具挑戰性的基準測試中展現出強大的泛化能力。

研究團隊還嘗試了多種獎勵策略，如全或無獎勵、部分積分獎勵和時間折扣獎勵等。實驗結果表明，條件性和時間折扣獎勵策略的效果最佳，顯著優于傳統獎勵方法。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

華為Mate 70系列逆襲！與小米15系列銷量并駕齊驅，誰將更勝一籌？

06-07

紅魔電競平板3 Pro：9英寸小屏王者，5280Hz超高頻PWM調光護眼新高度

06-07

OVM三強爭霸，哪款Ultra旗艦才是你的菜？

06-07

蘋果watchOS 26或將支持Series 6及以上Apple Watch，設計迎新變化？

06-06

華為Mate XT三折疊新機下半年來襲，處理器等配置全面升級？

06-06

蘋果HomePod軟件更新26：老機型迎來新生？

06-06

小米智能門鎖2指靜脈版來襲！AI貓眼+疾速降噪鎖體，首發僅1699元

06-06

華為新專利曝光：Pura80 Ultra或搭載“一底雙長焦”技術

06-06

美洽AI全新升級，賦能新媒體營銷，助力企業線索增長新飛躍！

06-06

天馬護眼新紀元：五大科技維度，共筑健康視界新標準

06-06

蘋果watchOS 26兼容設備名單出爐，Apple Watch Series 6及后續型號繼續獲支持

06-06

OVM旗艦對決，誰能問鼎影像之巔？

06-06

華為Pura80系列影像大揭秘：240mm焦距+10倍變焦，攝影新體驗？

06-06

紅魔電競平板3 Pro來襲！5280Hz超高頻PWM調光引領護眼新風尚

06-06

榮耀400系列首銷火爆，全渠道銷量超前輩，生產線全力加速中！

06-06

點擊查看更多 +

全站最新

廣汽豐田致炫全面升級，新車色檸檬黃彰顯年輕活力！

《侏羅紀世界：進化3》預告曝光：小恐龍亮相，2025年10月21日正式發售

《匹諾曹的謊言：序曲》DLC前夕，游戲預告片意外曝光！

《死亡擱淺2》新預告震撼來襲，6月26日小島秀夫帶你探索冥灘

《索尼克賽車：交叉世界》添重量級客串，9月25日多平臺震撼上線！

保時捷女銷冠牟倩文：六年磨一劍，寶媽如何成就銷售傳奇？

熱門內容

本欄最新

華為Mate 70系列逆襲！與小米15系列銷量并駕齊驅，誰將更勝一籌？

紅魔電競平板3 Pro：9英寸小屏王者，5280Hz超高頻PWM調光護眼新高度

OVM三強爭霸，哪款Ultra旗艦才是你的菜？

蘋果watchOS 26或將支持Series 6及以上Apple Watch，設計迎新變化？

華為Mate XT三折疊新機下半年來襲，處理器等配置全面升級？

蘋果HomePod軟件更新26：老機型迎來新生？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

蘋果杜克聯手突破！AI交錯推理讓Qwen2.5模型響應飆升80%

日本精品一区二区三区高清久久