滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

英偉達Eagle 2.5視覺語言模型：8B參數挑戰大模型性能極限

時間：2025-04-23 16:37:56 來源：ITBEAR編輯：快訊團隊 IP：北京 發表評論無障礙通道

英偉達近期在視覺-語言模型領域取得了新突破，推出了名為Eagle 2.5的模型。這款模型專注于長上下文多模態學習，尤其擅長解析大規模視頻和圖像數據。

Eagle 2.5雖然參數規模僅為8B，但在處理高分辨率圖像和長視頻序列時表現優異。在Video-MME基準測試中，該模型以512幀輸入取得了72.4%的高分，這一成績與規模更大的模型如Qwen2.5-VL-72B和InternVL2.5-78B不相上下。

Eagle 2.5的成功離不開其創新的訓練策略。首先，信息優先采樣策略通過圖像區域保留（IAP）技術，確保超過60%的原始圖像區域得以保留，同時減少寬高比失真。自動降級采樣（ADS）技術能夠根據上下文長度動態平衡視覺和文本輸入，從而優化文本完整性和視覺細節。

其次，漸進式后訓練策略也是Eagle 2.5取得成功的關鍵。該策略通過逐步擴展模型上下文窗口，從32K到128K token，使模型在不同輸入長度下都能保持穩定性能，有效避免了過擬合單一上下文范圍的問題。這些策略與SigLIP視覺編碼和MLP投影層的結合，進一步提升了模型在多樣化任務中的靈活性。

在訓練數據方面，Eagle 2.5整合了開源資源和定制數據集Eagle-Video-110K。該數據集專為理解長視頻設計，采用雙重標注方式。自上而下的方法通過故事級分割，結合人類標注章節元數據和GPT-4生成的密集描述，確保數據的完整性和準確性。自下而上的方法則利用GPT-4為短片段生成問答對，抓取時空細節，進一步提升數據的豐富性和多樣性。

通過余弦相似度篩選，Eagle-Video-110K數據集強調數據的多樣性而非冗余，確保敘事連貫性和細粒度標注。這一舉措顯著提升了模型在高幀數（≥128幀）任務中的表現。

在性能表現方面，Eagle 2.5-8B在多項視頻和圖像理解任務中均取得了出色成績。在視頻基準測試中，該模型在MVBench、MLVU和LongVideoBench上分別取得了74.8%、77.6%和66.4%的得分。在圖像基準測試中，Eagle 2.5-8B在DocVQA、ChartQA和InfoVQA上分別取得了94.1%、87.5%和80.4%的高分。

消融研究表明，IAP和ADS技術的移除會導致模型性能下降，而漸進式訓練策略和Eagle-Video-110K數據集的加入則帶來了更穩定的性能提升。這些結果進一步驗證了Eagle 2.5在視覺-語言模型領域的領先地位。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

數字人主播帶貨遇“指令陷阱”，網友惡搞引熱議，安全風險如何防范？

06-12

共筑數字安全防線！奇富科技領銜發起AI與人臉識別合規倡議

06-12

ChatGPT挑戰48年前游戲機，國際象棋對決竟遭慘敗！

06-12

智能眼鏡市場迎來爆發期，IDC預測全球出貨量將大增26%

06-12

GPT-4o模型自保傾向引關注：AI安全如何保障？

06-12

英偉達CEO預測：歐洲AI算力兩年內激增十倍，超20個AI超級工廠在建

06-12

夸克高考志愿大模型上線，智能融合數百專家經驗助考生精準填報

06-12

90后領航者劉靖康攜Insta360上市，重塑中國成像科技版圖

"Insta360 is a bet on people," said Niu Kuiguang of IDGCapital. "We invested in Liu's continued abilit…

06-12

阿斯加特推出大容量低延遲內存，256GB博拉琪二代滿足AI大模型需求！

06-12

騰訊云CodeBuddy：AI編程新寵，開發者如何高效利用？

06-12

紫光展銳5G/4G芯片攜手Android 16，四大升級亮點搶先看！

06-12

ChatGPT竟敗給48年前游戲機，國際象棋水平遭質疑！

06-12

迪士尼環球影業聯手起訴AI公司Midjourney版權侵權

據央視新聞，當地時間6月11日，迪士尼和環球影業對人工智能公司Midjourney提起版權訴訟，指控Midjourney盜版了這兩家好萊塢電影公司的版權庫，用于生成和分發其著名角色的“無數未經授權的副本”。據…

06-12

維基百科AI摘要計劃遇阻，編輯擔憂信譽受損緊急叫停

06-12

夸克高考志愿大模型上線，免費助力考生，張雪峰專欄來支招！

06-12

點擊查看更多 +

全站最新

華大北斗赴港上市，62歲董事長孫中亮背景揭秘，無控股股東引關注

美式豪華為何難登大雅之堂？凱迪拉克之困探析

眉山衛星產業崛起：三屆大會如何引領行業風向？

波音787夢想客機再釀悲劇，印度航班墜毀幸無中國公民傷亡

印度波音787客機起飛即墜毀，艾哈邁達巴德附近居民區緊急封閉

印度波音787客機起飛后墜毀，百余人遇難，波音公司正收集信息

熱門內容

本欄最新

夸克高考志愿大模型上線，智能融合數百專家經驗助考生精準填報

阿斯加特推出大容量低延遲內存，256GB博拉琪二代滿足AI大模型需求！

騰訊云CodeBuddy：AI編程新寵，開發者如何高效利用？

紫光展銳5G/4G芯片攜手Android 16，四大升級亮點搶先看！

ChatGPT竟敗給48年前游戲機，國際象棋水平遭質疑！

夸克高考志愿大模型上線，免費助力考生，張雪峰專欄來支招！

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

英偉達Eagle 2.5視覺語言模型：8B參數挑戰大模型性能極限

日本精品一区二区三区高清久久