滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

英偉達新模型DAM-3B：精準描繪圖像視頻局部細節

時間：2025-04-24 18:37:04 來源：ITBEAR編輯：快訊團隊 發表評論無障礙通道

英偉達近期震撼發布了Describe Anything 3B（簡稱DAM-3B）這一前沿AI模型，專為解決圖像與視頻中特定區域的精細描述問題而生。該模型在靜態圖像及動態視頻的局部描述領域取得了突破性進展，為相關領域開辟了新的道路。

盡管傳統的視覺-語言模型（VLMs）在生成整體圖像描述方面已相當成熟，但在處理圖像或視頻中特定區域的詳細描述時卻存在明顯短板。特別是在動態視頻中，時間動態變化、遮擋現象以及區域化描述的需求，使得這一任務變得尤為復雜。DAM-3B的推出正是為了攻克這些難題，它允許用戶通過點選、邊界框、涂鴉或掩碼等方式指定目標區域，進而生成精確且貼合上下文的描述性文本。

DAM-3B的核心創新在于其“焦點提示”技術。該技術巧妙地將全圖信息與目標區域的高分辨率裁剪圖相結合，既保留了整體背景，又確保了細節信息的真實呈現。這種獨特的融合策略，使得生成的描述更加精確且上下文連貫。

DAM-3B還引入了局部視覺骨干網絡。該網絡通過嵌入圖像和掩碼輸入，運用先進的門控交叉注意力機制，將全局與局部特征有機融合，再傳遞給大語言模型以生成描述。這一設計使得模型能夠更深入地理解目標區域及其與整體圖像之間的關系。

DAM-3B的能力不僅局限于靜態圖像，其衍生版本DAM-3B-Video更是將這一技術擴展至視頻領域。通過逐幀編碼區域掩碼并整合時間信息，DAM-3B-Video即使在面對遮擋或運動的情況下，也能生成準確的描述，為動態視頻的局部描述提供了強有力的解決方案。

為了克服訓練數據稀缺的難題，英偉達創新性地開發了DLC-SDP半監督數據生成策略。該策略充分利用分割數據集和未標注的網絡圖像，構建了包含150萬局部描述樣本的訓練語料庫。通過自訓練方法不斷優化描述質量，確保了輸出文本的高精確度。同時，英偉達還推出了DLC-Bench評估基準，以屬性級正確性作為衡量描述質量的標準，而非簡單地與參考文本進行對比。

在包括LVIS、Flickr30k Entities等在內的七項基準測試中，DAM-3B展現出了卓越的性能，平均準確率達到67.3%，成功超越了GPT-4和VideoRefer等模型，彰顯了其在圖像和視頻局部描述領域的領先地位。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

金信諾2024年業績大爆發，歸母凈利潤增超103%，海外業務增速近三成

04-24

神舟二十號航天員乘組出征，續寫中國航天新篇章！

04-24

好未來2025財年財報亮眼：全年凈收入大增51%，但Q4轉虧

好未來公布截至2025年2月28日的2025財年第四季度及全年財務業績。2025財年第四季度凈營收為6.102億美元，同比增長42.1%；歸屬于好未來的凈虧損為730萬美元，上年同期凈利潤2750萬美元。20…

04-24

石嘴山市工會揮毫潑墨，萬副春聯送福迎新春！

04-24

詩書翰墨聚京華，民生書法大會專家交流筆會盛啟新春

04-24

警惕！投資理財陷阱多，民生銀行銀川分行教你做明智金融消費者

04-24

老年人注意！民生銀行銀川分行揭秘五種電信網絡詐騙手段

04-24

民生銀行與中企云鏈共繪供應鏈金融新藍圖，鏈動未來賦能實體經濟

04-24

科研必備！DPPE-PEG-CHO：高效磷脂衍生物，構建靶向遞送新工具

04-24

追尋紅色記憶，民生銀行銀川紫微星座支行養老金融活動暖人心

04-24

DPPE-PEG-OPSS功能化衍生物，95%高純度，科研新寵如何助力生物偶聯？

04-24

生物醫學新星：DPPE-PEG-羅丹明復合分子，科研應用潛力無限！

04-24

多功能生物材料DPPE-PEG-Biotin：藥物遞送與生物檢測的新星

04-24

科研必備！DMPE-PEG-葉酸多功能復合分子，助力藥物遞送與成像

04-24

DPPE-PEG-FITC：高效熒光標記，生物相容性卓越的磷脂復合物

04-24

點擊查看更多 +

全站最新

金士頓FURY Renegade G5固態硬盤來襲，PCIe 5.0滿速體驗，2TB僅售2199元

紫光展銳A8880攜手斑馬智行，共創“芯片+OS”智能座艙新生態

智達誠遠發布鴻志汽車座艙系統，開源鴻蒙定制打造智能出行新體驗

芝奇DDR5內存套條加持，Intel 200S Boost超頻技術讓性能再升級！

一加13T亮相：自研P2芯片加持，中國唯一自研顯示產線成果如何？

奔馳Vision V概念車亮相：豪華內飾搭配科幻外觀，未來感十足！

熱門內容

本欄最新

石嘴山市工會揮毫潑墨，萬副春聯送福迎新春！

詩書翰墨聚京華，民生書法大會專家交流筆會盛啟新春

警惕！投資理財陷阱多，民生銀行銀川分行教你做明智金融消費者

老年人注意！民生銀行銀川分行揭秘五種電信網絡詐騙手段

民生銀行與中企云鏈共繪供應鏈金融新藍圖，鏈動未來賦能實體經濟

追尋紅色記憶，民生銀行銀川紫微星座支行養老金融活動暖人心

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

英偉達新模型DAM-3B：精準描繪圖像視頻局部細節

日本精品一区二区三区高清久久