滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

Meta開源WebSSL模型，視覺學習能否真正擺脫語言束縛？

時間：2025-04-25 12:08:17 來源：ITBEAR編輯：快訊團隊 發表評論無障礙通道

近日，科技界迎來了一項新的突破，meta公司正式發布了WebSSL系列模型，這一系列模型基于純圖像數據進行訓練，旨在探索無語言監督的視覺自監督學習（SSL）的潛力。此舉標志著meta在視覺學習領域邁出了重要一步。

在當前的視覺學習領域，以OpenAI的CLIP為代表的對比語言-圖像模型已成為學習視覺表征的熱門選擇。這類模型在視覺問答（VQA）、文檔理解等多模態任務中展現出了卓越的性能。然而，語言依賴成為了一個限制因素，由于數據集獲取的復雜性和數據規模的限制，語言依賴面臨著諸多挑戰。meta公司正是針對這一痛點，推出了WebSSL系列模型。

WebSSL系列模型涵蓋了DINO和Vision Transformer（ViT）兩種架構，參數規模從3億到70億不等。這些模型在Hugging Face平臺上發布，為研究和應用提供了極大的便利。值得注意的是，這些模型僅使用了metaCLIP數據集（MC-2B）中的20億張圖像子集進行訓練，完全排除了語言監督的影響。

WebSSL模型采用了兩種視覺自監督學習范式：聯合嵌入學習（DINOv2）和掩碼建模（MAE）。在訓練過程中，統一使用了224×224分辨率的圖像，并凍結了視覺編碼器，以確保結果差異僅源于預訓練策略。這一設計使得WebSSL模型能夠在不受數據和模型規模限制的情況下，深入評估純視覺自監督學習的表現潛力。

模型在五個容量層級（ViT-1B至ViT-7B）上進行了訓練，并基于Cambrian-1基準測試進行了評估。該基準測試覆蓋了通用視覺理解、知識推理、OCR和圖表解讀等16個VQA任務。實驗結果顯示，隨著參數規模的增加，WebSSL模型在VQA任務上的表現接近對數線性提升，而CLIP在超過30億參數后性能趨于飽和。

在OCR和圖表任務中，WebSSL模型的表現尤為突出。經過數據篩選后，僅用1.3%的富文本圖像進行訓練，WebSSL模型就在OCRBench和ChartQA任務中實現了高達13.6%的性能提升。這一成果充分展示了WebSSL模型在特定任務中的卓越性能。

WebSSL模型在高分辨率（518px）微調方面也表現出色，進一步縮小了與SigLIP等高分辨率模型的差距。在文檔任務中，WebSSL模型更是展現出了卓越的性能。這一成果不僅驗證了WebSSL模型在視覺學習領域的潛力，也為未來的研究提供了重要的參考。

WebSSL模型在無語言監督下仍展現出與預訓練語言模型（如LLaMA-3）的良好對齊性。這表明大規模視覺模型能夠隱式學習與文本語義相關的特征，為視覺與語言的交叉研究提供了新的思路。

同時，WebSSL模型在傳統基準測試（如ImageNet-1k分類、ADE20K分割）上也保持了強勁的表現。部分場景下，WebSSL模型甚至優于metaCLIP和DINOv2等現有模型。這一成果進一步證明了WebSSL模型在視覺學習領域的領先地位。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

思科發布量子糾纏芯片原型，探索量子計算橫向擴展新路徑

05-07

谷神星一號海射型（遙五）即將發射，商業航天新篇章即將開啟？

05-07

哈啰張家口布局新領域，哈智網絡科技公司成立注冊資本達千萬美元

05-07

順豐速運大手筆！注冊資本增至10億，增幅高達400%

05-07

寧德時代子公司斯諾威礦業被執行超2億，債務風波再起？

05-07

谷神星一號海射型（遙五）火箭即將升空，任務代號“槐序緋棠”！

05-07

斯凱奇中國商業布局揭秘：實控企業超20家，上海公司分支大幅縮減

05-07

AMD AI戰略聚焦機架級系統，Instinct MI400獲早期積極反饋

05-07

小米煥新極簡相機：既有功能全保留，升級細節大揭秘

05-07

英國“性價比之王”超市Iceland登陸中國，能否征服中國胃？

05-07

任天堂重拳出擊！起訴Switch 2外型泄露廠商，索賠三倍損失

05-07

新能源車ETF融資凈買入超百萬，融券卻連跌三日，市場風向如何？

05-07

DeepSeek登頂AI原生APP，3月月活高達1.94億，豆包騰訊元寶緊隨其后

QuestMobile數據顯示，2025年3月DeepSeek憑借1.94億的月活躍用戶數登頂AI原生APP第一，緊隨其后的是1.16億月活躍用戶的豆包和4164萬月活躍用戶的騰訊元寶?！?/div>

05-07

Cursor大放異彩！學生可免費享一年Pro會員，AI編程教育迎來新機遇

05-07

AI洗頭，是美發業的未來趨勢還是短暫泡沫？

值得一提的是，從市面上既有的經營模式來看，AI洗頭機品牌在單純AI洗頭店出現之前，大多數是和養生館等門店合作，這無疑降低了經營風險，也給了AI洗頭另一種思路：洗頭生意或許不在于“替代人工”而在于人工與智能的…

05-07

點擊查看更多 +

全站最新

理想L6智能煥新，激光雷達標配，能否再掀家庭用車新熱潮？

聯想天禧個人超級智能體問世：AI助手進化，越用越智能！

任天堂重拳出擊！起訴Switch 2外型泄露廠商，索賠三倍損失

法拉利一季度賺翻了！單車凈利潤93.9萬，全球車企利潤榜首

榮威品牌新篇：以“體面超值信賴”重塑國民好車新標桿

新能源車ETF融資凈買入超百萬，融券卻連跌三日，市場風向如何？

熱門內容

本欄最新

英國“性價比之王”超市Iceland登陸中國，能否征服中國胃？

任天堂重拳出擊！起訴Switch 2外型泄露廠商，索賠三倍損失

新能源車ETF融資凈買入超百萬，融券卻連跌三日，市場風向如何？

DeepSeek登頂AI原生APP，3月月活高達1.94億，豆包騰訊元寶緊隨其后

AI洗頭，是美發業的未來趨勢還是短暫泡沫？

于東來宣布休息反思，抖音賬號再度私密，未來何去何從？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

主站蜘蛛池模板：沙坪坝区| 富宁县| 阿拉善左旗| 措勤县| 九龙城区| 冕宁县| 濉溪县| 九龙县| 西乡县| 亚东县| 博爱县| 玉林市| 佛坪县| 濉溪县| 武安市| 云安县| 宾阳县| 宝兴县| 泰州市| 巫溪县| 乌兰浩特市| 田东县| 旬邑县| 奎屯市| 界首市| 霍邱县| 顺平县| 牡丹江市| 广水市| 宁夏| 荥经县| 太仓市| 渭源县| 南安市| 时尚| 盘山县| 磐石市| 武汉市| 桑日县| 祁阳县| 义乌市|

日本精品一区二区三区高清 久久

Meta開源WebSSL模型，視覺學習能否真正擺脫語言束縛？

日本精品一区二区三区高清久久

Meta開源WebSSL模型，視覺學習能否真正擺脫語言束縛？