滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

字節跳動聯手高校推出UniTok，視覺分詞技術迎來新突破

時間：2025-05-07 18:13:07 來源：ITBEAR編輯：快訊團隊 發表評論無障礙通道

近日，科技界迎來了一項重要創新，字節跳動攜手香港大學及華中科技大學，共同研發出了一款名為UniTok的視覺分詞器。這款分詞器不僅在視覺生成與理解領域展現出巨大潛力，還成功解決了傳統分詞器在細節捕捉與語義理解之間的難題。

UniTok采用了前沿的多碼本量化技術，通過將圖像特征分割成多個小塊，并利用獨立的子碼本進行量化，極大地提升了視覺token的表示能力。這一技術革新使得圖像在處理過程中能夠呈現出更加精細的細節。據悉，UniTok在ImageNet數據集上的零樣本分類準確率高達78.6%，同時圖像重建質量也達到了令人矚目的0.38，遠超當前市面上的其他分詞器。

UniTok的核心功能涵蓋了統一視覺表示與高質量圖像重建兩大方面。它能夠將圖像編碼為離散的視覺token，這些token不僅適用于圖像生成任務，如根據文本描述生成圖像，還能夠應用于視覺理解場景，例如回答與圖像內容相關的問題。UniTok結合了對比學習與重建損失，確保了生成的視覺token與文本描述之間的高度對齊，從而進一步提升了視覺理解的能力。

從技術原理上看，UniTok的多碼本量化技術使得視覺token的詞匯量實現了指數級增長。同時，它所采用的多頭注意力模塊也更好地保留了原始token中的語義信息，增強了分解后特征的表達能力。在訓練過程中，UniTok始終遵循統一的目標，既確保了圖像細節的準確重建，又優化了生成與理解任務。

UniTok不僅在視覺領域取得了顯著成果，還為多模態大語言模型（MLLM）的發展注入了新的活力。通過將生成的視覺token映射到多模態語言模型的token空間，UniTok推動了視覺與語言的統一處理。這一技術突破不僅提高了圖像生成的效率，還為教育、醫療影像分析等多個領域帶來了全新的應用機遇。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

閃極Shargeek 300移動電源來襲，300W總功率能否成為充電新王者？

05-23

ICDE 2025數據庫盛會啟幕，OceanBase國產技術成果閃耀香港

05-23

盧泓言和程苓峰是同一個人，程苓峰是其本名，而盧泓言是其筆名。他是一位知名的科技媒體人和自媒體人，曾擔任騰訊網科技中心總監和《新京報》等知名媒體的記者和編輯。他創建了“云科技”等自媒體平臺，并在社交媒體

05-23

三一重工沖刺港股：年營收近800億，梁穩根掌舵32%股權分紅超5億

05-23

2025劇集片單大比拼，愛優騰芒“卷”向何方？

除了芒果TV在女性長劇和IP類短劇上的布局之外，騰訊視頻的喜劇內容板塊也越來越成熟，今年上半年播出的《鵲刀門傳奇》第二季延續了之前的高口碑，豆瓣評分達到8.2分，此外，同板塊的內容中，騰訊視頻還將與徐崢的真樂…

05-23

滴滴順風車重拳出擊：線下交易零容忍，安全出行有保障

05-23

漫威復仇者聯盟系列大作，圣誕檔雙片來襲！

05-23

WebStorm 2025.2即將發布：性能優化，Bun包管理器支持增強

05-23

微軟5月更新包暴漲至4.3GB，用戶無奈：3GB AI文件必須裝？

05-23

微軟畫圖應用大升級！新增貼紙生成器與對象選擇，還有全新界面等你來探索

05-23

四川天府新區嚴管外賣平臺：商家違規行為成整治重點

05-23

銘瑄Z890 Vertex主板震撼登場：2999元解鎖9200MT/s內存超頻

05-23

Anthropic Claude 4震撼發布，7小時連續編碼挑戰程序員職業未來？

05-23

Anthropic Claude 4系列AI模型：編程優化，安全升級，能否再掀波瀾？

05-23

微軟記事本大升級！AI寫作功能來襲，創作效率能否一飛沖天？

05-23

點擊查看更多 +

全站最新

Acasis擴展塢眾籌火爆，M4 Mac mini接口與存儲大升級！

天貓養車權屬爭奪戰升級，阿里巴巴沉默背后真相幾何？

閃極Shargeek 300移動電源來襲，300W總功率能否成為充電新王者？

神龍汽車李旸：示界06上市，油電并舉策略如何平衡市場需求？

《泡姆泡姆》冒險游戲預購開啟！6月2日正式上線，標準版售價66元

聯檢科技并購潮起，主業煥新迎增長藍海！

熱門內容

本欄最新

ICDE 2025數據庫盛會啟幕，OceanBase國產技術成果閃耀香港

三一重工沖刺港股：年營收近800億，梁穩根掌舵32%股權分紅超5億

2025劇集片單大比拼，愛優騰芒“卷”向何方？

漫威復仇者聯盟系列大作，圣誕檔雙片來襲！

WebStorm 2025.2即將發布：性能優化，Bun包管理器支持增強

微軟5月更新包暴漲至4.3GB，用戶無奈：3GB AI文件必須裝？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

字節跳動聯手高校推出UniTok，視覺分詞技術迎來新突破

日本精品一区二区三区高清久久