滾動資訊

當前位置：首頁 > 資訊 > 游戲之家 > 正文內容

字節Seed團隊開源BAGEL：多模態理解與生成，圖像視頻文本一鍵搞定！

時間：2025-06-03 19:22:32 來源：ITBEAR編輯：快訊團隊 發表評論無障礙通道

字節跳動旗下的Seed團隊近期公布了一項重大技術進展，他們宣布開源了一個名為BAGEL的統一多模態理解與生成模型。這一模型能夠同時處理文本、圖像和視頻數據，實現跨模態的信息交互與生成。

據悉，BAGEL模型擁有70億個激活參數（總參數量達到140億），并在海量交錯多模態數據上進行了深度訓練。在多項標準測試中，BAGEL的表現超越了當前頂尖的開源多模態模型，如Qwen2.5-VL和InternVL-2.5，甚至在文本到圖像的生成質量上，也能與專業級生成器SD3相媲美。

除了在多模態理解方面取得突破，BAGEL在圖像編輯領域同樣展現出了非凡的能力。它不僅在經典編輯場景中優于其他開源模型，還進一步擴展到自由形式的視覺操作、多視圖合成以及世界導航等高級任務。這些能力標志著BAGEL在“世界建模”這一前沿領域邁出了重要一步。

BAGEL基于先進的大語言模型進行訓練，因此具備基礎的推理和對話能力。它能夠接收混合了圖像和文本的輸入，并以同樣混合的格式輸出結果。這種靈活性使得BAGEL在處理復雜多模態信息時更加得心應手。

在生成高質量、逼真的圖像和視頻方面，BAGEL同樣表現出色。它還引入了長思維鏈（COT）模式，使得模型在生成內容之前能夠進行更為深入的“思考”。這種能力不僅提升了生成內容的質量，還增加了生成過程的可控性和可預測性。

由于在大規模交錯多模態數據上的預訓練，BAGEL自然而然地學會了保留視覺特征和細微細節。它能夠從視頻中捕捉到復雜的視覺運動，這一能力使得它在圖像編輯方面更加高效且準確。BAGEL還能基于少量對齊數據實現圖片風格的切換和場景轉換。

更令人矚目的是，BAGEL還具備世界模型的基礎能力。它能夠進行世界導航、未來幀預測以及3D世界生成等挑戰性任務。通過不同角度的旋轉或視角切換，BAGEL能夠展現出強大的泛化能力。不僅在真實場景中表現出色，它還能在游戲、藝術作品以及卡通動畫等虛擬環境中實現導航。

基于以上強大的能力，BAGEL通過一個統一的多模態接口，實現了各項能力的復雜組合和多輪對話。用戶可以通過簡單的指令，讓BAGEL完成從圖片剪切到智能編輯，再到場景轉換和風格轉換等一系列操作，極大地提升了工作效率和創作自由度。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

《逆水寒》攜手可靈AI，全新動圖玩法讓游戲截圖“動”起來！

06-05

微軟博客預告片新稱謂“Xbox PC”，或預示Xbox生態系統融合趨勢？

06-05

《逆水寒》手游牽手可靈AI，圖片秒變動圖，游戲記錄新玩法來襲！

06-05

鑫谷GPE-01石墨烯導熱墊AM5版上市，130W/m·K高效導熱

06-05

Switch 2盛大發售，經典新作齊上陣，哪款游戲是你的最愛？

06-05

《逆水寒》手游新玩法：圖片秒變動圖，可靈AI攜手打造全新游戲體驗！

06-05

索尼PlayStation發布格斗游戲專屬街機風無線搖桿Project Defiant

06-05

威剛高端microSD卡助力Switch 2，存儲空間擴展無憂

06-05

Lighthouse Games：欲顛覆賽車游戲界，挑戰自己曾經的輝煌？

06-05

《仁王3》預告震撼發布，2026年初硬核開放世界等你來戰！

06-05

威剛高端microSD卡通過任天堂Switch 2測試，助力玩家擴容提速

06-05

《Pragmata》2026年登陸PS5，卡普空最新預熱視頻揭秘主角初遇場景

06-05

育碧大作將登陸Xbox Game Pass？2025年或迎游戲盛宴

06-05

Arm與Epic合作，ASR超分技術助力《堡壘之夜》移動端性能升級

06-05

方便面巨頭商標戰：今麥郎康師傅“一桶半一倍半”均告敗

06-05

點擊查看更多 +

全站最新

三星高管詳解Galaxy S25 Edge：超薄設計下電池續航仍可用一整天

微軟博客預告片新稱謂“Xbox PC”，或預示Xbox生態系統融合趨勢？

Skullcandy新款Aviator 900 ANC頭戴耳機：復古設計融合THX空間音頻技術

爾英HX770-NAS主板亮相，支持多至12個SATA接口，專為NAS打造

寶馬X5/X6/X7車型全面升級，動力多樣化布局未來出行

《逆水寒》手游牽手可靈AI，圖片秒變動圖，游戲記錄新玩法來襲！

熱門內容

本欄最新

微軟博客預告片新稱謂“Xbox PC”，或預示Xbox生態系統融合趨勢？

《逆水寒》手游牽手可靈AI，圖片秒變動圖，游戲記錄新玩法來襲！

鑫谷GPE-01石墨烯導熱墊AM5版上市，130W/m·K高效導熱

《逆水寒》手游新玩法：圖片秒變動圖，可靈AI攜手打造全新游戲體驗！

索尼PlayStation發布格斗游戲專屬街機風無線搖桿Project Defiant

威剛高端microSD卡助力Switch 2，存儲空間擴展無憂

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

字節Seed團隊開源BAGEL：多模態理解與生成，圖像視頻文本一鍵搞定！

日本精品一区二区三区高清久久