滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

快手上海交大聯手發布Orthus模型，開創多模態生成理解新紀元

時間：2025-07-23 23:33:59 來源：ITBEAR編輯：快訊團隊 IP：北京 發表評論無障礙通道

國際機器學習大會（ICML）近期落幕，快手攜手上海交通大學推出了一款名為Orthus的多模態生成理解模型，該模型已正式對外開源。這款創新之作基于自回歸Transformer架構，實現了文本與圖像間的無縫轉換，展現了卓越的生成能力。

Orthus的核心優勢在于其高效的計算性能和強大的學習能力。研究顯示，即便在有限的計算資源下，該模型在多項圖像理解指標上仍超越了現有的混合理解生成模型，例如Chameleon和Show-o。尤其在文生圖生成的Geneval指標上，Orthus的表現尤為突出，甚至超過了專為該任務設計的擴散模型SDXL。

Orthus不僅在處理文本與圖像交互關系上表現出色，還在圖像編輯和網頁生成等領域展現出巨大潛力。其架構設計精妙，以自回歸Transformer為主干網絡，配備專門用于生成文本和圖像的模態生成頭。這一設計巧妙地分離了圖像細節建模與文本特征表達，使模型能夠專注于構建文本與圖像之間的復雜聯系。

該模型由多個關鍵組件構成，包括文本分詞器、視覺自編碼器以及針對兩種模態的嵌入模塊。這些組件共同協作，將文本和圖像特征融合到一個統一的表示空間中，使主干網絡在處理模態間依賴關系時更加高效。在推理階段，模型會根據特定標記，以自回歸方式生成下一個文本token或圖像特征，展現出高度的靈活性。

Orthus的創新設計不僅解決了端到端擴散建模與自回歸機制之間的沖突，還有效減少了圖像離散化帶來的信息損失。這一成果被視為是何愷明在圖像生成領域MAR工作的多模態拓展，具有重要的學術和應用價值。

更多>同類資訊

華為Pura80 Pro降價“來勢洶洶”，跌價超千元，與iPhone17同價競爭成熱門之選

有些東西失去之后，想要再拿回來，可就沒那么容易了，例如手機市場份額就是一個典型的例子，阿維記得之前小米手機份額下跌后又實現逆轉漲回，甚至專門在發布會多次宣傳這一點，然而如今這個角色換成了蘋果，前兩年蘋果手機的…

09-13

2025年8月千元機性價比榜單揭曉！性能續航大比拼，誰才是你的心頭好？

如果你追求極致性能、超大電池和更好的質感，它非常值得考慮。續航霸主：真我Neo7Turbo如果你是個重度手機用戶，對續航有極致要求，那么排名第八的真我Neo7 Turbo應該進入你的視線。它直接配備了72…

09-13

?吉利星愿蟬聯榜首小米SU7入圍前五，純電車消費邏輯與市場格局悄然生變?

有人可能就要問了：為什么現在買電動車的人越來越多？吉利星愿以55139輛的月銷量蟬聯榜首，定價7.2萬至10.2萬元，CLTC續航300-400公里，三合一集成電機技術讓車身更輕、動力更高效。58%的潛在購車…

09-13

標題

具體到全球農創客大賽，拼多多副總裁侯凱笛認為，這遠不止是一場比賽——首先，前沿技術與創新解決方案能夠直接助力產業升級；其次，作為平臺對接全球創新網絡與資源，有助于推動中國先進的農業解決方案“走出去”；另外，…

09-13

海關助力老字號月餅“揚帆出海” 海外游子品香解鄉愁傳文化

作為已有百余年歷史的上海老字號，杏花樓月餅不僅在國內市場備受青睞，在海關部門的全程護航下，更是漂洋過海，成為海外華人舌尖上的“故鄉味道”。今年中秋，面向國內市場，杏花樓在保留傳統口味的基礎上，創新推出海派國…

09-13

美股動態：部分中概股走強慧擇二季報亮眼盤中漲超45%

盤初，華納兄弟探索公司漲近9%，上一交易日漲幅超28%。另外，美股部分量子計算概念股強勢沖高，IONQ漲超12%，RGTI漲近8%，QUBT漲超6%，ARQQ、QBTS、昆騰漲超4%。消息面上，公司12日…

09-13

銀華阿爾法混合(011817)單日漲6.74%！科技布局顯成效，未來走勢如何？

這只基金自2021年6月2日成立以來，雖然經歷市場波動，但憑借對科技、制造等行業的精準布局，近期表現出強勁的反彈勢頭。銀華阿爾法混合(011817)近一年收益已超70%，在同類基金中名列前茅。市場分析人士指…

09-13

奔馳新車設計：大屏與實體按鍵并存，滿足多元需求

09-13

八部門聯合發布汽車行業新方案：優化產業環境，力促2025年汽車銷量與新能源雙增長

09-13

八部門聯合發力！2025年我國汽車銷量目標錨定3230萬輛，新能源汽車將達1550萬輛

09-13

?仰望U8L從越野到行政旗艦：技術加持下128萬售價背后的豪華新詮釋?

09-13

?央視聚焦深藍“黑公關”事件，直擊汽車行業網絡亂象沖擊老實車企?

09-13

?新能源就近消納新政落地：明確機制責任，綠電發展駛入快車道?

09-13

超10萬輛奇瑞捷豹路虎車型召回！發現運動、攬勝極光等在列，影響幾何？

09-13

賽力斯周林：以技術生態雙輪驅動推動汽車產業效能升級與全球突圍

09-13

點擊查看更多 +

全站最新

極狐T1上市：續航、空間、科技配置全領先，與元UP對比優勢盡顯

仰望U8L鼎世版128萬起售，以中式“鼎級”美學與安全，重塑全尺寸豪華SUV新標桿

六萬級極狐T1憑硬核實力出圈：電池安全拉滿，座艙健康無憂，配置越級碾壓

仰望U8L鼎世版上市：以鼎級安全為基融東方美學鑄就行政豪華新典范

極狐T1：越級實力亮相A0級市場，極光電池三測無憂護出行

售價128萬元！仰望U8L鼎世版攜極致安全與豪華體驗，開啟全尺寸SUV新篇章

熱門內容

本欄最新

美股動態：部分中概股走強慧擇二季報亮眼盤中漲超45%

八部門聯合發力！2025年我國汽車銷量目標錨定3230萬輛，新能源汽車將達1550萬輛

?仰望U8L從越野到行政旗艦：技術加持下128萬售價背后的豪華新詮釋?

?央視聚焦深藍“黑公關”事件，直擊汽車行業網絡亂象沖擊老實車企?

?新能源就近消納新政落地：明確機制責任，綠電發展駛入快車道?

超10萬輛奇瑞捷豹路虎車型召回！發現運動、攬勝極光等在列，影響幾何？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

快手上海交大聯手發布Orthus模型，開創多模態生成理解新紀元

日本精品一区二区三区高清久久