日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

谷歌新架構突破Transformer超長上下文瓶頸!Hinton靈魂拷問:后悔Open嗎?

   時間:2025-12-06 01:12:30 來源:量子位編輯:快訊 IP:北京 發表評論無障礙通道
 

Transformer的提出者谷歌,剛剛上來給了Transformer梆梆就兩拳(doge)。

兩項關于大模型新架構的研究一口氣在NeurIPS 2025上發布,通過“測試時訓練”機制,能在推理階段將上下文窗口擴展至200萬token。

兩項新成果分別是:

Titans:兼具RNN速度和Transformer性能的全新架構;MIRAS:Titans背后的核心理論框架。

核心要解決的,就是Transformer架構在處理超長上下文時的根本局限:計算成本會隨著序列長度的增加而猛增。

不得不說,從Nano Banana到Gemini 3 Pro,再到基礎研究方面的進展,谷歌最近一段時間就是一個窮追猛打的架勢。

也難怪奧特曼要給OpenAI拉“紅色警報”了。

突破Transformer超長上下文瓶頸

現在AI領域已經達成共識的是,Transformer雖好,但自注意力機制的效率問題正在日益凸顯:每個token都要“關注”其他所有token,導致計算量和內存消耗與序列長度的平方成正比(O(N2))。

學界已經探索了多種解決方案,比如線性循環網絡(RNNs)和狀態空間模型(SSMs)等。

這類模型通過將上下文壓縮到固定大小來實現快速線性擴展。問題是,這種方法仍然無法充分捕捉超長序列中的豐富信息。

Titans + MIRAS,是谷歌提出的新架構和理論藍圖,目的是將RNN的速度和Transformer的性能結合到一起。

其中Titans可以理解為具體的工具,而MIRAS則是理論框架。兩者共同推進了測試時記憶的概念:

即模型在運行過程中,無需專門的離線重新訓練,就能通過整合更多信息來維持長期記憶。

本質上,可以說這個新架構的重點,是重新定義Transformer的“記憶模式”,將其進化為一種更強大的混合架構。

Titans:在線將上下文擴展至200萬

具體來說,Titans引入了一種新的神經長期記憶模塊。

與傳統RNN中固定大小的向量或矩陣記憶不同,該模塊本質上是一個在測試時動態更新權重的多層感知機(MLP)。

其獨特之處就在于,通常模型訓練完后,權重就固定了,但在Titans中,這個記憶模塊在推理階段依然在更新。

MAC(Memory as Context)是Titans架構的一種主要變體,設計思路是,將長期記憶作為一種額外的上下文信息,直接“喂”給注意力機制。

△MAC架構

研究人員發現,這個新的記憶模塊能顯著提升模型的表達能力,使其在不丟失重要上下文的情況下概括并理解大量信息。

更為重要的是,Titans并非被動地存儲數據,而是能在輸入數據中,主動學習如何識別并保留連接各個token的重要關系和概念。其中的關竅是“意外”。

在人類心理學中,我們很容易忘記一些常規的、預期之內的事情,但往往對“意外事件”印象深刻。

對于Titans也存在類似的情況。研究人員將其定義為“驚喜指標”(surprise metric):指模型檢測到當前記憶的內容和新輸入內容之間存在較大差異。

低意外度:比如新詞是“貓”,而模型的記憶狀態已經預測到會有一個動物詞,那么梯度(意外度)就很低。這時模型僅將這個詞作為短期記憶來處理即可。高意外度:如果模型的記憶狀態是正在總結一份嚴肅的財務報告,而新的輸入是香蕉皮的圖片(意外事件),則意外度將非常高。這表明新的輸入很重要或異常,需要優先將其存儲到長期記憶模塊中。

這樣對“意外”的判斷使得Titans架構能夠有選擇地更新長期記憶,從而保持快速和高效。

實驗表明,Titans的MAC變體能夠有效將上下文窗口擴展到200萬,并在“大海撈針”任務中保持高準確率。

MIRAS:序列建模的統一框架

如果說Titans是跑車,那么MIRAS就是背后的核心引擎。

MIRAS核心目標是讓模型在推理階段也能進行學習。其獨特之處在于,它不把不同的架構視為不同問題的解決方法,而是將其視為解決同一問題的不同途徑:

高效地將新信息與舊信息相結合,同時又不遺漏關鍵概念。

MIRAS將任意序列模型結構為4個關鍵設計選擇:

內存架構:存儲信息的結構(如向量、矩陣,或Titans中的MLP)。注意力偏差:模型優化的內部學習目標,決定模型優先考慮的內容。保留門控(Retention Gate):即“遺忘機制”,用于平衡“學習新知識”與“保留舊記憶”。記憶算法:用于更新記憶狀態的優化算法。

現有的序列模型大多依賴均方誤差(MSE)或點積相似度來更新記憶。

MIRAS的另一個創新,是引入非歐幾里得目標函數,允許使用更復雜的數學懲罰機制。

谷歌的研究人員基于MIRAS,創建了三個特定的無注意力模型:

YAAD:使用更溫和Huber Loss來處理錯誤,對異常值(如文檔中的拼寫錯誤)不敏感,魯棒性更強。MONETA:使用Generalized Norms(廣義范數),通過更嚴格的規則來管理注意力和遺忘,提升記憶穩定性。MEMORA:強制記憶像概率圖一樣運作,確保信息整合過程的受控和平衡。

實驗結果顯示,基于Titans和MIRAS的模型性能優于最先進的線性循環模型(如Mamba 2),以及規模相近的Transformer基線模型。

更顯著的優勢在于,新架構能夠處理極長上下文,在參數規模小得多的情況下,性能優于GPT-4等大規模模型。

One More Thing

超越Transformer的探索還在繼續,但不可否認的是,Transformer依然是大模型時代的理論基石。

那么,曾經一度在競爭中落后的谷歌,是否會后悔公開了Transformer的研究呢?

同樣是在NeurIPS 2025上,Jeff Dean回答了諾獎得主、圖靈獎得主Hinton提出的這個問題:

不,它對世界產生了巨大的積極影響。

這格局,谷谷人人又希希了。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
日本精品一区二区三区高清 久久
国产一区二区三区观看| 国产精品国产三级国产普通话三级| 一本久久a久久精品亚洲| 色综合天天综合网天天狠天天 | 欧美日韩日日夜夜| 欧美mv日韩mv国产网站| 中文字幕一区二区三区蜜月| 亚洲影院免费观看| 国产一区二区三区免费观看| 成人手机在线视频| 欧美精品乱码久久久久久| 亚洲精品一区在线观看| 一区二区三区中文字幕电影| 麻豆精品一区二区av白丝在线| 国产伦精品一区二区三区在线观看| 成人av午夜电影| 欧美v日韩v国产v| 午夜亚洲福利老司机| 成人毛片在线观看| 日韩午夜小视频| 亚洲3atv精品一区二区三区| www.亚洲精品| 日本一区二区三区高清不卡 | 欧洲精品视频在线观看| 中文字幕一区在线观看视频| 国产在线播精品第三| 日韩亚洲欧美一区二区三区| 夜夜嗨av一区二区三区中文字幕 | 性感美女久久精品| 欧日韩精品视频| 精品福利二区三区| 日韩va亚洲va欧美va久久| 日本黄色一区二区| 亚洲日本成人在线观看| 99精品久久免费看蜜臀剧情介绍| 精品三级在线看| 国模一区二区三区白浆| 国产欧美日韩精品a在线观看| 国产麻豆精品视频| 中文乱码免费一区二区| 91日韩一区二区三区| 一区二区三区四区不卡在线| 欧美无乱码久久久免费午夜一区| 亚洲成人动漫在线免费观看| 欧美理论在线播放| 精品综合久久久久久8888| 国产日韩精品久久久| 在线观看www91| 免费精品视频最新在线| 国产精品免费网站在线观看| 91网上在线视频| 老司机午夜精品| 亚洲精品视频一区二区| 欧美日本乱大交xxxxx| 国产精品一区二区视频| 一区二区高清视频在线观看| 精品久久一二三区| 欧美亚洲国产bt| 成人一区在线观看| 精品一区免费av| 亚洲曰韩产成在线| 国产日产精品1区| 精品国产乱码久久| 欧美老肥妇做.爰bbww| 99精品视频一区二区三区| 国产一区二区三区四| 日韩不卡一二三区| 亚洲一区二区四区蜜桃| 一区二区中文视频| 中文av一区特黄| 精品对白一区国产伦| 91精品在线免费观看| 欧美综合天天夜夜久久| 国模少妇一区二区三区| 麻豆一区二区99久久久久| 日本在线观看不卡视频| 日韩国产精品91| 美日韩一区二区| 久久精品国产99久久6| 日本午夜精品一区二区三区电影| 午夜一区二区三区视频| 日本不卡视频在线| 精品一区二区三区免费视频| 激情国产一区二区| 国精产品一区一区三区mba视频 | 精品国产乱码久久久久久蜜臀| 26uuu精品一区二区三区四区在线| 日韩欧美在线一区二区三区| 欧美r级在线观看| 中文字幕一区av| 亚洲va天堂va国产va久| 国产综合色视频| 91啪亚洲精品| 久久人人爽爽爽人久久久| 精品99999| 亚洲一区日韩精品中文字幕| 日本视频一区二区三区| 不卡一二三区首页| 欧美精品在欧美一区二区少妇 | 日韩国产成人精品| 成人免费电影视频| 欧美日韩国产综合久久| 26uuu国产在线精品一区二区| 国产精品成人免费在线| 国产一区二区中文字幕| 色婷婷av一区二区三区gif| 久久久国产综合精品女国产盗摄| 亚洲成av人影院在线观看网| 成人开心网精品视频| 日韩写真欧美这视频| 日本麻豆一区二区三区视频| 91黄色激情网站| 亚洲女与黑人做爰| 成人激情午夜影院| 欧美国产精品v| 国产老妇另类xxxxx| 欧美日韩在线播放三区四区| 国产精品久久久久久久久晋中| 麻豆精品视频在线| 欧美一级搡bbbb搡bbbb| 日韩综合小视频| 欧美一卡2卡三卡4卡5免费| 亚洲第一会所有码转帖| 欧美日韩午夜在线视频| 亚洲一区二区三区小说| 91美女片黄在线| 午夜视频一区二区三区| 制服丝袜成人动漫| 蜜臀av性久久久久蜜臀aⅴ流畅 | 久久超碰97中文字幕| 精品国产在天天线2019| 国产999精品久久久久久| 国产精品视频九色porn| 色综合天天综合给合国产| 亚洲成人av福利| 欧美va亚洲va在线观看蝴蝶网| 国精产品一区一区三区mba桃花| 国产三级一区二区三区| 色综合久久综合网| 青草国产精品久久久久久| 国产午夜亚洲精品不卡| 欧美性猛交xxxxxx富婆| 精品一区二区三区久久| 中文字幕中文字幕一区| 777精品伊人久久久久大香线蕉| 国产精品1区2区3区在线观看| 亚洲天堂久久久久久久| 日韩女优视频免费观看| 99精品视频在线观看| 国内精品不卡在线| 亚洲国产视频在线| 中文字幕一区二区不卡| 欧美大片在线观看一区二区| 色先锋资源久久综合| 国产一区二区三区精品欧美日韩一区二区三区 | 懂色一区二区三区免费观看| 日本不卡123| 亚洲国产精品久久久久婷婷884 | 99久久99久久久精品齐齐| 国产精品一区二区久激情瑜伽| 天堂久久久久va久久久久| 亚洲色图视频网| 中文av字幕一区| 久久久91精品国产一区二区精品 | 国产91在线观看丝袜| 国产一区二区女| 久草在线在线精品观看| 麻豆久久久久久| 激情国产一区二区 | 欧美国产丝袜视频| 国产精品成人免费| 亚洲精品美国一| 夜夜操天天操亚洲| 亚洲成人黄色小说| 日韩电影网1区2区| 美国av一区二区| 99视频在线精品| 欧美日韩在线电影| 久久午夜羞羞影院免费观看| 国产女人aaa级久久久级| 一区二区日韩av| 国产精品一区二区黑丝| 97se亚洲国产综合自在线观| 欧美性猛交xxxx黑人交| 久久综合丝袜日本网| 亚洲欧洲国产日韩| 美女免费视频一区二区| 97久久精品人人做人人爽50路| 欧美日韩的一区二区| 国产精品系列在线| 无码av免费一区二区三区试看| 国产一区二区成人久久免费影院| 91麻豆精品视频| 久久久国产精华| 美女爽到高潮91| 欧美三级韩国三级日本三斤| 中文字幕av资源一区| 国产永久精品大片wwwapp| 制服丝袜中文字幕一区| 一区二区成人在线观看|