日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

人民大學突破AI瓶頸:打造能“讀圖識文”的智能檢索新范式

   時間:2025-12-09 04:32:43 來源:互聯網編輯:快訊 IP:北京 發表評論無障礙通道
 

在計算機科學領域,如何讓AI像人類一樣自然理解并檢索包含文字、圖片等多種形式的混合內容,一直是備受關注的難題。近日,一支來自國內高校的研究團隊在該問題上取得重要進展,其研發的AI系統展現出處理復雜信息的能力,為智能信息檢索帶來新思路。

傳統AI系統在面對混合內容時存在明顯短板。多數系統要么將文字與圖片分開處理,如同讓人閉眼讀書、捂耳看畫,難以把握整體信息;要么僅用文字搜索圖片,如同憑聲音找電影,常遺漏關鍵內容。更重要的是,這些系統忽略了文字與圖片在同一頁面中的空間位置和邏輯聯系,導致對內容完整含義的理解出現偏差。

為攻克這一難題,研究團隊開發了名為Nyx的AI系統。該系統如同一位“超級圖書管理員”,不僅能解讀文字,還能“看懂”圖片,更能理解圖文混合時表達的完整信息。這種能力被團隊稱為“通用檢索增強生成”,旨在滿足現實世界中常見且復雜的信息處理需求。

構建這樣一個系統,首要挑戰是缺乏合適的訓練材料。現實中的網頁內容豐富多樣,但要讓AI學會處理,需要大量標注好的問答對作為“教材”。為此,團隊設計了一套四步驟的自動化流程,打造了NyxQA數據集。

第一步是從真實網頁中篩選內容。團隊從OBELICS數據集中選取真實網頁文檔,這些文檔包含各種圖文組合方式。他們將每個文檔切分成不超過200個文字標記的片段,同時保持語義完整,最終構建了包含46741個文檔片段的混合模態語料庫。該語料庫真實反映了網絡內容的多樣性,涵蓋純文字、單獨圖片、圖文配對及圖文交錯等復雜格式。

第二步是生成問答對。團隊從語料庫中挑選10000個代表性片段,使用視覺語言模型作為“AI老師”,為每個片段生成最多五個問答對。對于純文字文檔,AI老師專注于文本內容提問;對于含圖片的文檔,則特別關注視覺信息。為確保問題準確性,團隊設計了特殊標記系統,明確圖片與問題的對應關系。

第三步是質量把控。團隊設計了三重過濾機制:錯誤過濾階段清除明顯錯誤,如依賴上下文的問題或圖片標簽錯誤;問答精煉階段優化表達,去除冗余信息,提高清晰度;選項生成階段為每個問題生成三個合理但錯誤的干擾選項,提升AI的判斷精確性。經過處理,最終獲得了高質量的NyxQA數據集。

第四步是“硬核”負樣本挖掘。為讓Nyx學會精準檢索,團隊對每個問題確定正確文檔作為“正樣本”,再從語料庫中搜索最相關的前10個文檔,從中選取5個作為“硬負樣本”。這些樣本與問題高度相關但非正確答案,通過對比學習,Nyx學會了在海量信息中精準定位關鍵內容。

Nyx的訓練采用兩階段策略。第一階段是預訓練,團隊將NyxQA數據集與多個公開檢索數據集結合,進行大規模對比學習訓練,并融入Matryoshka表示學習技術,平衡檢索效果與計算效率。同時,為增強文本理解能力,團隊還加入了純文本數據集。第二階段是監督微調,團隊設計了一種基于視覺語言模型反饋的微調方法。對于每個查詢,先使用預訓練的Nyx檢索候選文檔,再輸入視覺語言模型生成答案,根據答案質量確定正負樣本,使檢索器更好配合生成模型。

Nyx的架構基于成熟的視覺語言模型改造而成。系統將不同模態內容映射到同一向量空間,使相似內容彼此靠近。為處理不同輸入,團隊在查詢前添加指令字符串,確保統一處理圖文混合內容。訓練目標采用InfoNCE損失函數配合Matryoshka表示學習,提升模型性能。

為驗證Nyx的性能,團隊進行了全面實驗。在文本檢索任務中,盡管對比模型擁有龐大參數,Nyx仍憑借輕量級架構取得顯著優勢。在多模態任務中,Nyx的表現更為突出,在多個數據集上實現了性能躍升。統計測試結果也證明了各改進步驟的有效性。

深入分析發現,訓練數據規模與模型性能呈對數線性關系,繼續增加高質量數據仍能提升性能。增加輸入文檔數量可提升檢索器表現,但收益遞減,Nyx在各種設置下均表現優異。Nyx還展現出跨生成器泛化能力,且Matryoshka表示學習技術使其能適應不同資源約束環境。

通過具體案例對比,Nyx的優勢更加明顯。在一個多模態問答案例中,對比模型或遺漏關鍵信息,或缺乏視覺證據,而Nyx不僅識別了查詢實體,還檢索到包含關鍵圖片的文檔,為生成準確答案提供了充分依據。

研究還發現,生成模型“偏好”的文檔可能與人工標注的黃金文檔不同。通過反饋學習,Nyx發現了更能幫助生成正確答案的文檔,這一發現挑戰了傳統檢索評估方式,提示應更關注檢索結果的實用性。

目前,研究團隊已將Nyx的代碼開源,為開發者和研究人員提供了基礎。這項技術有望在未來集成到搜索引擎、智能助手等應用中,讓信息獲取變得更加高效便捷。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
日本精品一区二区三区高清 久久
日本一区二区三区免费乱视频| 色欧美片视频在线观看| 国产精品欧美久久久久无广告| 在线精品亚洲一区二区不卡| 国产另类ts人妖一区二区| 亚洲成人一区在线| 中文在线一区二区| 日韩你懂的在线观看| 色狠狠色噜噜噜综合网| 国产91精品一区二区麻豆亚洲| 亚洲人午夜精品天堂一二香蕉| 欧美日韩中文字幕一区| 国产亚洲欧洲997久久综合| 在线视频你懂得一区二区三区| 精品一区二区三区av| 亚洲一区二区在线观看视频| 国产欧美综合在线| 日韩一级大片在线观看| 在线观看亚洲a| 成人免费毛片app| 狠狠色综合播放一区二区| 调教+趴+乳夹+国产+精品| 国产精品福利影院| 久久精品视频网| 欧美大片一区二区| 欧美日韩一卡二卡| 欧美午夜视频网站| 在线看国产一区| 日本高清不卡在线观看| 91视频com| 91在线高清观看| 97精品久久久久中文字幕| 不卡的看片网站| 成人小视频免费观看| 麻豆91精品91久久久的内涵| 在线一区二区观看| 裸体健美xxxx欧美裸体表演| 偷窥少妇高潮呻吟av久久免费| 亚洲综合免费观看高清完整版在线| 中文字幕一区二区视频| 国产精品久久久久久久裸模| 国产精品麻豆视频| 中文字幕在线视频一区| 国产精品综合一区二区| 欧美国产一区在线| 成人教育av在线| 国产精品伊人色| 国产在线播放一区| 国产在线不卡视频| 国产一区二区网址| 国产成人av电影在线播放| 国产精品自拍在线| 成人爽a毛片一区二区免费| 国产成人亚洲综合a∨猫咪| 高清在线成人网| 成人国产在线观看| 日本乱人伦aⅴ精品| 欧美午夜寂寞影院| 91精品国产综合久久福利| 欧美日韩免费观看一区二区三区| 欧美久久久久免费| 精品欧美一区二区久久 | 91日韩一区二区三区| 91在线播放网址| 欧美美女直播网站| 欧美精品一区二区高清在线观看| 欧美韩国日本不卡| 亚洲一区二区视频| 免费观看成人av| 国产成人av资源| 欧美性猛交xxxx乱大交退制版| 欧美一区二区三区视频免费 | 久久久久成人黄色影片| 中文一区在线播放| 亚洲成人免费在线| 国产在线视频一区二区三区| 97国产精品videossex| 欧美蜜桃一区二区三区| 国产欧美日韩精品a在线观看| 一区二区三区日韩欧美精品| 日本免费新一区视频| 国产91丝袜在线播放| 欧美性欧美巨大黑白大战| 久久一夜天堂av一区二区三区| 亚洲精品欧美在线| 久久国内精品视频| 91蝌蚪国产九色| 精品国产1区二区| 亚洲一区在线观看免费 | 九九久久精品视频| 色综合色综合色综合| 日韩欧美视频在线| 亚洲人成亚洲人成在线观看图片| 蜜桃一区二区三区在线观看| www.成人在线| 日韩欧美久久一区| 亚洲理论在线观看| 国产69精品久久久久毛片| 欧美日本视频在线| 亚洲乱码中文字幕| 国产成人小视频| 欧美一区二区久久久| 综合激情成人伊人| 国产精品一区二区在线观看网站| 欧美女孩性生活视频| 亚洲视频在线一区二区| 国产老女人精品毛片久久| 欧美人与禽zozo性伦| 亚洲欧美一区二区三区孕妇| 国产99久久久久久免费看农村| 911精品国产一区二区在线| 亚洲乱码国产乱码精品精小说| 粉嫩av亚洲一区二区图片| 日韩亚洲欧美成人一区| 亚洲国产精品欧美一二99| 97久久超碰国产精品| 久久午夜老司机| 久久精品国产久精国产| 91精品欧美久久久久久动漫| 亚洲电影一级片| 99re视频精品| 国产精品久久久久久久久久免费看| 国产一区二区三区四| 欧美成人性战久久| 日本亚洲视频在线| 欧美一区二区啪啪| 日韩精品视频网站| 欧美日韩国产大片| 亚洲成人免费av| 欧美日韩精品高清| 午夜国产不卡在线观看视频| 欧美三日本三级三级在线播放| 亚洲伦理在线免费看| 91福利区一区二区三区| 一区二区三区蜜桃| 欧美性猛片aaaaaaa做受| 亚洲午夜一区二区三区| 欧美日韩一级二级| 亚洲观看高清完整版在线观看| 欧美日韩精品久久久| 日韩国产精品久久| 欧美大片国产精品| 国产麻豆精品在线| 中文字幕一区av| 91久久精品一区二区| 亚洲一区二区三区在线播放| 欧美揉bbbbb揉bbbbb| 欧美aⅴ一区二区三区视频| 欧美成人a∨高清免费观看| 国产精品99久久久久久久vr| 日本一区二区成人| 色吧成人激情小说| 丝袜a∨在线一区二区三区不卡| 制服丝袜激情欧洲亚洲| 精品亚洲aⅴ乱码一区二区三区| 久久人人爽人人爽| 成人黄色一级视频| 一区二区三区四区激情| 欧美一级搡bbbb搡bbbb| 国产精品77777| 亚洲欧美激情一区二区| 日韩一区二区三区电影| 国产成人免费高清| 亚洲精品老司机| 日韩一级成人av| 成人一区二区三区在线观看| 亚洲一区在线观看视频| 精品剧情v国产在线观看在线| 成人黄色免费短视频| 亚洲自拍偷拍图区| 精品日韩av一区二区| 不卡电影免费在线播放一区| 午夜精品福利久久久| 国产午夜精品美女毛片视频| 欧美综合久久久| 精品一区二区在线视频| 亚洲区小说区图片区qvod| 欧美一区二区播放| 99久久婷婷国产精品综合| 日日摸夜夜添夜夜添国产精品 | 成人在线一区二区三区| 亚洲第一搞黄网站| 国产精品美女一区二区| 欧美一区二区美女| 91蝌蚪国产九色| 国产风韵犹存在线视精品| 午夜私人影院久久久久| 国产精品久久福利| 欧美电影免费观看完整版| 91亚洲精品久久久蜜桃| 久久精品国产一区二区三| 亚洲欧美日韩国产另类专区| 欧美一区二区播放| 欧美在线一二三四区| 高清在线不卡av| 久久精品久久精品| 亚洲国产日韩一级| 国产精品你懂的在线| 精品蜜桃在线看| 欧美另类久久久品|