全球首個基于Model Context Protocol(MCP)架構的開源檢索增強生成(RAG)框架UltraRAG2.1正式發布。這款由清華大學THUNLP實驗室、東北大學NEUIR實驗室、OpenBMB與AI9Stars聯合研發的框架,通過YAML配置文件即可完成多階段推理與生成任務,徹底擺脫傳統代碼編寫的技術壁壘,為多模態智能檢索系統開發開辟新路徑。
在核心功能層面,UltraRAG2.1實現了原生多模態支持與跨模態檢索閉環。其內置的VisRAG Pipeline可自動解析PDF文檔中的文字與圖表,構建跨模態索引系統。科研人員通過"問圖答文"或"以文搜圖"功能,能快速從技術手冊、學術論文中提取關鍵信息。這種混合檢索模式突破了傳統文本檢索的局限,為復雜知識場景提供高效解決方案。
知識庫構建方面,框架深度集成開源文檔處理工具MinerU,支持Word、PDF、Markdown等格式的智能解析。系統自動完成語義分塊與結構化處理,用戶無需手動清洗數據即可構建企業級私有知識庫。該功能使知識管理效率提升數倍,特別適用于需要處理海量文檔的企業場景。
工作流標準化是UltraRAG2.1的另一大突破。框架提供全鏈路可視化操作界面,兼容Elasticsearch、FAISS等檢索引擎,以及Llama、Qwen、Kimi等主流生成模型。通過引入量化評估體系,開發者可從相關性、忠實度、流暢性等維度評估結果質量,精準定位系統瓶頸。這種標準化流程使RAG系統優化周期大幅縮短。
MCP架構的引入徹底改變了RAG系統的開發模式。傳統硬編碼方式被解耦為標準化"智能體"模塊,檢索、推理、生成等環節可通過YAML配置靈活組合。例如,用戶可通過幾行配置實現"技術文檔檢索→代碼生成→結果校驗"的三階段工作流,這種可組合性為復雜任務處理提供了工程化范式。
該框架的開源特性正在重塑全球RAG技術生態。中文科研團隊主導的技術創新,為多模態理解、知識構建與效果評估提供了輕量化解決方案。企業與研究機構可基于該框架快速落地大模型應用,推動AI技術從實驗室走向真實業務場景。項目代碼已通過GitHub平臺開放,開發者可訪問https://github.com/OpenBMB/UltraRAG獲取完整資源。





