由清華大學計算機系崔鵬教授團隊與穩準智能聯合研發的結構化數據通用大模型“極數”(LimiX)近日正式開源。這一突破標志著我國在結構化數據智能處理領域實現了技術自主創新與生態開放,為降低工業領域AI應用門檻提供了關鍵解決方案。特別是在泛工業場景中,該模型將有效破解工業數據價值挖掘難題,推動智能制造與新型工業化進程。
泛工業領域長期面臨結構化數據處理的技術瓶頸。傳統方法主要依賴語言大模型(LLM)或私有數據+專用模型的組合,但存在準確率不足、泛化能力弱、通用性差、成本高昂等缺陷。這些局限性嚴重制約了AI技術在工業場景中的規模化應用,尤其在數據質量參差不齊、環境異質性強的條件下,傳統模型難以滿足實際需求。
“極數”大模型通過創新的數據因果關系學習機制,實現了對因果變量與數據分布的動態捕捉能力。該模型可自適應完成分類、回歸、缺失值預測、數據生成及因果推斷等任務,展現出跨場景、多任務的通用性優勢。在產業實踐中,單一模型已成功適配多個工業場景,獲得合作企業的高度認可,成為泛工業垂直行業智能化的核心基礎設施。
研發團隊由清華大學計算機系崔鵬教授領銜,成員包括國家杰出青年科學基金獲得者、國家自然科學二等獎得主及ACM杰出科學家等頂尖學者。團隊在模型評測中選取了Talent等權威開源數據集作為基準,該數據集涵蓋上百個真實場景,是當前結構化數據領域最具代表性的評測體系之一。實驗結果顯示,“極數”在分類任務中AUC、ACC、F1Score和ECE四項指標均達到最優水平,顯著超越24個領域內最優模型。
在回歸任務評測中,“極數”大模型在R2和RMSE指標上均取得平均最優成績,尤其在數據存在干擾特征或無效特征時,性能優勢更為突出。這種抗干擾能力使其在復雜工業環境中具有顯著優勢,為解決實際生產中的數據噪聲問題提供了有效方案。
目前,“極數”已在多個關鍵工業領域實現落地應用。在工業運維方面,該模型為鋼鐵、能源電力等行業的設備監測、故障預警及健康評估提供核心支持;在工藝優化領域,成為化工、制造、生物等行業的“生產智囊”;在市場預測方面,助力能源、零售、農業等行業應對市場波動,為風險控制、成本優化及盈利提升提供決策依據。該模型現已通過GitHub、Huggingface、Modelscope等平臺開源,搜索“LimiX”即可獲取相關資源。











