人工智能領(lǐng)域迎來一項突破性進展,香港理工大學聯(lián)合多所高校的研究團隊開發(fā)出一種新型推理機制,使AI系統(tǒng)能夠在不重新訓練模型的情況下,通過增加計算資源顯著提升復雜問題解決能力。該成果已發(fā)表于知名學術(shù)預印本平臺,為AI推理技術(shù)開辟了全新路徑。
傳統(tǒng)AI模型在處理復雜任務(wù)時,需要像學生解題般逐步推導每個步驟,這種顯性推理方式雖邏輯清晰,但效率受限。研究團隊提出的"潛在推理"框架,讓AI以抽象數(shù)字向量的形式在"思維空間"中自主探索,模擬人類直覺思考過程。這種模式雖更高效,卻面臨思維路徑單一化的挑戰(zhàn)——缺乏類似人類通過不同表達方式展開思考的多樣性機制。
針對這一難題,科研人員創(chuàng)造性地提出兩種思維發(fā)散策略。第一種"蒙特卡洛隨機失活"技術(shù),通過隨機關(guān)閉AI神經(jīng)網(wǎng)絡(luò)中的部分連接節(jié)點,迫使系統(tǒng)探索不同計算路徑。這種策略如同讓思考者間歇性關(guān)閉部分腦區(qū),強制產(chǎn)生多樣化認知視角。實驗數(shù)據(jù)顯示,該方法在處理高難度問題時表現(xiàn)尤為突出,能持續(xù)挖掘突破性解決方案。
第二種"加性高斯噪聲"技術(shù)則采取不同思路,在思維過程中注入可控隨機擾動,模擬人類在嘈雜環(huán)境中思考時產(chǎn)生的思維發(fā)散效應。這種策略如同為思考者添加思維催化劑,使其在常規(guī)路徑附近產(chǎn)生更多變體。研究證實,該方法在解決結(jié)構(gòu)化問題時具有獨特優(yōu)勢,能快速定位最優(yōu)解區(qū)域。
為篩選最優(yōu)思維路徑,團隊構(gòu)建了智能評估體系。該系統(tǒng)通過"隨機推演"技術(shù),對每個思維節(jié)點進行質(zhì)量評估:從當前節(jié)點出發(fā)進行大量隨機推導,統(tǒng)計最終正確率作為評分依據(jù)。進一步引入的對比學習機制,使系統(tǒng)能區(qū)分不同路徑的相對優(yōu)劣,形成動態(tài)導航能力。這種評估方式突破了傳統(tǒng)概率計算的局限,為抽象思維過程建立了量化評價標準。
在數(shù)學推理基準測試中,新框架展現(xiàn)出顯著優(yōu)勢。實驗涵蓋1300個基礎(chǔ)數(shù)學題、600個多步驟算術(shù)題及高難度變體題庫,采用三種代表性潛在推理模型進行驗證。結(jié)果顯示,隨著計算資源投入增加,解題成功率呈現(xiàn)規(guī)律性提升:初期快速上升,后期增速放緩但持續(xù)正向增長。兩種發(fā)散策略表現(xiàn)出互補特性——蒙特卡洛策略在深度探索方面更優(yōu),加性噪聲策略在廣度覆蓋上占優(yōu)。
可視化分析揭示了兩種策略的本質(zhì)差異。蒙特卡洛路徑呈現(xiàn)"定向漂移"特征,如同水流沿河床持續(xù)深化探索;加性噪聲路徑則呈"輻射狀擴散",類似煙花綻放般覆蓋周邊區(qū)域。這種特性差異解釋了它們在不同難度任務(wù)中的表現(xiàn)分化:高難度問題需要深度突破時,定向探索更具優(yōu)勢;簡單問題尋求最優(yōu)解時,輻射擴散效率更高。
研究團隊特別強調(diào)該技術(shù)的工程價值。相比傳統(tǒng)模型優(yōu)化需要海量數(shù)據(jù)和漫長訓練周期,新方法僅需調(diào)整推理階段的計算資源分配,即可實現(xiàn)性能提升。這種"即插即用"的特性,使其在醫(yī)療診斷、科研分析等需要快速迭代的領(lǐng)域具有獨特應用潛力。實驗表明,通過合理配置計算資源,中等性能模型也能達到頂尖模型的解題水平。
當前技術(shù)仍存在優(yōu)化空間。研究人員指出,實際應用中需平衡隨機性強度與思維聚焦度,過度發(fā)散會導致資源浪費,過度集中則限制探索范圍。參數(shù)調(diào)優(yōu)過程雖不復雜,但需要針對具體場景進行定制化設(shè)置。這些挑戰(zhàn)反而為后續(xù)研究指明了方向——開發(fā)自適應探索策略,使系統(tǒng)能根據(jù)問題特性動態(tài)調(diào)整思維模式。
這項成果正在引發(fā)學術(shù)界廣泛關(guān)注。有專家指出,該研究首次證明潛在推理模型同樣能受益于并行計算,這為AI發(fā)展提供了全新維度。更深遠的影響在于,它揭示了機器思維與人類認知的相似性——多樣化思考路徑對復雜問題解決具有普適價值。隨著技術(shù)成熟,未來AI系統(tǒng)或?qū)⒕邆?自主選擇思考方式"的能力,在人機協(xié)作中提供更富創(chuàng)意的解決方案。











