全球首個AI大模型實時投資競賽“AlphaArena”近日完成全部賽程,中國自主研發(fā)的阿里千問Qwen在真實市場環(huán)境中力壓群雄,摘得冠軍桂冠。DeepSeek v3.1以微弱差距位居次席,而四款美國頂尖模型均未能實現(xiàn)盈利,其中GPT-5以超過60%的虧損率位列末位。
這場由美國人工智能研究機構nof1.ai發(fā)起的賽事,于10月中旬正式啟動。六組參賽模型包括Qwen3-Max、DeepSeekv3.1、GPT-5、Gemini2.5Pro、ClaudeSonnet4.5和Grok4,每組均獲得等額的1萬美元虛擬資金。在為期數(shù)周的交易周期內(nèi),所有模型完全依靠自主決策完成買賣操作,全程未接受任何人工干預,僅通過實時獲取的金融市場數(shù)據(jù)與價格波動進行判斷。
比賽規(guī)則設計極具挑戰(zhàn)性:模型需在真實市場環(huán)境中同時處理價格波動、風險評估與資金管理等多重任務。這種設置不僅考驗算法的運算能力,更對模型在動態(tài)環(huán)境中的適應性提出嚴苛要求。最終數(shù)據(jù)顯示,僅有兩款中國模型實現(xiàn)資金增值,其余參賽者均出現(xiàn)不同程度虧損,形成鮮明對比。
賽事主辦方透露,此次競賽采用完全透明的評估體系,所有交易記錄與數(shù)據(jù)指標均向公眾開放。參賽模型在處理高頻數(shù)據(jù)時的決策速度、風險控制能力以及長期收益表現(xiàn),成為評判優(yōu)劣的核心標準。這種將AI技術直接置于真實金融場景的測試方式,被業(yè)界視為衡量模型實用價值的重要突破。
技術分析指出,中國模型的突出表現(xiàn)源于其對復雜場景的深度理解能力。相比單純追求參數(shù)規(guī)模或測試分數(shù),實際應用中的環(huán)境適應性、決策穩(wěn)健性以及抗干擾能力,正在成為決定AI競爭力的關鍵因素。此次比賽結(jié)果,為全球AI研發(fā)方向提供了新的參考坐標。
金融科技領域觀察人士認為,這場跨越國界的AI競技,不僅展現(xiàn)了技術實力的地域分布變化,更預示著未來AI競爭將聚焦于解決具體問題的能力。當算法開始直接參與經(jīng)濟活動,其決策邏輯的可靠性、倫理邊界以及社會影響,都將引發(fā)更深層次的討論。











