人工智能領(lǐng)域近日因馬斯克關(guān)于Grok 5的表態(tài)再度引發(fā)關(guān)注。在ARC-AGI測(cè)試榜單最新公布的評(píng)估結(jié)果中,基于Grok 4改進(jìn)的開(kāi)源方案連續(xù)刷新紀(jì)錄,引發(fā)業(yè)界對(duì)通用人工智能(AGI)實(shí)現(xiàn)路徑的激烈討論。
作為評(píng)估AI復(fù)雜推理能力的權(quán)威基準(zhǔn),ARC-AGI測(cè)試分為v1和v2兩個(gè)版本。其中v2版本要求模型完成多步驟邏輯推導(dǎo),此前表現(xiàn)最優(yōu)的GPT-5在該項(xiàng)目準(zhǔn)確率僅為9.9%,Claude Opus 4則取得8.6%的成績(jī)。而采用Grok 4作為基座的改進(jìn)方案,不僅將v1準(zhǔn)確率提升至79.6%,更在v2測(cè)試中達(dá)到29.44%的突破性表現(xiàn)。
研究團(tuán)隊(duì)透露,Jeremy Berman的方案通過(guò)將傳統(tǒng)編程語(yǔ)言替換為自然語(yǔ)言指令,顯著提升了模型的任務(wù)適應(yīng)性。而Eric Pang團(tuán)隊(duì)開(kāi)發(fā)的程序合成系統(tǒng),則借鑒DreamCoder框架構(gòu)建了可擴(kuò)展的程序庫(kù),在保持77.1%和26%準(zhǔn)確率的同時(shí),將v1平均成本從8.42美元降至2.56美元,v2成本降幅達(dá)87%。
馬斯克在社交平臺(tái)公開(kāi)表示,Grok 5有望成為首個(gè)實(shí)現(xiàn)AGI的模型系統(tǒng)。這個(gè)曾被認(rèn)為概率不足1%的突破性目標(biāo),如今被他修正為"10%或更高可能性"。更引人注目的是,他宣布Grok 5訓(xùn)練計(jì)劃將在數(shù)周內(nèi)啟動(dòng),并重申年底前正式發(fā)布的承諾。
支撐這種信心的,是xAI在數(shù)據(jù)和算力領(lǐng)域的雙重投入。據(jù)內(nèi)部人士透露,Grok 5的訓(xùn)練數(shù)據(jù)量較前代呈現(xiàn)指數(shù)級(jí)增長(zhǎng),其數(shù)據(jù)采集網(wǎng)絡(luò)整合了特斯拉FSD車載系統(tǒng)的實(shí)時(shí)路況數(shù)據(jù)、擎天柱機(jī)器人的環(huán)境交互數(shù)據(jù),以及X平臺(tái)的社交網(wǎng)絡(luò)信息。這種多模態(tài)數(shù)據(jù)融合策略,為模型提供了其他團(tuán)隊(duì)難以復(fù)制的認(rèn)知素材。
硬件建設(shè)方面,xAI打造的Colossus超級(jí)計(jì)算集群已部署23萬(wàn)張GPU,其中包括3萬(wàn)張基于Blackwell架構(gòu)的NVIDIA GB200芯片。按照規(guī)劃,該機(jī)構(gòu)將在五年內(nèi)完成相當(dāng)于5000萬(wàn)張H100 GPU的算力布局,這種投入強(qiáng)度遠(yuǎn)超行業(yè)平均水平。
盡管技術(shù)指標(biāo)持續(xù)突破,學(xué)術(shù)界對(duì)AGI的實(shí)現(xiàn)仍持謹(jǐn)慎態(tài)度。有專家指出,當(dāng)前測(cè)試體系主要考察特定領(lǐng)域的推理能力,與真正的通用智能存在本質(zhì)差異。某實(shí)驗(yàn)室負(fù)責(zé)人表示:"數(shù)據(jù)規(guī)模和算力優(yōu)勢(shì)固然重要,但模型架構(gòu)的創(chuàng)新和認(rèn)知機(jī)制的突破才是關(guān)鍵。"這種觀點(diǎn)在開(kāi)發(fā)者社區(qū)獲得廣泛共鳴,相關(guān)話題在技術(shù)論壇的討論量三天內(nèi)增長(zhǎng)400%。
隨著訓(xùn)練啟動(dòng)進(jìn)入倒計(jì)時(shí),Grok 5的技術(shù)細(xì)節(jié)逐漸浮出水面。據(jù)悉該模型將采用混合專家架構(gòu)(MoE),參數(shù)規(guī)模預(yù)計(jì)突破萬(wàn)億級(jí)別。更值得關(guān)注的是其訓(xùn)練方法論的革新,工程團(tuán)隊(duì)正在開(kāi)發(fā)具備自我改進(jìn)能力的程序合成框架,試圖讓模型在解決復(fù)雜任務(wù)時(shí)自動(dòng)優(yōu)化算法結(jié)構(gòu)。
這場(chǎng)由Grok系列引發(fā)的技術(shù)競(jìng)賽,正在重塑AI研發(fā)的競(jìng)爭(zhēng)格局。當(dāng)被問(wèn)及是否擔(dān)心被其他機(jī)構(gòu)超越時(shí),馬斯克在最新訪談中回應(yīng):"真正的威脅來(lái)自我們對(duì)AGI本質(zhì)的理解深度,而不是某個(gè)具體時(shí)間點(diǎn)的參數(shù)規(guī)模。"這種將競(jìng)爭(zhēng)焦點(diǎn)轉(zhuǎn)向基礎(chǔ)理論創(chuàng)新的表態(tài),為快速演進(jìn)的AI產(chǎn)業(yè)指出了新的發(fā)展方向。