編輯:定慧 好困
OpenAI的神秘模型o3-alpha意外曝光,其強(qiáng)大的代碼能力碾壓眾多AI。該模型疑似在東京AtCoder世界編程大賽2025中奪得亞軍,最終不敵人類選手Psyho。
OpenAI果然藏了一手。
昨天夜里,一個(gè)名為「o3-alpha-responses-2025-07-17」的神秘模型被爆出。
網(wǎng)友們瘋狂測(cè)試后,得出一致結(jié)論,這個(gè)模型強(qiáng)得離譜。
WebDev Arena網(wǎng)頁的源碼
甚至有網(wǎng)友在實(shí)測(cè)后,大贊o3-alpha,將它稱為目前「最佳編碼和物理模型」。
每次新模型出來后,小球的碰撞實(shí)驗(yàn)已經(jīng)成為一種「?jìng)鹘y(tǒng)」,這次「o3 Alpha」不僅完美的展示了物理碰撞,并且還能隨時(shí)改變小球的大小。
在WebDev Arena上,「o3-alpha-responses-2025-07-17」以「Anonymous-Chatbot」的名稱出現(xiàn)。
根據(jù)網(wǎng)友的猜測(cè),它很有可能是在編碼能力上得到了「史詩級(jí)」加強(qiáng)的o3升級(jí)版。
畢竟目前在WebDev Arena Leaderboard中,OpenAI只有一款專門編程的GPT-4.1-2025-04-14上榜。
不過,目前想要捕捉到這個(gè)匿名模型,需要在競(jìng)技場(chǎng)中多次嘗試(我們?cè)赪ebDev Arena多次嘗試未能捕捉到這個(gè)匿名模型)。
Peter Gostev在競(jìng)技場(chǎng)中使用如下提示詞「幸運(yùn)的」捕捉到了o3-alpha,感興趣的話你也可以試試。
還有網(wǎng)友爆出,OpenAI可能「派出」了這個(gè)模型去參加世界最難編程競(jìng)賽:東京舉行的AtCoder世界巡回賽2025決賽。(需要OpenAI確定)
OpenAI的這個(gè)o3-alpha模型最終獲得了第二,第一名是人類Psyho。
雖然o3-alpha可能已經(jīng)被OpenAI下架,但網(wǎng)友們還是保留了豐富的實(shí)測(cè)案例。
從實(shí)測(cè)來看,「o3-alpha」在前端代碼能力達(dá)到了領(lǐng)先水平——遠(yuǎn)勝于Claude Sonnet、o3、Gemini 2.5 Pro。
實(shí)測(cè)效果驚人
網(wǎng)友Peter Gostev發(fā)現(xiàn)該模型后,使用提示詞「要求模型使用Three.js創(chuàng)建一個(gè)程序生成的星球」。
測(cè)試后,他很難相信,但是依然認(rèn)為o3-alpha的編碼水平達(dá)到一個(gè)全新的高度。
以下是完整的測(cè)試對(duì)比視頻,可以看出o3-alpha的效果整體最好。
自動(dòng)播放OpenAI模型在前端能力方面一直表現(xiàn)平平,Peter表示這次的模型似乎終于在這方面超越了其他所有模型。
有網(wǎng)友用經(jīng)典的「騎自行車的鵜鶘」進(jìn)行了測(cè)試,表示o3 alpha完全打敗了o3 pro。
以下是o3 alpha生成的動(dòng)畫版的效果,你覺得這個(gè)效果如何。
o3-alpha還能一句話就生成的「我的世界」模擬器。
超mini版GTA的復(fù)刻,o3-alpha也能一句話搞定。
自動(dòng)播放還能一鍵生成高度可定制的SVG應(yīng)用。
有網(wǎng)友用o3-alpha造了一個(gè)魔方模擬器,甚至可以輸入「魔方算法」來直接操控,確實(shí)太強(qiáng)大了。
自動(dòng)播放僅僅靠著文字提示就可以實(shí)現(xiàn)。
網(wǎng)友還用o3-alpha創(chuàng)建了一個(gè)太空入侵模擬游戲,再次體現(xiàn)了OpenAI這個(gè)新模型的前端代碼能力。
自動(dòng)播放網(wǎng)友Mahi用只有2-3個(gè)單詞的提示對(duì)比了o3-alpha和Gemini 2.5 Pro。
o3-alpha生成的網(wǎng)頁效果要好于Gemini 2.5 Pro。
除了以上神秘的o3-alpha模型和OpenAI派出AI選手參與頂尖編程大賽外。
剛剛發(fā)布的ChatGPT Agent也實(shí)力驚人。
OpenAI的研究院Zhiqing Sun,表示ChatGPT Agent通過了ARC-AGI-3的第一關(guān)。
41歲大神擊敗AI
守住人類最后防線
o3-alpha被爆出的時(shí)機(jī)非常的「巧合」。
因?yàn)榍皟商煸跂|京舉行的AtCoder世界巡回賽2025決賽中,同樣是OpenAI的一款匿名模型,獲得了第二名。
根據(jù)網(wǎng)友爆料,這個(gè)模型很大概率就是o3-alpha。
我們推測(cè)OpenAI本來應(yīng)該是打算「一鳴驚人」,但有一個(gè)名叫Psyho的人類戲劇性的打敗了AI獲得了第一名。
是的,這位來自波蘭的編程大神——Przemys?aw D?biak(aka Psyho),用一場(chǎng)驚心動(dòng)魄的勝利告訴世界:人類,還沒輸!
地點(diǎn)是東京,AtCoder世界編程大賽的決賽現(xiàn)場(chǎng)。
空氣中彌漫著緊張的氣息,因?yàn)檫@次的對(duì)手非同尋?!粋€(gè)由OpenAI親自下場(chǎng)派出的AI模型。
在這里,人類和AI選手需要在10小時(shí)內(nèi),不斷優(yōu)化墻壁的設(shè)置以及機(jī)器人的分組,讓它們能夠在30x30的網(wǎng)格內(nèi)以最少的步數(shù)回家。
從華沙一路飛到東京的「Psyho」,本來就已經(jīng)身心俱疲。
而這場(chǎng)堪稱馬拉松的比賽,更是讓他愈發(fā)感覺自己已經(jīng)瀕臨極限。
「我累到爆炸,真的,有好幾次我都想直接放棄算了,」他回憶道。
三天里,「Psyho」只睡了10個(gè)小時(shí)。
而他的對(duì)手,那個(gè)「不知疲倦」的AI,早已能夠在諸如算法實(shí)現(xiàn)、代碼優(yōu)化等純粹的工程任務(wù)中,憑借著更快地速度碾壓人類。
不過,這次的比賽,是人類的主場(chǎng)。
原因在于,比賽時(shí)間越長(zhǎng),就越考驗(yàn)從零到一的創(chuàng)造性,AI就會(huì)越吃力。
比賽一開始,AI很快就以絕對(duì)優(yōu)勢(shì)實(shí)現(xiàn)領(lǐng)先;
直到第7小時(shí),一步步穩(wěn)扎穩(wěn)打的大神「Psyho」才實(shí)現(xiàn)反超,而AI卻陷入了困境;
第8小時(shí),AI突然發(fā)現(xiàn)了一個(gè)全新的思路,并一舉超越了「Psyho」——新方法不僅實(shí)現(xiàn)了更好的墻體設(shè)計(jì),還帶來了更好的資源調(diào)度;
即將進(jìn)入倒計(jì)時(shí)階段,劇情再次反轉(zhuǎn)?!窹syho」靈感乍現(xiàn),對(duì)AI完成了絕地反殺!雖然AI還在不斷調(diào)整,但差距卻越來越大。
最終,這個(gè)41歲的男人,成功在長(zhǎng)達(dá)10小時(shí)鏖戰(zhàn)的最后關(guān)頭,憑借著血肉之軀和人類獨(dú)有的創(chuàng)造力,戰(zhàn)勝了冰冷的機(jī)器!
對(duì)于這場(chǎng)勝利,奧特曼親自發(fā)文祝賀道:「干得好,Psyho?!?/p>
與此同時(shí),OpenAI官方也發(fā)文表示:「我們的模型拿了第二。恭喜冠軍,這次你成功地阻擊了我們!」
更有趣的是,比賽的組織者都驚呆了。
他們坦言:「我們本來就覺得人類會(huì)贏,但說實(shí)話,我們被AI能拿到第二名給嚇到了!」
他們一針見血地指出:「在代碼優(yōu)化的硬實(shí)力上,AI已經(jīng)超越了人類,但它唯獨(dú)缺少了人類那神來之筆的創(chuàng)造力?!?/p>
沒錯(cuò)!「Psyho」贏得不靠蠻力,而是靠一個(gè)「完全不同的解題思路」。
當(dāng)所有人都和AI在同一條賽道上狂奔時(shí),他另辟蹊徑,找到了AI視野之外的「最優(yōu)解」。
而他用的武器也很簡(jiǎn)單,就是最常規(guī)的編程軟件,連AI輔助工具都沒用。
當(dāng)然,這只是一場(chǎng)戰(zhàn)役的勝利,遠(yuǎn)非「人·機(jī)」大戰(zhàn)的結(jié)束。
從IBM「深藍(lán)」到谷歌「AlphaGo」,AI戰(zhàn)勝人類的傳奇早已上演。奧特曼也預(yù)言,AI很快就會(huì)在編程競(jìng)賽中全面超越人類。
但至少在東京的那個(gè)不眠之夜,一位名叫「Psyho」的孤膽英雄,為人類贏得了一絲喘息。
參考資料:
https://x.com/chetaslua/status/1946154816691966227
https://x.com/chetaslua/status/1946165458048291091