新智元報道
編輯:定慧 好困
OpenAI的神秘模型o3-alpha意外曝光,其強大的代碼能力碾壓眾多AI。該模型疑似在東京AtCoder世界編程大賽2025中奪得亞軍,最終不敵人類選手Psyho。
OpenAI果然藏了一手。
昨天夜里,一個名為「o3-alpha-responses-2025-07-17」的神秘模型被爆出。
網友們瘋狂測試后,得出一致結論,這個模型強得離譜。
WebDev Arena網頁的源碼
甚至有網友在實測后,大贊o3-alpha,將它稱為目前「最佳編碼和物理模型」。
每次新模型出來后,小球的碰撞實驗已經成為一種「傳統」,這次「o3 Alpha」不僅完美的展示了物理碰撞,并且還能隨時改變小球的大小。
在WebDev Arena上,「o3-alpha-responses-2025-07-17」以「Anonymous-Chatbot」的名稱出現。
根據網友的猜測,它很有可能是在編碼能力上得到了「史詩級」加強的o3升級版。
畢竟目前在WebDev Arena Leaderboard中,OpenAI只有一款專門編程的GPT-4.1-2025-04-14上榜。
不過,目前想要捕捉到這個匿名模型,需要在競技場中多次嘗試(我們在WebDev Arena多次嘗試未能捕捉到這個匿名模型)。
Peter Gostev在競技場中使用如下提示詞「幸運的」捕捉到了o3-alpha,感興趣的話你也可以試試。
還有網友爆出,OpenAI可能「派出」了這個模型去參加世界最難編程競賽:東京舉行的AtCoder世界巡回賽2025決賽。(需要OpenAI確定)
OpenAI的這個o3-alpha模型最終獲得了第二,第一名是人類Psyho。
雖然o3-alpha可能已經被OpenAI下架,但網友們還是保留了豐富的實測案例。
從實測來看,「o3-alpha」在前端代碼能力達到了領先水平——遠勝于Claude Sonnet、o3、Gemini 2.5 Pro。
實測效果驚人
網友Peter Gostev發現該模型后,使用提示詞「要求模型使用Three.js創建一個程序生成的星球」。
測試后,他很難相信,但是依然認為o3-alpha的編碼水平達到一個全新的高度。
以下是完整的測試對比視頻,可以看出o3-alpha的效果整體最好。
OpenAI模型在前端能力方面一直表現平平,Peter表示這次的模型似乎終于在這方面超越了其他所有模型。
有網友用經典的「騎自行車的鵜鶘」進行了測試,表示o3 alpha完全打敗了o3 pro。
以下是o3 alpha生成的動畫版的效果,你覺得這個效果如何。
o3-alpha還能一句話就生成的「我的世界」模擬器。
超mini版GTA的復刻,o3-alpha也能一句話搞定。
還能一鍵生成高度可定制的SVG應用。
有網友用o3-alpha造了一個魔方模擬器,甚至可以輸入「魔方算法」來直接操控,確實太強大了。
僅僅靠著文字提示就可以實現。
網友還用o3-alpha創建了一個太空入侵模擬游戲,再次體現了OpenAI這個新模型的前端代碼能力。
網友Mahi用只有2-3個單詞的提示對比了o3-alpha和Gemini 2.5 Pro。
o3-alpha生成的網頁效果要好于Gemini 2.5 Pro。
除了以上神秘的o3-alpha模型和OpenAI派出AI選手參與頂尖編程大賽外。
剛剛發布的ChatGPT Agent也實力驚人。
OpenAI的研究院Zhiqing Sun,表示ChatGPT Agent通過了ARC-AGI-3的第一關。
41歲大神擊敗AI
守住人類最后防線
o3-alpha被爆出的時機非常的「巧合」。
因為前兩天在東京舉行的AtCoder世界巡回賽2025決賽中,同樣是OpenAI的一款匿名模型,獲得了第二名。
根據網友爆料,這個模型很大概率就是o3-alpha。
我們推測OpenAI本來應該是打算「一鳴驚人」,但有一個名叫Psyho的人類戲劇性的打敗了AI獲得了第一名。
是的,這位來自波蘭的編程大神——Przemys?aw D?biak(aka Psyho),用一場驚心動魄的勝利告訴世界:人類,還沒輸!
地點是東京,AtCoder世界編程大賽的決賽現場。
空氣中彌漫著緊張的氣息,因為這次的對手非同尋常——一個由OpenAI親自下場派出的AI模型。
在這里,人類和AI選手需要在10小時內,不斷優化墻壁的設置以及機器人的分組,讓它們能夠在30x30的網格內以最少的步數回家。
從華沙一路飛到東京的「Psyho」,本來就已經身心俱疲。
而這場堪稱馬拉松的比賽,更是讓他愈發感覺自己已經瀕臨極限。
「我累到爆炸,真的,有好幾次我都想直接放棄算了,」他回憶道。
三天里,「Psyho」只睡了10個小時。
而他的對手,那個「不知疲倦」的AI,早已能夠在諸如算法實現、代碼優化等純粹的工程任務中,憑借著更快地速度碾壓人類。
不過,這次的比賽,是人類的主場。
原因在于,比賽時間越長,就越考驗從零到一的創造性,AI就會越吃力。
比賽一開始,AI很快就以絕對優勢實現領先;
直到第7小時,一步步穩扎穩打的大神「Psyho」才實現反超,而AI卻陷入了困境;
第8小時,AI突然發現了一個全新的思路,并一舉超越了「Psyho」——新方法不僅實現了更好的墻體設計,還帶來了更好的資源調度;
即將進入倒計時階段,劇情再次反轉。「Psyho」靈感乍現,對AI完成了絕地反殺!雖然AI還在不斷調整,但差距卻越來越大。
最終,這個41歲的男人,成功在長達10小時鏖戰的最后關頭,憑借著血肉之軀和人類獨有的創造力,戰勝了冰冷的機器!
對于這場勝利,奧特曼親自發文祝賀道:「干得好,Psyho。」
與此同時,OpenAI官方也發文表示:「我們的模型拿了第二。恭喜冠軍,這次你成功地阻擊了我們!」
更有趣的是,比賽的組織者都驚呆了。
他們坦言:「我們本來就覺得人類會贏,但說實話,我們被AI能拿到第二名給嚇到了!」
他們一針見血地指出:「在代碼優化的硬實力上,AI已經超越了人類,但它唯獨缺少了人類那神來之筆的創造力。」
沒錯!「Psyho」贏得不靠蠻力,而是靠一個「完全不同的解題思路」。
當所有人都和AI在同一條賽道上狂奔時,他另辟蹊徑,找到了AI視野之外的「最優解」。
而他用的武器也很簡單,就是最常規的編程軟件,連AI輔助工具都沒用。
當然,這只是一場戰役的勝利,遠非「人·機」大戰的結束。
從IBM「深藍」到谷歌「AlphaGo」,AI戰勝人類的傳奇早已上演。奧特曼也預言,AI很快就會在編程競賽中全面超越人類。
但至少在東京的那個不眠之夜,一位名叫「Psyho」的孤膽英雄,為人類贏得了一絲喘息。
參考資料:
https://x.com/chetaslua/status/1946154816691966227
https://x.com/chetaslua/status/1946165458048291091