滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 信息流 > 正文內(nèi)容

代碼碾壓一切！OpenAI神秘模型o3-alpha一夜刷屏

時(shí)間：2025-07-19 16:39:02 來源：新智元編輯：快訊團(tuán)隊(duì) IP：北京 發(fā)表評(píng)論無障礙通道

編輯：定慧好困

OpenAI的神秘模型o3-alpha意外曝光，其強(qiáng)大的代碼能力碾壓眾多AI。該模型疑似在東京AtCoder世界編程大賽2025中奪得亞軍，最終不敵人類選手Psyho。

OpenAI果然藏了一手。

昨天夜里，一個(gè)名為「o3-alpha-responses-2025-07-17」的神秘模型被爆出。

網(wǎng)友們瘋狂測(cè)試后，得出一致結(jié)論，這個(gè)模型強(qiáng)得離譜。

WebDev Arena網(wǎng)頁的源碼

甚至有網(wǎng)友在實(shí)測(cè)后，大贊o3-alpha，將它稱為目前「最佳編碼和物理模型」。

每次新模型出來后，小球的碰撞實(shí)驗(yàn)已經(jīng)成為一種「?jìng)鹘y(tǒng)」，這次「o3 Alpha」不僅完美的展示了物理碰撞，并且還能隨時(shí)改變小球的大小。

在WebDev Arena上，「o3-alpha-responses-2025-07-17」以「Anonymous-Chatbot」的名稱出現(xiàn)。

根據(jù)網(wǎng)友的猜測(cè)，它很有可能是在編碼能力上得到了「史詩級(jí)」加強(qiáng)的o3升級(jí)版。

畢竟目前在WebDev Arena Leaderboard中，OpenAI只有一款專門編程的GPT-4.1-2025-04-14上榜。

不過，目前想要捕捉到這個(gè)匿名模型，需要在競(jìng)技場(chǎng)中多次嘗試（我們?cè)赪ebDev Arena多次嘗試未能捕捉到這個(gè)匿名模型）。

Peter Gostev在競(jìng)技場(chǎng)中使用如下提示詞「幸運(yùn)的」捕捉到了o3-alpha，感興趣的話你也可以試試。

還有網(wǎng)友爆出，OpenAI可能「派出」了這個(gè)模型去參加世界最難編程競(jìng)賽：東京舉行的AtCoder世界巡回賽2025決賽。（需要OpenAI確定）

OpenAI的這個(gè)o3-alpha模型最終獲得了第二，第一名是人類Psyho。

雖然o3-alpha可能已經(jīng)被OpenAI下架，但網(wǎng)友們還是保留了豐富的實(shí)測(cè)案例。

從實(shí)測(cè)來看，「o3-alpha」在前端代碼能力達(dá)到了領(lǐng)先水平——遠(yuǎn)勝于Claude Sonnet、o3、Gemini 2.5 Pro。

實(shí)測(cè)效果驚人

網(wǎng)友Peter Gostev發(fā)現(xiàn)該模型后，使用提示詞「要求模型使用Three.js創(chuàng)建一個(gè)程序生成的星球」。

測(cè)試后，他很難相信，但是依然認(rèn)為o3-alpha的編碼水平達(dá)到一個(gè)全新的高度。

以下是完整的測(cè)試對(duì)比視頻，可以看出o3-alpha的效果整體最好。

自動(dòng)播放

OpenAI模型在前端能力方面一直表現(xiàn)平平，Peter表示這次的模型似乎終于在這方面超越了其他所有模型。

有網(wǎng)友用經(jīng)典的「騎自行車的鵜鶘」進(jìn)行了測(cè)試，表示o3 alpha完全打敗了o3 pro。

以下是o3 alpha生成的動(dòng)畫版的效果，你覺得這個(gè)效果如何。

o3-alpha還能一句話就生成的「我的世界」模擬器。

超mini版GTA的復(fù)刻，o3-alpha也能一句話搞定。

自動(dòng)播放

還能一鍵生成高度可定制的SVG應(yīng)用。

有網(wǎng)友用o3-alpha造了一個(gè)魔方模擬器，甚至可以輸入「魔方算法」來直接操控，確實(shí)太強(qiáng)大了。

自動(dòng)播放

僅僅靠著文字提示就可以實(shí)現(xiàn)。

網(wǎng)友還用o3-alpha創(chuàng)建了一個(gè)太空入侵模擬游戲，再次體現(xiàn)了OpenAI這個(gè)新模型的前端代碼能力。

自動(dòng)播放

網(wǎng)友Mahi用只有2-3個(gè)單詞的提示對(duì)比了o3-alpha和Gemini 2.5 Pro。

o3-alpha生成的網(wǎng)頁效果要好于Gemini 2.5 Pro。

除了以上神秘的o3-alpha模型和OpenAI派出AI選手參與頂尖編程大賽外。

剛剛發(fā)布的ChatGPT Agent也實(shí)力驚人。

OpenAI的研究院Zhiqing Sun，表示ChatGPT Agent通過了ARC-AGI-3的第一關(guān)。

41歲大神擊敗AI

守住人類最后防線

o3-alpha被爆出的時(shí)機(jī)非常的「巧合」。

因?yàn)榍皟商煸跂|京舉行的AtCoder世界巡回賽2025決賽中，同樣是OpenAI的一款匿名模型，獲得了第二名。

根據(jù)網(wǎng)友爆料，這個(gè)模型很大概率就是o3-alpha。

我們推測(cè)OpenAI本來應(yīng)該是打算「一鳴驚人」，但有一個(gè)名叫Psyho的人類戲劇性的打敗了AI獲得了第一名。

是的，這位來自波蘭的編程大神——Przemys?aw D?biak（aka Psyho），用一場(chǎng)驚心動(dòng)魄的勝利告訴世界：人類，還沒輸！

地點(diǎn)是東京，AtCoder世界編程大賽的決賽現(xiàn)場(chǎng)。

空氣中彌漫著緊張的氣息，因?yàn)檫@次的對(duì)手非同尋?！粋€(gè)由OpenAI親自下場(chǎng)派出的AI模型。

在這里，人類和AI選手需要在10小時(shí)內(nèi)，不斷優(yōu)化墻壁的設(shè)置以及機(jī)器人的分組，讓它們能夠在30x30的網(wǎng)格內(nèi)以最少的步數(shù)回家。

從華沙一路飛到東京的「Psyho」，本來就已經(jīng)身心俱疲。

而這場(chǎng)堪稱馬拉松的比賽，更是讓他愈發(fā)感覺自己已經(jīng)瀕臨極限。

「我累到爆炸，真的，有好幾次我都想直接放棄算了，」他回憶道。

三天里，「Psyho」只睡了10個(gè)小時(shí)。

而他的對(duì)手，那個(gè)「不知疲倦」的AI，早已能夠在諸如算法實(shí)現(xiàn)、代碼優(yōu)化等純粹的工程任務(wù)中，憑借著更快地速度碾壓人類。

不過，這次的比賽，是人類的主場(chǎng)。

原因在于，比賽時(shí)間越長(zhǎng)，就越考驗(yàn)從零到一的創(chuàng)造性，AI就會(huì)越吃力。

比賽一開始，AI很快就以絕對(duì)優(yōu)勢(shì)實(shí)現(xiàn)領(lǐng)先；

直到第7小時(shí)，一步步穩(wěn)扎穩(wěn)打的大神「Psyho」才實(shí)現(xiàn)反超，而AI卻陷入了困境；

第8小時(shí)，AI突然發(fā)現(xiàn)了一個(gè)全新的思路，并一舉超越了「Psyho」——新方法不僅實(shí)現(xiàn)了更好的墻體設(shè)計(jì)，還帶來了更好的資源調(diào)度；

即將進(jìn)入倒計(jì)時(shí)階段，劇情再次反轉(zhuǎn)?！窹syho」靈感乍現(xiàn)，對(duì)AI完成了絕地反殺！雖然AI還在不斷調(diào)整，但差距卻越來越大。

最終，這個(gè)41歲的男人，成功在長(zhǎng)達(dá)10小時(shí)鏖戰(zhàn)的最后關(guān)頭，憑借著血肉之軀和人類獨(dú)有的創(chuàng)造力，戰(zhàn)勝了冰冷的機(jī)器！

對(duì)于這場(chǎng)勝利，奧特曼親自發(fā)文祝賀道：「干得好，Psyho?！?/p>

與此同時(shí)，OpenAI官方也發(fā)文表示：「我們的模型拿了第二。恭喜冠軍，這次你成功地阻擊了我們！」

更有趣的是，比賽的組織者都驚呆了。

他們坦言：「我們本來就覺得人類會(huì)贏，但說實(shí)話，我們被AI能拿到第二名給嚇到了！」

他們一針見血地指出：「在代碼優(yōu)化的硬實(shí)力上，AI已經(jīng)超越了人類，但它唯獨(dú)缺少了人類那神來之筆的創(chuàng)造力?！?/p>

沒錯(cuò)！「Psyho」贏得不靠蠻力，而是靠一個(gè)「完全不同的解題思路」。

當(dāng)所有人都和AI在同一條賽道上狂奔時(shí)，他另辟蹊徑，找到了AI視野之外的「最優(yōu)解」。

而他用的武器也很簡(jiǎn)單，就是最常規(guī)的編程軟件，連AI輔助工具都沒用。

當(dāng)然，這只是一場(chǎng)戰(zhàn)役的勝利，遠(yuǎn)非「人·機(jī)」大戰(zhàn)的結(jié)束。

從IBM「深藍(lán)」到谷歌「AlphaGo」，AI戰(zhàn)勝人類的傳奇早已上演。奧特曼也預(yù)言，AI很快就會(huì)在編程競(jìng)賽中全面超越人類。

但至少在東京的那個(gè)不眠之夜，一位名叫「Psyho」的孤膽英雄，為人類贏得了一絲喘息。

參考資料：

https://x.com/chetaslua/status/1946154816691966227

https://x.com/chetaslua/status/1946165458048291091

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

更多>同類資訊

柯達(dá)逆襲：CEO康坦扎如何重塑品牌

07-19

經(jīng)濟(jì)學(xué)家：AI投資崩盤隱憂，泡沫遠(yuǎn)超“互聯(lián)網(wǎng)泡沫”

07-19

捷豹路虎攬勝純電車型推遲發(fā)布，爭(zhēng)取時(shí)間等待回暖

07-19

比亞迪方程豹鈦7混動(dòng)SUV四季度上市，純電續(xù)航達(dá)180km

07-19

MiniMax M1全球技術(shù)閉門會(huì)：RL、長(zhǎng)上下文的下一步

07-19

遼寧移動(dòng)與華為聯(lián)手，智能基站實(shí)時(shí)調(diào)波，運(yùn)維效率飆升30倍

07-19

iPhone 17系列顏色陣容曝光：基礎(chǔ)款新增鋼灰，色彩更淡雅

07-19

鉑爵旅拍業(yè)務(wù)停擺：給員工放“淡季假”，消費(fèi)者表示售后失聯(lián)

07-19

豪車稅新規(guī)倒計(jì)時(shí)：保時(shí)捷掀搶購潮，銷售稱晚買兩天貴十幾萬\n

07-19

茅臺(tái)擬推進(jìn)省級(jí)經(jīng)銷商聯(lián)營(yíng)公司，入股參考額度飛天茅臺(tái)每噸30萬元

07-19

哈弗大狗2026款升級(jí)上市限時(shí)權(quán)益價(jià)9.89萬起

07-19

現(xiàn)代Ioniq 6：電動(dòng)轎車新勢(shì)力，性能與設(shè)計(jì)雙破局

07-19

預(yù)售價(jià)35萬起，靜態(tài)體驗(yàn)理想i8，選它還是懸樂道L90？

07-19

外觀內(nèi)飾大煥新，這車招人喜歡，空間還是這么局促

07-19

東風(fēng)小康V27改趣玩床車，自駕游新選擇

07-19

點(diǎn)擊查看更多 +

全站最新

網(wǎng)購輪胎真相：從踩坑到真香，我的兩次親身經(jīng)歷告訴你

7萬公里家用車保養(yǎng)指南：這六大零件關(guān)乎安全，及時(shí)更換不容忽視！

寧德時(shí)代“超級(jí)電池”續(xù)航破2000km，耐寒零下35℃，充電基建成關(guān)鍵

五菱星光560來襲：硬派造型，5/7座任選，三動(dòng)力齊發(fā)，中型SUV新選擇

大眾途岳新銳版降價(jià)風(fēng)暴：8萬起售，油耗低動(dòng)力足，月銷破萬成新寵

北斗導(dǎo)航助力滄縣鑫翰合作社：無人駕駛除草機(jī)精準(zhǔn)作業(yè)不傷苗

熱門內(nèi)容

本欄最新

MiniMax M1全球技術(shù)閉門會(huì)：RL、長(zhǎng)上下文的下一步

哈弗大狗2026款升級(jí)上市限時(shí)權(quán)益價(jià)9.89萬起

現(xiàn)代Ioniq 6：電動(dòng)轎車新勢(shì)力，性能與設(shè)計(jì)雙破局

預(yù)售價(jià)35萬起，靜態(tài)體驗(yàn)理想i8，選它還是懸樂道L90？

外觀內(nèi)飾大煥新，這車招人喜歡，空間還是這么局促

東風(fēng)小康V27改趣玩床車，自駕游新選擇

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

代碼碾壓一切！OpenAI神秘模型o3-alpha一夜刷屏

日本精品一区二区三区高清久久

代碼碾壓一切！OpenAI神秘模型o3-alpha一夜刷屏