12月12日消息,據CNBC報道,OpenAI周四發布了其最先進的人工智能模型 GPT-5.2,并表示這是迄今為止最適合日常專業用途的產品。
OpenAI表示,該模型在創建電子表格、制作演示文稿、感知圖像、編寫代碼和理解長上下文方面均優于以往的模型。從本周四開始,該模型將集成到OpenAI的ChatGPT聊天機器人及其應用程序編程接口(API)中。
OpenAI發布GPT-5.1模型幾周后,其競爭對手Anthropico和谷歌也發布了新模型,促使 OpenAI 宣布啟動“紅色警報”行動,以改進 ChatGPT 并擱置其他項目。
這一切都源于領先科技公司之間一場高風險的競爭,它們都力圖打造應用最廣泛的模型,因為消費者和企業正日益將人工智能融入日常生活和工作流程。OpenAI 寄希望于其 GPT 系列模型來定義未來,該公司也正努力證明其 5000 億美元的估值和超過 1.4 萬億美元的計劃支出是合理的。
OpenAI 應用部門首席執行官菲吉·西莫 (Fidji Simo) 周四在新聞發布會上告訴記者:“我們發布紅色警報,是為了向公司明確表明我們希望將資源集中投入到某個特定領域,這也是一種明確優先級并確定哪些項目可以降低優先級的方式。 我們總體上增加了對 ChatGPT 的資源投入,我認為這有助于該模型的發布,但這并非它特意在本周發布的原因。”
OpenAI首席執行官薩姆·奧特曼周四告訴CNBC,谷歌發布Gemini 3模型對公司指標的影響小于預期。他表示,預計OpenAI將在1月份解除危機預警。
“我認為,當競爭威脅出現時,你應該集中精力,迅速應對。”奧特曼說。
OpenAI表示,GPT-5.2將推出Instant、Thinking和Pro三個版本。Instant版本在寫作和信息檢索方面速度更快,Thinking版本更擅長結構化工作,例如編碼和規劃,而Pro版本則能為難題提供最準確的答案。
該公司表示,該模型在多項行業基準測試中均名列前茅,包括評估智能體編碼性能的 SWE-Bench Pro 和研究生級別科學推理基準測試 GPQA Diamond。該公司還表示,在 OpenAI 今年早些時候發布的評估工具 GDPval 上,GPT-5.2 在 70.9% 的明確定義任務中擊敗或與業內頂尖專家持平。
“這項工作已經籌備了好幾個月了,”西莫說。“雖然我們很自豪能夠快速發布新車型,但這項特定的集成工作確實已經進行了很長時間。”
Anthropic 的最新模型 Opus 4.5 在 SWE-Bench Verified 測試集上的得分高于 GPT-5.2。SWE-Bench Verified 是一個評估人工智能系統軟件編碼能力的測試集。OpenAI 告訴記者,與 SWE-Bench Pro 相比,該基準測試集的“抗污染能力、挑戰性、多樣性和工業相關性”都較差。
OpenAI 成立于 10 年前,最初是一個研究實驗室,但在 2022 年推出 ChatGPT 之后,它已成為世界上增長最快的商業實體之一。現在,每周有超過 8 億人使用其聊天機器人。(鞭牛士、AI普瑞斯編譯)






