滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 信息流 > 正文內(nèi)容

GPT-5.1更新測(cè)評(píng)：指令遵循“掉鏈子”，情感回應(yīng)“沒(méi)溫度”，OpenAI新招能否破局？

時(shí)間：2025-11-14 07:12:07 來(lái)源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評(píng)論無(wú)障礙通道

深夜時(shí)分，OpenAI首席執(zhí)行官又一次在社交平臺(tái)為新產(chǎn)品造勢(shì)。與以往強(qiáng)調(diào)技術(shù)參數(shù)不同，這次宣傳重點(diǎn)轉(zhuǎn)向用戶反饋，直言正在針對(duì)產(chǎn)品短板進(jìn)行優(yōu)化。這種轉(zhuǎn)變背后，是GPT-5系列推出后遭遇的尷尬處境——本應(yīng)被替代的前代產(chǎn)品4o，因用戶粘性過(guò)高被迫延長(zhǎng)服務(wù)周期。

當(dāng)測(cè)試者將官方展示的指令遵循案例投入實(shí)測(cè)時(shí)，新版本立即暴露出問(wèn)題。要求輸出六個(gè)漢字的測(cè)試中，系統(tǒng)連續(xù)給出五個(gè)字符的答案，即便切換英文提示詞仍出現(xiàn)同樣偏差。更令人困惑的是，在限制使用特定漢字的文本生成測(cè)試?yán)铮到y(tǒng)持續(xù)輸出繁體字內(nèi)容，直到取消限制才恢復(fù)正常。作為對(duì)比，競(jìng)品模型在相同測(cè)試中表現(xiàn)穩(wěn)定。

情感交互能力的升級(jí)承諾同樣遭遇質(zhì)疑。官方宣稱新版本"更具溫度與對(duì)話感"，但實(shí)際測(cè)試顯示，當(dāng)用戶詢問(wèn)情感問(wèn)題時(shí)，新舊版本的回應(yīng)存在明顯代差。前代產(chǎn)品會(huì)通過(guò)共情表達(dá)和鼓勵(lì)性語(yǔ)言建立情感連接，而新版本更傾向于給出分析性解答，被測(cè)試者形容為"像在查閱心理學(xué)教材"。這種差異在二次測(cè)試中進(jìn)一步放大，新版本甚至省略了基礎(chǔ)的情感回應(yīng)。

自適應(yīng)計(jì)算優(yōu)化成為為數(shù)不多的亮點(diǎn)。傳統(tǒng)AI模型在處理不同難度問(wèn)題時(shí)，消耗的計(jì)算資源缺乏彈性，新引入的動(dòng)態(tài)調(diào)整機(jī)制使簡(jiǎn)單問(wèn)題的響應(yīng)速度提升40%。在編程類復(fù)雜問(wèn)題測(cè)試中，雖然舊版本更快給出答案，但經(jīng)核查發(fā)現(xiàn)其結(jié)果存在錯(cuò)誤，而新版本通過(guò)延長(zhǎng)思考時(shí)間給出了正確解法。這項(xiàng)改進(jìn)對(duì)API調(diào)用用戶具有實(shí)際價(jià)值，可在保證質(zhì)量的前提下降低計(jì)算成本。

個(gè)性化功能更新帶來(lái)意外收獲。系統(tǒng)新增的七種角色設(shè)定中，"吐槽達(dá)人"模式引發(fā)關(guān)注。該模式下AI會(huì)主動(dòng)質(zhì)疑不合理的指令，對(duì)PUA式提問(wèn)表現(xiàn)出明顯抵觸。測(cè)試顯示，當(dāng)要求AI無(wú)償完成復(fù)雜任務(wù)時(shí)，該模式會(huì)直接指出指令的不合理性，這種反套路表現(xiàn)顛覆了傳統(tǒng)AI的順從形象。不過(guò)角色切換時(shí)的語(yǔ)境銜接仍顯生硬，需要用戶適應(yīng)其獨(dú)特的表達(dá)方式。

市場(chǎng)數(shù)據(jù)印證著產(chǎn)品面臨的挑戰(zhàn)。第三方機(jī)構(gòu)統(tǒng)計(jì)顯示，該系列市場(chǎng)占有率持續(xù)下滑，用戶使用時(shí)長(zhǎng)被多個(gè)新興模型分流。曾經(jīng)依賴的技術(shù)先發(fā)優(yōu)勢(shì)正在減弱，部分用戶開(kāi)始將日常查詢轉(zhuǎn)向其他平臺(tái)。這種轉(zhuǎn)變?cè)陂_(kāi)發(fā)者社區(qū)尤為明顯，代碼生成等核心場(chǎng)景的遷移速度超出預(yù)期。

11-14

美國(guó)藍(lán)色起源“新格倫”火箭二度發(fā)射，攜NASA火星探測(cè)器成功升空

11-14

中國(guó)科研影響力七年躍升，中科院三連冠領(lǐng)跑全球科研機(jī)構(gòu)榜單

11-14

“新格倫”火箭二次發(fā)射成功搭載火星探測(cè)器并首實(shí)現(xiàn)第一級(jí)海上回收

11-14

美國(guó)藍(lán)色起源公司“新格倫”火箭二次發(fā)射成功實(shí)現(xiàn)第一級(jí)及助推器回收

11-14

Cursor獲23億美元融資，年化收入破10億，AI編程工具成資本新寵

11-14

鎧俠2025財(cái)年Q2營(yíng)收達(dá)4483.46億日元，環(huán)比增30.8%，Q3業(yè)績(jī)預(yù)期創(chuàng)新高

11-14

?華為攜手瑞星發(fā)布DCS AI安全方案，提供全鏈路保障助力企業(yè)智能防御升級(jí)?

11-14

中國(guó)6G發(fā)展進(jìn)入關(guān)鍵階段：完成首階段試驗(yàn)，300余項(xiàng)關(guān)鍵技術(shù)儲(chǔ)備成型

11-14

光伏支架設(shè)計(jì)鋪設(shè)難題怎么破？鷓鴣云模擬設(shè)計(jì)平臺(tái)提供高效路徑

設(shè)計(jì)完成后，通過(guò)支架清單功能，能自動(dòng)生成立柱、檁條、斜梁、斜撐等構(gòu)件的規(guī)格與長(zhǎng)度明細(xì)，為物料統(tǒng)計(jì)、成本核算提供精準(zhǔn)依據(jù)，省去人工統(tǒng)計(jì)的繁瑣與誤差。借助鷓鴣云模擬設(shè)計(jì)平臺(tái)的這些功能，光伏支架設(shè)計(jì)鋪設(shè)流程得以大…

11-14

中通快遞旺季“黑科技”發(fā)力：近3000臺(tái)無(wú)人車馳援，降本增效成果顯著

11-14

130光年外紅矮星現(xiàn)日冕物質(zhì)拋射助解系外行星宜居謎題

11-14

英特爾Nova Lake架構(gòu)CPU將攜AVX10.2與APX指令集回歸寬向量支持

11-14

我國(guó)6G技術(shù)試驗(yàn)首階段圓滿完成，300余項(xiàng)關(guān)鍵技術(shù)儲(chǔ)備助力“萬(wàn)物智聯(lián)”

11-14

CERN地下實(shí)驗(yàn)“重現(xiàn)”宇宙奇景，為星際磁場(chǎng)存在提供關(guān)鍵證據(jù)

11-14

點(diǎn)擊查看更多 +

全站最新

小米YU7獲國(guó)際壓鑄大賽最佳結(jié)構(gòu)獎(jiǎng)，一體化設(shè)計(jì)或開(kāi)啟電動(dòng)車結(jié)構(gòu)革新之路

拼多多2025Q2：營(yíng)收增速放緩、現(xiàn)金流收縮，高增長(zhǎng)后迎深水區(qū)挑戰(zhàn)

石頭科技11月13日股價(jià)微漲主力資金凈流入微弱游資散戶資金流向分化

從衛(wèi)浴跨界到銅藝龍頭，雷軍“粉絲”攜銅質(zhì)文創(chuàng)沖刺港交所IPO

央視“第一發(fā)布”迎車企首秀長(zhǎng)安馬自達(dá)EZ-60憑實(shí)力獲全球好車認(rèn)證

從“順風(fēng)耳”至“人造太陽(yáng)”：合肥科創(chuàng)之旅，千年神話逐夢(mèng)成真

熱門內(nèi)容

本欄最新

全新坦克400多版本上市，潮酷設(shè)計(jì)引都市青年追捧，開(kāi)啟多元越野生活

全新坦克400正式登場(chǎng)，24.98萬(wàn)起售，四款動(dòng)力滿足多元需求！

起亞Telluride測(cè)試車披"藝術(shù)偽裝"亮相，創(chuàng)意彩蛋致敬命名地

30萬(wàn)級(jí)6座SUV新角逐：2026款騰勢(shì)N8L與理想L8，誰(shuí)更合家庭心意？

遠(yuǎn)程湘潭基地智能制造賦能超級(jí)VAN，推動(dòng)新能源商用車產(chǎn)業(yè)高質(zhì)量發(fā)展

每日一書

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

GPT-5.1更新測(cè)評(píng)：指令遵循“掉鏈子”，情感回應(yīng)“沒(méi)溫度”，OpenAI新招能否破局？

日本精品一区二区三区高清久久