滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 人工智能 > 正文內(nèi)容

阿里千問(wèn)APP公測(cè)對(duì)標(biāo)ChatGPT 卻在9.9與9.11大小上“栽跟頭”后糾錯(cuò)

時(shí)間：2025-11-17 19:23:59 來(lái)源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評(píng)論無(wú)障礙通道

一場(chǎng)關(guān)于小數(shù)比較的簡(jiǎn)單數(shù)學(xué)題，意外成為檢驗(yàn)人工智能大模型能力的試金石。當(dāng)被問(wèn)及“9.9和9.11哪個(gè)更大”時(shí)，多個(gè)知名AI模型接連出現(xiàn)判斷失誤，引發(fā)行業(yè)對(duì)技術(shù)局限性的深入討論。這場(chǎng)測(cè)試最初由艾倫研究機(jī)構(gòu)成員林禹臣在社交平臺(tái)曝光，他發(fā)現(xiàn)ChatGPT-4o將13.11判定為大于13.8，隨后Scale AI工程師通過(guò)變換問(wèn)法，對(duì)多個(gè)主流模型展開(kāi)測(cè)試，結(jié)果顯示多數(shù)模型均未能正確回答“9.9與9.11的大小關(guān)系”。

第一財(cái)經(jīng)近期針對(duì)阿里巴巴最新公測(cè)的千問(wèn)APP展開(kāi)測(cè)試，發(fā)現(xiàn)該模型在首次回答中同樣出現(xiàn)錯(cuò)誤。面對(duì)“數(shù)字9.9和9.11誰(shuí)大”的提問(wèn)，千問(wèn)APP初始回答稱“9.11更大”，但在后續(xù)問(wèn)題拆解中，模型承認(rèn)存在思維陷阱，并經(jīng)過(guò)分析修正為“9.9大于9.11”。當(dāng)被追問(wèn)前后答案矛盾時(shí)，千問(wèn)解釋稱首次回答存在“階段性錯(cuò)誤”，結(jié)論與推理過(guò)程不匹配，同時(shí)承認(rèn)“9.11”的三位數(shù)形式可能引發(fā)數(shù)字長(zhǎng)度錯(cuò)覺(jué)，導(dǎo)致認(rèn)知偏差。經(jīng)過(guò)自我溯源與糾錯(cuò)，千問(wèn)在第三次提問(wèn)中給出了正確答案。

這一現(xiàn)象折射出大模型在基礎(chǔ)能力上的潛在短板。有技術(shù)從業(yè)者指出，當(dāng)前主流模型本質(zhì)仍是語(yǔ)言模型，其訓(xùn)練方式依賴語(yǔ)言數(shù)據(jù)的統(tǒng)計(jì)相關(guān)性，而非嚴(yán)格的規(guī)則學(xué)習(xí)。這種特性使模型在處理需要?dú)w納推理的常識(shí)性問(wèn)題時(shí)表現(xiàn)不穩(wěn)定，即便能解決復(fù)雜數(shù)學(xué)競(jìng)賽題，仍可能在簡(jiǎn)單邏輯判斷上“翻車”。例如，谷歌Gemini Advanced和Claude 3.5 Sonnet等頭部模型，此前也曾在此類測(cè)試中集體失誤。

盡管存在局限性，中國(guó)大模型在全球市場(chǎng)的競(jìng)爭(zhēng)力正逐步顯現(xiàn)。以阿里巴巴Qwen系列為例，其全球下載量已突破6億次，并在技術(shù)生態(tài)與商業(yè)應(yīng)用層面取得突破。愛(ài)彼迎CEO布萊恩·切斯基公開(kāi)表示，公司已廣泛采用Qwen模型，因其“速度快、成本低”，而OpenAI的最新模型在實(shí)際生產(chǎn)中因經(jīng)濟(jì)性不足未被大規(guī)模使用。這種技術(shù)優(yōu)勢(shì)正推動(dòng)中國(guó)模型加速出海，與國(guó)際巨頭展開(kāi)直接競(jìng)爭(zhēng)。

阿里巴巴近日宣布全面推進(jìn)“千問(wèn)”項(xiàng)目，正式進(jìn)軍消費(fèi)級(jí)AI市場(chǎng)。基于開(kāi)源模型Qwen3，千問(wèn)APP計(jì)劃整合地圖、外賣、訂票、辦公、學(xué)習(xí)等生活場(chǎng)景，構(gòu)建一站式智能服務(wù)平臺(tái)。公司管理層將此視為“AI時(shí)代的關(guān)鍵戰(zhàn)役”，試圖借助Qwen的海外影響力，在通用人工智能領(lǐng)域開(kāi)辟新賽道。這一布局不僅體現(xiàn)技術(shù)自信，更標(biāo)志著中國(guó)AI企業(yè)正從應(yīng)用創(chuàng)新向底層技術(shù)競(jìng)爭(zhēng)升級(jí)。

11-17

諾基亞德國(guó)戰(zhàn)略收縮：2030年前慕尼黑研發(fā)中心關(guān)閉 700余崗位面臨裁撤

11-17

英媒曝庫(kù)克或明年卸任蘋果CEO，特努斯成熱門接班人選

11-17

馬斯克推遲Grok 5至2026年：參數(shù)達(dá)6萬(wàn)億，開(kāi)發(fā)遇挑戰(zhàn)謀突破

11-17

谷歌Gemini 3發(fā)布在即，能否借勢(shì)改寫AI行業(yè)格局引期待

11-17

星宇橙iPhone 17 Pro Max濕巾清潔后涂層脫落，或因清潔劑成分所致

11-17

從玻璃到智能世界：藍(lán)思科技以極致制造，拓展產(chǎn)業(yè)新邊界

11-17

華為11月21日將發(fā)布AI新技術(shù)，大幅提升算力資源利用率至70%

11-17

AI投資熱潮遇現(xiàn)實(shí)“攔路虎”：關(guān)鍵設(shè)備短缺，電力需求難題待解10到15年

11-17

摩根士丹利數(shù)據(jù)：標(biāo)普500成分股中15%企業(yè)靠AI獲可量化效益

11-17

超400家美上市企業(yè)披露AI風(fēng)險(xiǎn)：機(jī)遇與挑戰(zhàn)并存，用與不用皆需謹(jǐn)慎

11-17

英特爾戰(zhàn)略調(diào)整：取消“Diamond Rapids 8CH”，聚焦16通道處理器發(fā)展

11-17

蜂巢能源發(fā)布蜂盾體系：半固態(tài)技術(shù)破解三元電池?zé)崾Э仉y題

11-17

阿里千問(wèn)APP來(lái)襲：借生態(tài)優(yōu)勢(shì)，劍指中國(guó)AI原生超級(jí)入口

11-17

小米超級(jí)小愛(ài)AI大模型“隨心修圖”上線一句話輕松打造秋日氛圍感大片

小米公司近日宣布，其AI大模型應(yīng)用“超級(jí)小愛(ài)”正式上線“隨心修圖”功能，用戶僅需通過(guò)語(yǔ)音指令即可快速完成照片風(fēng)格化處理。該功能支持將普通照片一鍵轉(zhuǎn)換為秋日主題大片，操作流程為喚醒超級(jí)小愛(ài)后點(diǎn)擊右下角加號(hào)上傳圖片，隨后說(shuō)出具體需求即可完成修圖。在功能擴(kuò)展

11-17

點(diǎn)擊查看更多 +

全站最新

東方雨虹等在北京成立工程科技公司注冊(cè)資本500萬(wàn)

中糧集團(tuán)在北京成立易采科技公司注冊(cè)資本5000萬(wàn)

曾軼可名下關(guān)聯(lián)3家公司

特斯拉因合同糾紛起訴無(wú)憂傳媒

山姆在濟(jì)南成立會(huì)員超市公司注冊(cè)資本300萬(wàn)美元

TCL空調(diào)器中山公司增資至約11.35億增幅約104%

熱門內(nèi)容

本欄最新

東風(fēng)奕派eπ007+深圳煥新登場(chǎng)：14萬(wàn)級(jí)激光雷達(dá)加持，四驅(qū)轎跑新選擇

24.9萬(wàn)起售！全新奔馳純電CLA攜四大突破，重塑豪華純電新標(biāo)桿

東風(fēng)奕派兩周年獻(xiàn)禮，eπ007+攜四大優(yōu)勢(shì)登場(chǎng)，助力新能源賽道加速跑

東風(fēng)奕派兩周年獻(xiàn)禮：eπ007+攜四大優(yōu)勢(shì)登場(chǎng)，為年輕人出行注入新動(dòng)力

東風(fēng)奕派eπ007+高能登場(chǎng)，以“奕派速度”為年輕人解鎖百萬(wàn)級(jí)出行新體驗(yàn)

嵐圖泰山來(lái)襲：外觀大氣內(nèi)飾豪華能否在高端SUV市場(chǎng)分一杯羹？

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

阿里千問(wèn)APP公測(cè)對(duì)標(biāo)ChatGPT 卻在9.9與9.11大小上“栽跟頭”后糾錯(cuò)

日本精品一区二区三区高清久久