滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

阿里千問APP公測遇“小插曲”：9.9與9.11大小之爭下的AI進階路

時間：2025-11-18 15:05:53 來源：快訊編輯：快訊 IP：北京 發表評論無障礙通道

一道看似簡單的數學題——比較9.9和9.11的大小，竟成為檢驗人工智能模型能力的試金石。近日，阿里巴巴最新公測的千問APP在回答這一問題時出現失誤，引發行業對AI技術局限性的討論。該事件不僅暴露了當前大模型在基礎運算中的潛在漏洞，更折射出AI從實驗室走向實際應用面臨的挑戰。

測試過程中，千問APP首次回答稱"9.11更大"，隨后在問題拆解階段又正確指出"9.9的十分位是9，9.11的十分位是1，因此9.9更大"。面對這種自相矛盾的回應，AI模型解釋稱首次結論屬于"階段性錯誤"，并歸因于"數字長度錯覺"——三位數的9.11在視覺上可能引發認知偏差。經過自我溯源后，該模型在第三次提問中給出了正確答案。

這道經典算術題最早由艾倫研究機構成員林禹臣發現。他在測試ChatGPT-4o時發現，該模型竟認為13.11大于13.8。隨后Scale AI工程師萊利·古德賽德變換問法，向多個主流模型發起挑戰，結果包括ChatGPT-4o、谷歌Gemini Advanced等在內的多個大模型集體"翻車"。這一現象在AI技術圈引發廣泛關注，相關測試截圖在社交平臺獲得數百萬瀏覽量。

行業專家指出，大模型本質上是基于語言數據訓練的統計模型，其核心能力在于捕捉語言模式而非理解數學規則。這種技術路徑導致AI在處理需要嚴格邏輯推理的任務時表現不穩定。某AI技術從業者表示："語言模型擅長處理模糊的自然語言，但面對精確的數學運算時，其統計學習機制反而成為短板。"

盡管存在基礎運算缺陷，中國大模型在全球市場的競爭力不容小覷。以阿里巴巴Qwen系列為例，該模型累計下載量已突破6億次，在技術積累和生態布局方面形成獨特優勢。愛彼迎CEO布萊恩·切斯基公開表示，公司已將Qwen模型深度整合到運營體系，稱贊其"速度快、成本低"。這種實際應用場景的驗證，為中國AI模型提供了差異化競爭路徑。

阿里巴巴日前宣布全面進軍消費級AI市場，計劃將千問APP與地圖、外賣、票務等20余個生活場景深度融合。基于開源模型Qwen3打造的"千問"項目，被管理層定位為"AI時代的戰略級入口"。通過整合海外影響力，阿里巴巴正與OpenAI等國際巨頭展開直接競爭。這種"技術輸出+場景落地"的雙輪驅動模式，或將重塑全球AI產業格局。

值得關注的是，千問APP的此次失誤恰逢其全球推廣關鍵期。測試結果顯示，該模型在復雜場景理解、多模態交互等方面表現突出，但在基礎運算等"簡單任務"上仍需優化。這種"高階能力突出、基礎能力薄弱"的反差現象，為AI技術發展路徑提供了新的研究樣本。如何平衡模型復雜度與可靠性，將成為行業下一階段的重要課題。

更多>同類資訊

智元遠征A2人形機器人11月20日將挑戰跨省行走，劍指吉尼斯世界紀錄

11 月 18 日消息，智元機器人今日宣布，將于 11 月 20 日 18:30全網直播，嘗試全球首次人形機器人跨省行走，從江蘇蘇州金雞湖到上海外灘百公里路程，挑戰吉尼斯世界紀錄。據IT之家此前報道，智元…

11-18

佳都科技攜AI與開源鴻蒙亮相CCF數字交通大會共探智慧交通新路徑

佳都科技集團首席AI科學家王凱博士在大會主論壇上發表了《佳都知行智鏈城市經緯交通佳鴻驅動交通未來》的主題演講，系統展示了佳都科技以AI大模型與交通佳鴻操作系統為雙引擎，為城市綜合立體交通提供的創新解決方案。…

11-18

北京人形機器人創新中心唐劍：具身智能落地瓶頸待破大小腦泛化能力成關鍵

這跟人一樣，從出生或者學校畢業，即便是博士畢業，還是有很多工作你不知道該怎么做，所以機器人必須有自主學習的能力，因為它永遠有一些任務不知道該怎么完成；三是跨本體的泛化操作能力；四是全自主導航能力；五是全鏈路數…

11-18

機器人女仆價格幾何？技術演進與成本博弈，大佬觀點碰撞出未來趨勢

值得注意的是，越疆科技于2025年11月3日發布家庭智能體機器人Rover X1，售價7499元，標志著部分功能簡化產品進入萬元以內價格帶，但這與完整女仆級服務能力的通用人形機器人存在本質差異。風險三為倫理監…

11-18

成都卡諾普遞表港交所：全棧自研破局，技術賦能“中國智造”走向世界

卡諾普是中國先進的工業機器人公司暨具身智能機器人企業。在金屬及機械加工行業及其應用方面，公司在中國企業中居領先地位。據成都市經信局市新經濟委的數據顯示，2024年，成都市人工智能與機器人已聚集超1000家企…

11-18

昆侖萬維Skywork R1V4-Lite登場，開啟輕量多模態智能體新交互篇章

從結果上看，R1V4-Lite在多模態DeepResearch類任務中展現出了領先趨勢：在mm-search上以66分超過Gemini 2.5 Flash的64.9分，在FVQA上以67分顯著領先Gemin…

11-18

廣西南寧啟動“智慧城市”創新賽搭建中國東盟AI合作新橋梁

中新網南寧11月18日電 (王以照黃麗瑩)11月17日，AI(人工智能)賦能千行百業超級聯賽“智慧城市”建設創新應用大賽在廣西南寧啟動。浪潮集團有限公司有關負責人介紹，大賽將有效推動AI技術創新與住建領域…

11-18

2025軟科世界一流學科排名揭曉：中美高校領跑，上海學科建設成果亮眼

2025軟科世界一流學科排名中，中國內地高校在電力電子工程、生物醫學工程、材料科學與工程3個學科首度問鼎世界第一，使得中國內地高校的全球冠軍學科增加到21個。從學科的具體排名來看，上海高校共攬獲4個全球冠…

11-18

嗶哩嗶哩2025Q3財報亮眼：凈利暴增，盈利與用戶增長雙豐收

11-18

OPPO Reno15系列成都亮相：影像實況新玩法，2999元起售再掀熱潮

11-18

蘋果設計團隊再遭打擊 iPhone Air核心設計師跳槽至AI創業公司

11-18

Arm與英偉達強強聯合：Neoverse平臺導入NVLink Fusion 共拓AI新未來

11-18

螞蟻集團發布全模態AI助手“靈光”：30秒生成小應用，多場景靈活交互

螞蟻集團近日正式推出了一款名為“靈光”的全模態通用人工智能助手，這款產品憑借其強大的功能迅速吸引了市場關注。據介紹，“靈光”能夠在移動端實現“自然語言30秒生成小應用”，并且支持用戶對生成內容進行編輯、交互和分享，為用戶提供了更加靈活便捷的智能服務體驗

11-18

GSMA大中華區總裁斯寒：2030年部分地區率先部署6G，2040年連接數或超50億

11-18

千問App公測，阿里在C端AI賽道開啟生態躍遷新征程

11-18

點擊查看更多 +

全站最新

安徽海螺新興產業股權投資基金登記成立出資額10億

三只羊因專利權糾紛被起訴

蘭新鐵路甘青公司增資至約813.8億增幅約6.5%

俞敏洪名下關聯近百家企業

洲明科技、智譜AI等成立智顯機器人公司注冊資本5000萬

哪吒汽車張勇等被執行36.5萬

熱門內容

本欄最新

東風奕派eπ007+深圳煥新登場：14萬級激光雷達加持，四驅轎跑新選擇

24.9萬起售！全新奔馳純電CLA攜四大突破，重塑豪華純電新標桿

東風奕派兩周年獻禮，eπ007+攜四大優勢登場，助力新能源賽道加速跑

東風奕派兩周年獻禮：eπ007+攜四大優勢登場，為年輕人出行注入新動力

東風奕派eπ007+高能登場，以“奕派速度”為年輕人解鎖百萬級出行新體驗

嵐圖泰山來襲：外觀大氣內飾豪華能否在高端SUV市場分一杯羹？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

阿里千問APP公測遇“小插曲”：9.9與9.11大小之爭下的AI進階路

日本精品一区二区三区高清久久