日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

新研究:人類讀指針鐘準確率近九成,頂尖AI模型準確率僅一成多

   時間:2025-09-14 18:58:52 來源:IT之家編輯:快訊團隊 IP:北京 發(fā)表評論無障礙通道
 

一項名為“ClockBench”的全新測試揭示,人類在讀取指針式時鐘方面的準確率高達89.1%,而當前最先進的人工智能模型準確率僅為13.3%。這一差距凸顯了AI在視覺推理能力上與人類的顯著差異,尤其是在處理復雜視覺信息時,AI的表現(xiàn)遠未達到預期水平。

該測試由研究者阿萊克·薩法爾設計,旨在通過定制化的指針式時鐘數(shù)據(jù)集,評估AI在視覺推理任務中的表現(xiàn)。測試中,來自6家企業(yè)的11個大型語言模型與5名人類參與者展開對比。數(shù)據(jù)集包含180個獨特的指針式時鐘,涵蓋36種鐘面設計,融合了羅馬數(shù)字與阿拉伯數(shù)字、不同朝向、時針標識、鏡像布局及彩色背景等元素,確保測試的復雜性和多樣性。

每個時鐘需通過四類問題測試:讀取時間、時間計算、按特定角度調整指針及時區(qū)轉換。為保證公平性,數(shù)據(jù)集從零構建,避免與模型訓練數(shù)據(jù)重疊。測試結果顯示,AI模型在讀取時間時的中位誤差達1小時,而人類的中位誤差僅為3分鐘。性能最差的AI模型誤差甚至接近3小時,幾乎與隨機猜測無異。

在參與測試的AI模型中,谷歌旗下的Gemini 2.5 Pro以13.3%的準確率位居榜首,Gemini 2.5 Flash和GPT-5分別以10.5%和8.4%的準確率緊隨其后。然而,Grok 4模型的表現(xiàn)令人意外,其準確率僅0.7%,且將63.3%的時鐘判定為“無效”,遠高于實際無效時鐘的比例(180個中僅37個)。這種過度謹慎的策略雖在技術上增加了正確答案數(shù)量,但并未真正提升模型能力。

測試還發(fā)現(xiàn),鐘面特征對AI判斷影響顯著。當鐘面采用羅馬數(shù)字時,AI準確率驟降至3.2%;采用圓形數(shù)字時,準確率也僅為4.5%。秒針、彩色背景及鏡像布局均會干擾AI的判斷。相比之下,僅含時針的時鐘(準確率23.6%)和采用阿拉伯數(shù)字的標準時鐘,能讓AI取得相對更好的成績。

一個意外發(fā)現(xiàn)是,AI模型在成功讀取時間后,能正確完成時間計算、指針調整或時區(qū)轉換任務。這表明,AI的挑戰(zhàn)并非在于時間相關的數(shù)學運算,而在于從視覺信息中提取時間的初始步驟。薩法爾分析,原因可能包括:指針式時鐘讀取對視覺推理能力要求極高;罕見或特殊的鐘面設計在訓練數(shù)據(jù)中極少出現(xiàn);以及將視覺信息轉化為文字描述對當前AI模型而言難度較大。

ClockBench被定位為長期基準測試,其完整數(shù)據(jù)集目前保密,以避免污染未來AI的訓練過程,但已有一個公開版本供測試使用。盡管AI在該測試中得分普遍較低,薩法爾認為,性能最佳的模型已展現(xiàn)出基礎的視覺推理能力,優(yōu)于隨機猜測。然而,這些能力能否通過擴大現(xiàn)有方法規(guī)模提升,還是需要全新技術路徑突破,仍是一個待解的問題。

此前,中國一項研究也曾發(fā)現(xiàn)多模態(tài)語言模型存在類似短板,但當時GPT-4o模型在包含“讀時鐘、讀儀表”的任務中準確率達54.8%。此次ClockBench測試中,AI最高準確率僅為13.3%,既表明新基準測試難度顯著提升,也反映出AI在時鐘讀取能力上并未取得明顯進步。

 
 
更多>同類資訊
全站最新
熱門內容
網(wǎng)站首頁  |  關于我們  |  聯(lián)系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
日本精品一区二区三区高清 久久
欧美日韩国产成人精品| 久久成人一区| 亚洲字幕一区二区| 欧美视频一区在线观看| 亚洲午夜在线观看视频在线| 国产精品第13页| 久久精品国产999大香线蕉| 亚洲福利在线看| 欧美视频中文字幕| 亚洲国产精品黑人久久久| 欧美成人午夜免费视在线看片| 欧美在线视频不卡| 亚洲人成网站在线观看播放| 欧美日韩一区二区三区| 欧美在线免费播放| 亚洲久久在线| 国产一区二区三区在线观看视频 | 国产在线日韩| 免费不卡亚洲欧美| 亚洲美女淫视频| 国产午夜精品视频| 99精品久久久| 一区二区91| 国产一区视频观看| 欧美日韩亚洲一区二区三区在线| 午夜精品久久久久久久久久久久久| 国模精品一区二区三区| 欧美日韩中文| 开心色5月久久精品| 欧美午夜精品理论片a级大开眼界 欧美午夜精品理论片a级按摩 | 欧美日韩激情网| 欧美影院午夜播放| 亚洲人体1000| 雨宫琴音一区二区在线| 国产精品视频在线观看| 午夜精品久久久久久久久久久久久 | 国产情人节一区| 精品成人一区二区三区| 欧美成人精品在线视频| 欧美高清视频| 欧美精品国产一区二区| 久久视频国产精品免费视频在线| 亚洲色在线视频| 亚洲娇小video精品| 国产午夜精品在线| 欧美日韩精品中文字幕| 麻豆国产va免费精品高清在线| 亚洲成人自拍视频| 99精品免费网| 亚洲欧美在线另类| 欧美福利视频| 久久久999| 午夜宅男欧美| 午夜欧美大尺度福利影院在线看| 一区二区高清在线观看| 亚洲三级视频在线观看| 国产精品色婷婷久久58| 伊人婷婷欧美激情| 国产亚洲精品久久久久婷婷瑜伽| 欧美色视频一区| 欧美日本高清视频| 欧美岛国在线观看| 欧美精品入口| 欧美日韩在线免费| 欧美视频在线观看一区| 亚洲人人精品| 欧美久久在线| 亚洲免费观看高清在线观看| 亚洲国产一区二区三区青草影视| 亚洲精选一区二区| 欧美特黄一区| 欧美激情精品久久久久久蜜臀| 一区二区三区四区国产精品| 亚洲大胆视频| 影音先锋在线一区| 亚洲第一精品夜夜躁人人躁 | 一区二区在线免费观看| 国产亚洲成av人片在线观看桃| 一区二区三区你懂的| 欧美黄色网络| 乱人伦精品视频在线观看| 久久久综合香蕉尹人综合网| 黄色日韩网站视频| 欧美日韩三区四区| 亚洲婷婷国产精品电影人久久| 亚洲影视在线播放| 久久精品国产99国产精品澳门| 久久综合久久美利坚合众国| 欧美成人乱码一区二区三区| 欧美性做爰毛片| 亚洲另类自拍| 午夜久久tv| 亚洲人成啪啪网站| 伊人久久久大香线蕉综合直播| 99国产麻豆精品| 亚洲综合久久久久| 久久亚洲影院| 国产精品毛片一区二区三区| 国产一区二区三区久久久| 在线观看中文字幕亚洲| 亚洲高清久久久| 激情综合久久| 中日韩高清电影网| 美女福利精品视频| 国产精品久久久久久久久久久久| 国产欧美日韩视频一区二区三区| 亚洲国产精品传媒在线观看 | 国产一区二区在线免费观看| 国产有码在线一区二区视频| 亚洲成人在线网| 在线午夜精品自拍| 久久综合电影| 亚洲精品永久免费| 欧美日韩国产成人高清视频| 国产一区二区三区的电影| 欧美日韩亚洲一区| 韩国美女久久| 亚洲先锋成人| 欧美理论在线| 在线观看亚洲视频| 裸体一区二区| 亚洲高清在线精品| 亚洲一区二区综合| 久久婷婷av| 国产精品高清网站| 亚洲第一福利在线观看| 欧美亚洲综合另类| 欧美激情一区二区三区不卡| 麻豆免费精品视频| 欧美精品一区二区三区高清aⅴ| 国产主播精品在线| 亚洲图色在线| 欧美三级欧美一级| 亚洲精品免费一区二区三区| 免费观看久久久4p| 国产欧美va欧美不卡在线| 国产精品永久免费观看| 午夜精品久久久久影视 | 国产亚洲毛片| 欧美大胆成人| 欧美日韩大片| 欧美一区二区三区日韩| 免费欧美在线视频| 久久久久久亚洲综合影院红桃| 欧美日韩国产综合视频在线观看| 欧美成人一区在线| 伊人久久大香线蕉综合热线 | 欧美激情一区在线观看| 亚洲少妇中出一区| 亚洲高清123| 亚洲人成小说网站色在线| 亚洲国产精品999| 亚洲激情小视频| 在线日本成人| 国产精品亚发布| 国产精品一区二区男女羞羞无遮挡 | 欧美日韩精选| 欧美激情精品久久久久| 国产精品va在线播放我和闺蜜| 国产精品综合网站| 国产精品免费小视频| 欧美视频手机在线| 久久精品国产亚洲一区二区三区| 亚洲欧美一区二区视频| 麻豆精品在线观看| 中文国产亚洲喷潮| 亚洲欧美日韩精品综合在线观看| 亚洲欧美bt| 国产伦精品一区二区三区视频孕妇| 欧美国产日本在线| 久久久久久久久久看片| 午夜国产精品视频| 亚洲色图制服丝袜| 一本色道久久88精品综合| 亚洲精品小视频| 国产精品久久毛片a| 欧美精品高清视频| 久久久久久9| 亚洲欧美福利一区二区| 日韩天堂av| 亚洲国产天堂久久综合| 久久久久久久一区二区| 亚洲激情六月丁香| 亚洲国产欧美国产综合一区| 国产精品成人一区二区网站软件| 国产精品少妇自拍| 国产欧美日韩麻豆91| 亚洲欧美日韩精品久久奇米色影视| 欧美一区二区福利在线| 亚洲午夜一区| 久久av在线| 欧美激情一区二区三区在线视频观看| 亚洲一区二区三区在线观看视频| 亚洲国产精品v| 麻豆精品国产91久久久久久| 久久性天堂网| 久久精品国产第一区二区三区| 午夜免费久久久久| 欧美在线网站| 久久综合伊人77777|