滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

Llama 4 作弊風波：20萬顯卡集群訓練的超級大模型真的不行嗎？

時間：2025-04-23 12:40:19 來源：ITBEAR編輯：快訊團隊 發表評論無障礙通道

近日，meta公司震撼發布了其最新研發的Llama 4系列大模型，包括Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth三款產品，這一消息迅速在人工智能領域掀起了波瀾。據meta透露，這些模型經過海量未標注文本、圖像及視頻數據的訓練，視覺理解能力實現了質的飛躍，仿佛在大模型領域獨領風騷。

meta GenAI部門負責人Ahmad Al-Dahle自信地表示，他們的開放系統將能夠產出最優的小型、中型以及前沿大模型，并附上了一張Llama 4的性能對比測試圖。在這張圖表中，Llama 4 Maverick的排名迅速攀升至第二位，成為第四個突破1400分的大模型，并在開放模型排行榜上超越了DeepSeek，坐上了頭把交椅。

然而，就在Llama 4系列備受贊譽之際，一些細心的網友卻發現了一些問題。他們通過讓模型直接生成幾何程序的方式對Llama 4進行測試，結果卻發現，在繪制包含受重力影響球的六角形集合圖像時，Llama 4連續8次嘗試均告失敗，而DeepSeek R1和Gemini 2.5 Pro則一次成功。這一發現引發了網友們的廣泛討論和質疑。

不少網友對Llama 4的表現感到失望，認為新版本模型在性能上并未取得顯著突破，反而在某些測試中表現不如現有大模型。甚至有網友將Llama 4系列的能力與其他模型進行了對比，認為Llama 4 Maverick的402B大模型與Qwen QwQ 32B的寫代碼水平相當，而Llama 4 Scout則接近于Grok2或文心4.5的水平。

隨著網友們的深入測試，更多關于Llama 4的問題逐漸浮出水面。有網友發現，在官方數據中表現卓越的Llama 4，在實際測試中卻頻頻失利。這引發了網友們對meta是否存在刷榜行為的懷疑。經過多方證實，網友們發現，在Ahmad Al-Dahle發布的Llama性能對比測試圖的最下方，有一行小字注明“Llama 4 Maverick針對對話進行了優化”，而meta早已為自己留下了“圖片僅供參考”的余地。

網友們紛紛帶著Llama 4參與各大測試榜單，結果在code測試榜單Aider ployglot中，Llama 4的得分甚至低于qwen-32B。在另一個代碼評測榜單中，Llama 4的成績也只能排在中間位置。在EQBench測評基準的長文章寫作榜上，Llama 4系列更是直接墊底。即便是最基礎的翻譯任務，Llama 4的表現也不盡如人意，甚至不如Gemma 3的27B模型。

更令人震驚的是，一則發布在海外求職平臺的信息透露，Llama 4的訓練存在嚴重問題，內部模型的表現遠未達到開源SOTA水平，而Llama 4的高分很可能是領導層為了交差而做出的“努力”。這一爆料很可能來自meta公司內部，進一步加劇了網友們的質疑。

此次Llama 4的翻車事件不僅讓網友們對meta的技術實力產生了懷疑，更讓meta失去了社區的信任和支持。在人工智能領域，技術創新和誠信是至關重要的。meta如果想要在激烈的市場競爭中站穩腳跟，就必須摒棄急功近利的心態，專注于技術創新和用戶體驗的提升。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

AI應用火爆下載，我國人工智能企業數量突破424.3萬家大關

04-29

AI智商測試熱潮下，我國人工智能企業數量突破424.3萬大關

04-29

訊飛星火X1深度推理大模型實測：小參數大智慧，國產AI新突破！

04-29

ChatGPT漏洞曝光：未成年賬戶竟能生成色情內容，OpenAI緊急修復

04-29

ChatGPT搜索添網購新功能，對話即享個性化購物體驗！

04-29

多鄰國邁向AI優先模式，將逐步用AI替代合同工，員工工作將如何變化？

04-29

2025研學教育創新發展論壇聚焦AI研學，亮點紛呈

4月25日上午,2025研學教育創新發展論壇在天津大學-盈趣科技產教融合聯合培養基地舉辦。本次論壇聚焦研學政策風向標拆解等核心議題,通過前沿案例+資源精準對接,為研學創新提供思維碰撞平臺,共建中國研學教育創新生態圈。致辭環節盈趣科技CEO楊明出席并致辭:我們相聚在此

04-29

阿里云Qwen3重磅發布：8款混合推理模型全面開源，性能卓越引關注！

04-29

阿里千問3開源：小體積大智慧，4張H20滿血部署

04-29

阿里通義千問Qwen3發布：混合推理模型，靈活切換思考模式

04-29

Qwen3重磅發布：雙思考模式切換，大型語言模型推理能力再升級！

04-29

OpenAI新動向：ChatGPT將添購物功能，用戶可查詢信息后跳轉商家網站

據報道，OpenAI當地時間4月28日宣布將在其人工智能聊天助手ChatGPT中測試推出購物功能，用戶將能夠通過ChatGPT查詢購物信息，ChatGPT將根據查詢結果生成產品卡。購物者將不在ChatGPT內…

04-29

《尼爾》創意總監預測：AI未來或致游戲開發者崗位消失？

04-28

iQOO Z10 Turbo系列震撼發布：續航屏幕全面升級，僅售1799元起！

04-28

IBM五年豪擲1500億美元，力推美國經濟增長與量子計算機本土制造

04-28

點擊查看更多 +

全站最新

江淮汽車智能新能源雙星閃耀，DEFINE系列引領未來出行新風尚

別克全新高端新能源MPV“世家”亮相，豪華體驗再升級！

歐拉戰略轉向：深耕小型純電市場，復古美學新車亮相上海車展

吉利銀河戰艦首發，以安全為核心，開啟智能電動新篇章！

COMPUTEX 2025科技盛宴：高通、聯發科等巨頭高管共話AI未來

48V技術：從“過渡”到“核心”，上海車展見證智能汽車新基石崛起

熱門內容

本欄最新

AI應用火爆下載，我國人工智能企業數量突破424.3萬家大關

AI智商測試熱潮下，我國人工智能企業數量突破424.3萬大關

訊飛星火X1深度推理大模型實測：小參數大智慧，國產AI新突破！

2025研學教育創新發展論壇聚焦AI研學，亮點紛呈

阿里千問3開源：小體積大智慧，4張H20滿血部署

阿里通義千問Qwen3發布：混合推理模型，靈活切換思考模式

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

Llama 4 作弊風波：20萬顯卡集群訓練的超級大模型真的不行嗎？

日本精品一区二区三区高清久久