在科技界的又一次重大突破中,meta公司于深夜震撼發(fā)布了其最新的Llama 4系列開源AI模型,這一系列包括了Llama 4 Scout、Llama 4 Maverick以及尚在訓(xùn)練中的Llama 4 Behemoth。
據(jù)meta官方介紹,這些模型均經(jīng)過海量未標注文本、圖像和視頻數(shù)據(jù)的嚴格訓(xùn)練,旨在賦予它們卓越的視覺理解能力。這一舉措被視為多模態(tài)人工智能創(chuàng)新領(lǐng)域的一個全新里程碑。
“今天,我們迎來了原生多模態(tài)AI的新時代,”meta公司表示,“我們自豪地推出了首批Llama 4模型——Llama 4 Scout和Llama 4 Maverick。這些模型不僅代表了我們的最高技術(shù)水平,也在多模態(tài)領(lǐng)域中樹立了新的標桿。”
具體來看,Llama 4 Scout擁有170億活躍參數(shù),并配備了16個專家系統(tǒng)。其上下文窗口能力行業(yè)領(lǐng)先,能夠處理高達1000萬標記的數(shù)據(jù)。在多項基準測試中,Llama 4 Scout的表現(xiàn)超越了Gemma 3、Gemini 2.0 Flash-Lite和Mistral 3.1等競爭對手。
而Llama 4 Maverick同樣擁有170億活躍參數(shù),但專家系統(tǒng)數(shù)量增加至128個。在圖像定位方面,它展現(xiàn)出了頂尖水平,能夠?qū)⒂脩籼崾九c視覺概念精準對齊,并將模型響應(yīng)定位在圖像的特定區(qū)域。在基準測試中,Llama 4 Maverick的表現(xiàn)優(yōu)于GPT-4o和Gemini 2.0 Flash。在推理和編碼方面,它與DeepSeek v3取得了相當?shù)慕Y(jié)果,但活躍參數(shù)僅為后者的一半。在性價比方面,其聊天版本在LMArena上的ELO得分高達1417。
meta強調(diào),Llama 4 Scout和Llama 4 Maverick之所以能成為迄今為止最好的模型,得益于從Llama 4 Behemoth中進行的知識蒸餾。Llama 4 Behemoth作為meta最強大的模型,目前仍在訓(xùn)練中,但在專注于STEM領(lǐng)域的基準測試中,已經(jīng)展現(xiàn)出了超越GPT-4.5、Claude Sonnet 3.7和Gemini 2.0 Pro的實力。
Llama 4系列模型是meta旗下首批采用混合專家(MoE)架構(gòu)的模型。這種架構(gòu)通過將數(shù)據(jù)處理任務(wù)分解為子任務(wù),并委派給更小的、專門的“專家”模型,從而提高了訓(xùn)練和回答用戶查詢時的效率。
“混合專家架構(gòu)的引入,是我們技術(shù)創(chuàng)新的重要一步,”meta公司表示,“它使我們能夠更高效地處理復(fù)雜的數(shù)據(jù)處理任務(wù),為用戶提供更準確、更快速的AI服務(wù)。”
隨著Llama 4系列的發(fā)布,meta再次展示了其在人工智能領(lǐng)域的領(lǐng)先地位。這一系列模型的推出,不僅將推動多模態(tài)AI技術(shù)的發(fā)展,也將為各行各業(yè)帶來更多的創(chuàng)新和變革。
未來,隨著Llama 4 Behemoth的完成訓(xùn)練以及更多基于混合專家架構(gòu)的模型的推出,meta有望在人工智能領(lǐng)域繼續(xù)引領(lǐng)潮流,為人類社會的發(fā)展貢獻更多的智慧和力量。