在全球人工智能(AI)領域,一場激烈的競爭正在悄然展開。國際數據公司(IDC)預測,到2024年,全球各組織在AI上的投入將達到2350億美元,而到2028年,這一數字將躍升至6300億美元,年復合增長率接近30%。開源大模型,以其開放、透明和可定制的特性,成為推動AI創新的核心動力,讓全球開發者和企業能以前所未有的速度參與到AI的研發和應用中。
在這場AI大戰中,中國的DeepSeek、meta的Llama系列和阿里巴巴的Qwen系列成為了焦點。這三家公司不僅代表了各自國家的技術實力,也展示了AI領域的技術前沿。
DeepSeek,作為中國AI領域的新秀,自2023年成立以來,以驚人的速度迭代模型,不斷刷新技術指標。從2024年1月發布首個通用語言模型DeepSeek LLM,到2025年1月發布性能媲美OpenAI的DeepSeek-R1,DeepSeek在短短一年內實現了全球用戶的爆發式增長,月訪問量從2024年的2140萬次飆升至2025年5月的4.261億次,獨立訪問量也增長了約13倍。其最新模型DeepSeek-V3的總參數達到6710億,訓練成本僅為557.6萬美元,性能在多項評測中超越了競爭對手。
meta的Llama系列自2023年首次亮相以來,就以其開源特性和強大性能吸引了全球關注。從最初的Llama-1到即將發布的Llama-4,meta不斷突破技術瓶頸,拓展應用場景。Llama-2首次實現了免費商用,Llama-3.1則推出了4050億參數的超大型模型,將上下文長度提升至128K tokens。盡管Llama 4 Maverick在性能上逼近DeepSeek V3,但其參數效率更高,僅使用DeepSeek V3約一半的活動參數,總參數量也只有后者的約60%。
阿里巴巴的Qwen系列則依托其強大的生態支持,在國內市場占據了一席之地。從2023年4月上線通義千問,到2025年4月發布Qwen3系列,Qwen不斷迭代模型,拓展應用場景。其命名源自中文“通義千問”,寓意著通過技術回答人類的各種問題。Qwen不僅在大語言模型方面有所建樹,還在多模態模型上進行了積極探索。
在性能對比上,Llama 4 Maverick和DeepSeek V3在ELO評分上表現出色,但DeepSeek V3在性能和成本之間找到了更好的平衡。而在MMUL/s分數上,Llama3-405B、Qwen2-72B和DeepSeek-V2-236B均處于領先地位,顯示出高效的推理能力。Artificial Analysis發布的“AI智能指數”則進一步驗證了這些模型的強大性能,Llama 4系列和DeepSeek V3均取得了顯著進步。
在用戶數據方面,DeepSeek的全球表現尤為亮眼,不僅月訪問量實現了近20倍的驚人增長,還在全球開源大模型市場的應用份額不斷擴大。Llama雖然在下載量和總訪問量上有所增長,但在2025年5月出現了顯著的下行趨勢,市場份額也有所回落。而Qwen則憑借阿里巴巴的生態支持,在國內市場保持了穩定的發展態勢。
在GitHub上的表現上,DeepSeek以78k的星標數遙遙領先,顯示出其在多模態理解領域的廣泛影響力。meta Llama和Qwen雖然在星標數上不及DeepSeek,但它們的項目同樣在各自的領域內具有顯著的影響力。整體來看,這三家公司分別在多模態理解、大語言模型和語言模型領域展現了強大的技術實力和創新能力。
隨著技術的不斷進步,這些開源大模型將持續賦能千行百業,推動AI應用的爆發式增長。然而,在追求技術突破的同時,如何優化模型架構、提升推理效率,并注重用戶隱私和倫理問題,將成為未來AI發展的重要課題。