在人工智能領域,一場靜水深流的大模型競賽正在激烈上演。盡管AI應用遍地開花,但基礎大模型的戰場非但沒有平息,反而愈發白熱化。
據統計,自2025年初以來,中國的主要大模型參與者如百度、字節、阿里、DeepSeek以及被譽為“六小虎”的其他團隊,已經推出了超過45款基礎大模型,平均不到四天就有一款新模型問世。這一速度遠超外界預期,顯示出行業競爭的激烈程度。
在這場競賽中,國內大模型公司的第一梯隊正逐步逼近海外頂尖陣營的格局。海外以OpenAI、Google、Anthropic、X.AI和meta組成的“五強”為標桿,國內則形成了由阿里、字節、DeepSeek、階躍星辰和智譜構成的“3+2”組合,被譽為國內的“新基模五強”。
上半年,這五家公司共發布了32個大模型,其中阿里和階躍星辰尤為突出,分別發布了9款和11款模型,占據了發布總數的半壁江山。這些公司的競爭不僅體現在數量上,更在于模型的質量和創新性。
從行業趨勢來看,開源、推理和多模態成為關鍵詞。阿里作為開源的積極倡導者,自2023年起就將旗下多款模型發布在開源社區,成為多個領域的開源SOTA提供者。其混合推理模型Qwen3更是以低成本高性能成為全球最強的開源模型之一。
DeepSeek則以推理大模型著稱,其發布的DeepSeek R1在性能和成本上均表現出色,成為后續推理大模型的標桿。該公司專注于推理領域,不做大模型矩陣,以專才身份在競爭中脫穎而出。
多模態大模型則是今年大模型公司的研發重點。階躍星辰被譽為“多模態卷王”,其發布的多模態模型數量高達16個,其中包括全球范圍內參數量最大、性能最好的開源視頻生成大模型Step-Video-T2V。字節也在多模態領域表現出色,其文生圖模型Seedream 3.0在畫質、生成效率以及商業化應用能力上均有顯著提升。
盡管大語言模型已經取得了顯著進展,但多模態大模型的發展仍然面臨挑戰。行業內缺少多模態領域的理解生成一體化架構,導致多模態模型的理解和生成仍然由不同的模型完成。然而,這并不意味著多模態領域沒有機會,相反,它仍然有可能迎來下一個爆款模型。
在AI應用落地如火如荼的今天,繼續押注基礎大模型的價值仍然不容忽視。DeepSeek的發布無疑給行業注入了新的活力,證明了模型能力提升帶來的技術紅利。為了保持競爭力,大廠和創業公司都在積極搶錢、搶人才。
算力、人才和資金是衡量大模型公司實力的三個硬指標。大廠在資金上相對充沛,而創業公司則需要通過融資來支撐前期的研發。智譜和階躍星辰作為被國資看好的企業,能夠在寒冬期持續獲得資本青睞,為它們的發展提供了有力保障。
在人才方面,“基模五強”正在展現對人才的虹吸效應。以字節為例,該公司近年來挖走了多位海內外研發骨干,為團隊注入了新鮮血液。這些公司在資金和人才的堆積下,逐漸建立了各自的優勢。
商業化方面,開源和垂類場景應用成為大模型公司的兩個關鍵方向。開源的中國大模型已經在全球占據了重要地位,在開源社區HuggingFace上,前30的熱門模型中有12個來自中國公司。開源之后,大模型公司可以嘗試多種商業化手段,如調用API付費、提供GPU服務以及定制化調整和技術服務等。
垂類場景應用方面,智能體(Agent)成為熱門方向。智能體在政企、金融、醫療等領域無處不在,與智能終端的結合更是成為關鍵落地方向。長城汽車CTO吳會肖表示,汽車等高價值軟硬件系統與用戶密切聯系,成為理想的AI載體。同樣,手機、具身智能等產品也成為智能體的重要應用場景。
階躍星辰和智譜等大模型公司紛紛瞄準智能終端賽道,推出了能夠在手機端運行的智能體以及Agent在汽車、手機、具身智能、IoT等領域的應用。這些合作不僅提升了智能終端產品的賣點,也為企業帶來了可觀的收入。