近期,中國自主研發(fā)的AI模型Kimi K2在全球開源模型領(lǐng)域取得了突破性進(jìn)展,成功超越了先前的領(lǐng)先者DeepSeek,躍居開源模型排行榜首位,并在總排名中占據(jù)第五的位置,緊隨其后的是知名的閉源模型Grok 4。這一成就標(biāo)志著Kimi K2在性能上已逼近國際頂尖水平。
Kimi K2的表現(xiàn)贏得了業(yè)界的廣泛關(guān)注。在短短一周內(nèi),該模型在GitHub上獲得了5600余次點贊,同時在Hugging Face平臺上的下載量也逼近了10萬次大關(guān)。這些數(shù)據(jù)無疑是對Kimi K2實力的有力證明。
值得注意的是,Kimi K2雖基于DeepSeek V3的架構(gòu)進(jìn)行開發(fā),但研發(fā)團(tuán)隊并未止步于此。他們通過一系列精細(xì)的參數(shù)調(diào)整,如增加專家數(shù)量、精簡注意力頭數(shù)、僅保留第一層的Dense層以及取消專家的分組等,成功優(yōu)化了模型的推理方案,使其性能得到了顯著提升。
Perplexity公司的CEO也透露了他們的下一步計劃——基于Kimi K2進(jìn)行后續(xù)訓(xùn)練。這一決定無疑將進(jìn)一步推動Kimi K2性能的提升,并為其在更多應(yīng)用場景中的表現(xiàn)奠定堅實基礎(chǔ)。