近期,人工智能領(lǐng)域迎來(lái)了一項(xiàng)重要進(jìn)展,月之暗面公司正式揭曉了其最新研發(fā)成果——Kimi K2模型。這款模型在代碼編寫及通用Agent任務(wù)處理能力上實(shí)現(xiàn)了顯著提升,并且采用了先進(jìn)的MoE架構(gòu),總參數(shù)規(guī)模高達(dá)1萬(wàn)億,激活參數(shù)為320億。尤為引人注目的是,月之暗面決定將這一技術(shù)瑰寶全面開(kāi)源,以供業(yè)界共享。
然而,隨著Kimi K2模型的廣泛應(yīng)用,部分用戶開(kāi)始反映其API服務(wù)響應(yīng)速度不盡如人意。針對(duì)這一反饋,月之暗面迅速作出回應(yīng),解釋稱服務(wù)延遲主要是由于模型體積龐大加之訪問(wèn)量激增所致。為了盡快改善用戶體驗(yàn),公司正全力投入到推理效率的優(yōu)化工作中,并積極擴(kuò)充計(jì)算卡與服務(wù)器資源,預(yù)計(jì)短期內(nèi)API服務(wù)速度將有明顯好轉(zhuǎn)。
月之暗面還進(jìn)一步強(qiáng)調(diào),Kimi K2模型的開(kāi)源策略意味著用戶擁有更多選擇。除了通過(guò)官方渠道使用外,用戶還可以借助硅基流動(dòng)、無(wú)問(wèn)芯穹等第三方模型供應(yīng)商接入該模型,甚至有能力的用戶可以自行部署。這一開(kāi)放態(tài)度無(wú)疑為Kimi K2模型的應(yīng)用推廣注入了更多活力。
目前,Kimi K2模型的API服務(wù)已全面對(duì)外開(kāi)放,支持最長(zhǎng)可達(dá)128K的上下文處理,展現(xiàn)出強(qiáng)大的通用性和工具調(diào)用能力。在費(fèi)用方面,公司采取了合理的計(jì)費(fèi)標(biāo)準(zhǔn),每百萬(wàn)輸入tokens收費(fèi)4元人民幣,每百萬(wàn)輸出tokens則為16元人民幣。月之暗面表示,將持續(xù)致力于提升服務(wù)質(zhì)量,確保用戶能夠享受到更加高效、穩(wěn)定的使用體驗(yàn)。