DeepSeek 公司在 Hugging Face 開發者平臺上發布了其 R1 推理 AI 模型的最新版本,這一消息周三早晨首先通過其官方微信公眾號揭曉。據 DeepSeek 透露,此次更新的 R1 版本采用了寬松的 MIT 許可證,允許商業應用,但更新內容被描述為“小幅改進”。在 Hugging Face 的模型庫中,新版本并未附帶詳細介紹,僅提供了必要的配置文件和模型權重。
這款更新后的 R1 模型擁有驚人的 6850 億參數,規模之大使得普通消費者級硬件難以直接運行。如此龐大的模型體量,無疑為 AI 技術的應用設立了新的門檻。
早前,DeepSeek 因推出 R1 模型而迅速走紅,該模型在性能上表現出色,一度能與 OpenAI 的產品相媲美。此次更新,盡管幅度不大,但依舊引起了業界的廣泛關注。