在AI領域,一款名為DeepSeek R1的大模型在問世僅128天后,便迅速在業界掀起了波瀾。這款模型以其獨特的策略,對整個大模型市場產生了深遠的影響。
DeepSeek R1的推出,首先在大模型價格方面帶來了顯著變化。據悉,OpenAI在六月更新的o3價格相較于之前的o1版本,直接打了兩折。這一變化無疑與DeepSeek R1的競爭力息息相關,它憑借強大的性能和相對較低的價格,成功打破了市場的平衡。
與此同時,DeepSeek模型在第三方平臺上的使用量呈現出爆炸式增長。與剛發布時相比,使用量增長了近20倍,這一驚人的增長速度不僅推動了DeepSeek自身的普及,也為眾多云計算廠商帶來了可觀的收益。
然而,令人意外的是,盡管DeepSeek在第三方平臺上大放異彩,但其自家網站和API的市場份額卻并未隨之提升,反而出現了下滑趨勢。這一變化與AI產品市場整體持續增長的趨勢形成了鮮明對比,引發了業界的廣泛關注。
據SemiAnalysis發布的一份報告指出,DeepSeek之所以能夠在價格上占據優勢,很大程度上得益于其在服務質量上所做的妥協。用戶在DeepSeek官方平臺上使用模型時,往往需要等待數秒才能看到第一個字符的出現,這一延遲現象相較于其他平臺顯得尤為明顯。盡管DeepSeek V3與R1模型在版本更新后性能有所提升,但延遲問題并未得到有效解決。
報告還指出,DeepSeek在推理計算資源上進行了精心調配,將有限的資源更多地用于內部研發,而非外部推理服務。這一策略導致DeepSeek在官方平臺上提供的上下文窗口大小相較于其他主流模型提供商顯得較小,無法滿足一些特定場景下的需求。因此,許多用戶轉而選擇第三方平臺,以獲取更大的上下文窗口和更快的響應速度。
盡管DeepSeek在官方平臺上的表現不盡如人意,但其開源策略卻為其贏得了廣泛的影響力和生態培養機會。許多云服務提供商紛紛托管DeepSeek模型,進一步推動了其普及和應用。
在DeepSeek的影響下,其他大模型供應商也開始調整策略。例如,Claude為了緩解算力緊張的問題,降低了輸出速度,但仍努力平衡用戶體驗。Claude模型還被設計成生成更簡潔的回復,以在同等條件下減少token的使用量。
隨著AI競賽的日益激烈,大模型供應商們正在不斷探索新的優化策略。他們不再僅僅追求模型的智能上限,而是更加注重提升每個token所能提供的智能。這一趨勢無疑將推動AI技術的進一步發展,為用戶帶來更加高效、智能的體驗。