在AI大模型市場的風起云涌中,DeepSeek R1的橫空出世無疑成為了一顆震撼彈,僅僅128天的時間,便深刻改變了行業的格局。
DeepSeek R1的問世,如同一把利劍,直接刺破了推理模型價格的高墻。OpenAI在六月更新的o3價格,相較于之前的o1,價格直接打了二折,這無疑為整個市場樹立了新的價格標桿。
與此同時,第三方平臺上DeepSeek模型的使用量呈現爆炸式增長,與剛發布時相比,增長了近20倍,這一趨勢不僅推動了AI技術的普及,更為眾多云計算廠商帶來了前所未有的商業機遇。
然而,令人意外的是,盡管DeepSeek模型在第三方平臺上大放異彩,但其自家的網站和API市場份額卻出現了下滑,似乎未能跟上AI產品上半年持續增長的步伐。
據SemiAnalysis發布的一篇深度報告揭示,DeepSeek之所以能夠迅速降低推理模型的價格,背后是其對服務質量的妥協。用戶在使用DeepSeek官方平臺時,往往需要等待數秒才能看到第一個字符的出現,這一首token延遲的問題,成為了制約其用戶體驗的關鍵因素。
相比之下,雖然其他平臺的價格普遍更高,但其在響應速度上的優勢卻顯而易見。例如,在Parasail或Friendli等平臺,用戶只需支付3-4美元,便可享受到幾乎零延遲的100萬token服務。而微軟Azure平臺,盡管價格是DeepSeek官方的2.5倍,但其延遲卻減少了整整25秒。
DeepSeek在價格與性能之間的權衡也顯而易見。在有限的推理計算資源下,DeepSeek只提供了64k的上下文窗口服務,這在主流模型提供商中堪稱最小之一。對于需要讀取整個代碼庫的編程場景而言,64k的上下文窗口顯然不夠用,因此用戶更傾向于選擇第三方平臺。
值得注意的是,DeepSeek的這些降本策略并非偶然,而是其主動做出的決定。DeepSeek目前似乎并不太關注用戶體驗,也無意通過聊天應用或API服務向用戶提供大量token,而是將更多的算力資源投入到內部研發中,以實現其AGI的宏偉目標。
DeepSeek的這一策略,不僅降低了推理服務的成本,還通過開源策略吸引了其他云服務托管其模型,從而贏得了更廣泛的影響力并培養了生態。然而,這也使得DeepSeek在用戶體驗上有所欠缺,尤其是在響應速度和上下文窗口大小等方面。
在DeepSeek的影響下,其他大模型供應商也開始調整策略。例如,Claude為了緩解算力緊張的問題,降低了輸出速度,但仍然在努力平衡用戶體驗。而Claude模型的設計也更加注重生成簡潔的回復,以減少token的使用量。
這些跡象表明,大模型供應商正在從多個維度改進模型,不僅追求模型的智能上限,更注重提升每個token所能提供的智能。這一趨勢無疑將推動AI技術的進一步發展,為用戶帶來更加高效、智能的服務。