在人工智能領域,商湯科技這家成立僅十年的公司,正以其獨特的視角和技術實力,在大模型競賽中嶄露頭角。過去,商湯以計算機視覺技術見長,與當前以自然語言處理為主的大模型浪潮看似格格不入。然而,隨著DeepSeek R1的發布,這一格局被徹底打破。
DeepSeek R1的出現,不僅讓語言大模型的競爭更加激烈,也讓商湯的技術實力得到了前所未有的展現。在ChatGPT之后,各大語言模型廠商紛紛投入巨資研發GPT-4的升級版,但DeepSeek R1的橫空出世,幾乎抹平了這些努力帶來的差距。面對這一挑戰,行業內的玩家面臨兩個選擇:要么緊跟DeepSeek的步伐,繼續提升語言大模型的性能,要么尋找差異化的競爭點。
值得注意的是,商湯并沒有局限于語言大模型的競爭。根據權威研究機構EPOCH AI的調查,用于訓練大語言模型的文本數據正在迅速接近危機點,預計到2028年,語言大模型的訓練數據集將耗盡互聯網的所有可用文本數量。與此同時,語言大模型也呈現出性能隨參數規模加大而提升的邊際效益遞減趨勢。因此,商湯將目光投向了多模態大模型,這一被視為邁向通用人工智能(AGI)的關鍵一步。
經過兩年的努力,商湯成功推出了新一代6000億參數的多模態大模型“日日新 Sense Nova V6”。這款模型在多模態綜合能力上,不僅與GPT-4.5和Gemini 2.0 Pro相當,甚至在某些方面略有超越。更重要的是,商湯還引入了長思維鏈技術,將多模態與深度思考相結合,為模型增添了更強的推理能力。
商湯在多模態大模型領域的突破,并非一蹴而就。從2024年年中開始,商湯就開始探索原生融合的多模態大模型,并在今年1月10日,即DeepSeek R1發布并爆火前,就已經登上了SuperCLUE和OpenCompass兩大權威榜單榜首,成為大語言與多模態能力的“雙冠王”。這一成就,無疑證明了商湯在大模型領域的深厚底蘊和創新能力。
商湯的技術優勢不僅體現在多模態大模型上,還體現在其大裝置與商業積累的緊密協同上。商湯的大裝置在算力上領先行業至少3年,為大模型的訓練提供了強有力的支持。同時,商湯在過去十年中積累的商業化實戰經驗,也為其在大模型市場的競爭中提供了獨特的優勢。這使得商湯在推出日日新V6后,能夠迅速將其應用于各行各業,推動AI技術的落地和應用。
在日日新V6的推動下,商湯的多模態大模型已經能夠在數學解題、點讀翻譯、文旅講解、繪本講解等日常高頻需求的響應中,取得相較于以往多模態模型更出色的性能表現。同時,商湯還與傅利葉等機器人廠商合作,探索了V6與終端結合的可能性,為具身智能的發展提供了新的思路。
商湯在辦公領域也取得了顯著的進展。其小浣熊系列產品,借助V6的多模態深度思考與推理能力,實現了任務規劃、數據分析、文檔編輯等能力的大幅提升。這不僅提升了辦公效率,還為AI技術在辦公領域的應用提供了新的可能。
在商業化方面,商湯的表現同樣亮眼。根據2024年的財報,商湯生成式AI的業務收入達到24億元,在總收入中的占比高達63.7%,同比漲幅超過100%。這一成績,不僅證明了商湯在大模型領域的商業潛力,也為其未來的發展奠定了堅實的基礎。
商湯并沒有局限于To C市場的競爭,而是更加注重To B市場的拓展。從構建人工智能時代的“終局思維”來看,推動更多行業、更多需求轉向“AI-Native”對商湯來說比加大投入追求SuperApp更有價值。因此,商湯將日日新大模型系列廣泛應用于WPS、閱文、想法流等多個明星C端應用的同時,也積極拓展B端業務,為更多行業提供AI技術解決方案。
在算力、算法、用戶與商業這一完整的模型體系中,商湯憑借其大裝置與商業積累的優勢,成功啟動了飛輪效應。隨著日日新V6的發布,商湯多模態大模型的實力得到了極大提升,算法飛輪也展現出了巨大的潛力。未來,商湯將繼續深耕大模型領域,推動AI技術的創新與應用,為人工智能時代的發展貢獻更多力量。