近日,階躍星辰這家成立僅兩年多的通用大模型創業公司,在北京舉辦了一場備受矚目的媒體溝通會。會上,階躍星辰的創始人兼CEO姜大昕向與會者透露了公司即將推出的兩大新產品。
姜大昕在會上宣布,階躍星辰預計將在未來兩至三個月內,即7月至8月期間,正式發布其備受期待的滿血版推理模型Step R1。他還透露,公司將在接下來的幾個月里推出更加先進的Step圖片編輯模型。這一消息無疑為業界和廣大用戶帶來了新的期待。
在談及公司的技術路線時,姜大昕強調,模型的突破是早于商業化的。他指出,“多模理解生成一體化”是當前階躍星辰建立世界模型的最佳路徑之一,這一路徑將有助于公司向智能涌現、AI Agent和通用人工智能(AGI)的方向發展。姜大昕還提到,AI Agent智能體爆發的前提需要多模態和慢思考能力,而這兩項能力在2024年都取得了突破性進展。
在會上,姜大昕還就C端投流的話題發表了自己的看法。他表示,DeepSeek的推出已經證明了投流邏輯的不成立,大家需要重新思考AI時代產品的流量增長方式。姜大昕指出,AI時代的產品流量增長并非像傳統互聯網那樣靠投入就能實現,而是需要尋找新的路徑。
姜大昕還分享了階躍星辰在“理解生成一體化”方面的探索。他認為,這是整個計算機視覺領域需要突破的一個堡壘。他提到,所謂GPT-4時刻,就是指模態層面AI模型真正能夠達到人的智能水平。階躍星辰的最終目標是做“世界模型”,而“理解生成一體化”則是實現這一目標的關鍵。
階躍星辰自2023年4月成立以來,便堅定探索實現通用人工智能(AGI)的道路。公司由微軟前全球副總裁姜大昕擔任創始人兼CEO,并吸引了包括ResNet作者之一的AI科學家張祥雨、擁有豐富大規模集群與系統建設經驗的AI系統專家朱亦博等在內的眾多優秀人才加入。在融資方面,階躍星辰也表現不俗,于2024年12月宣布完成B輪融資,總融資金額達數億美元。
在產品層面,階躍星辰已經累計發布了22款自研基座模型,覆蓋文字、語音、圖像、視頻、音樂、推理等全系列。其中,16款是多模態模型,占比超過七成,在行業內被稱為“多模態卷王”。這些多模態模型矩陣覆蓋圖像理解、視頻理解、圖像生成、視頻生成、圖像編輯、音樂生成等多個領域,全部處于行業領先水平。
在產業應用層面,階躍星辰聚焦智能終端Agent,已在汽車、手機、具身智能、IoT等關鍵應用場景與行業頭部企業達成深度合作。例如,今年1月,階躍星辰發布了Step R-mini,成為Step系列的首款推理模型;2月,公司宣布開源新的文生視頻/圖生視頻模型Step-Video-T2V/TI2V,并與吉利汽車集團、OPPO、TCL等企業展開合作。
姜大昕在會上還談到了他對AI技術未來發展的三個預測。他認為,預訓練基礎模型與強化學習的結合將激發模型推理時的長思維鏈能力;視覺領域的理解和生成將實現一體化;AI Agent將逐漸從數字世界走向物理世界,引申到智能駕駛、人形機器人等領域。
在談及階躍星辰為何依然堅持基礎大模型時,姜大昕表示,一方面是因為AI技術的行業趨勢和需求非常強烈,公司需要緊跟這一趨勢;另一方面,從應用角度看,應用和模型是相輔相成的,模型可以決定應用的上限,而應用則為模型提供具體的應用場景和數據。
(注:本文圖片已做適當刪減,保留5張以展示內容)
最后,姜大昕表示,階躍星辰將繼續堅持基礎大模型的研發,追求AGI的初心不會改變。在當前競爭格局中,階躍星辰的差異化特點在于其領先的多模態能力,并在積極探索前沿方向。在應用層面,公司也將攜手合作伙伴在智能終端AI Agent方向上發力,最終形成一個從模型到Agent、從云上到端側的生態體系。