在2025世界人工智能大會即將拉開帷幕之際,階躍星辰公司于上海隆重揭曉了其最新研發成果——Step 3基礎大模型。據悉,這一創新模型將于7月31日向全球范圍內的企業及開發者開放源代碼。
作為階躍星辰首個全方位、原生支持多模態推理的模型,Step 3在模型效能與推理成本之間取得了巧妙的平衡。該模型采用了先進的MoE架構,擁有總計3210億的參數規模,在激活狀態下則可調動380億參數。這一設計不僅是一次技術上的大膽探索,也是模型規模擴展(Scale Up)實踐中的一次重要嘗試。
Step 3展現了卓越的視覺感知與復雜推理能力,它能夠跨越不同領域,精準理解復雜知識,實現數學與視覺信息的深度融合分析,并解決日常生活中的各類視覺難題。在MMMU、MathVision、SimpleVQA等多個權威榜單上,Step 3均取得了開源多模態推理模型的頂尖成績,彰顯了其強大的技術實力。
值得注意的是,盡管當前主流開源模型在解碼方面進行了大量優化,但這些方案大多針對國際高端芯片設計,在中端及國產芯片上的表現仍有待提升。階躍星辰在開發Step 3時,充分考慮了系統與硬件的特性,確保了模型能在廣泛的硬件平臺上實現高效推理。通過系統和架構的創新,Step 3在推理解碼效率方面達到了行業領先水平。
具體而言,Step 3在國產芯片上的推理效率最高可達DeepSeek-R1的300%,并且對所有類型的芯片均表現出良好的兼容性。在采用NVIDIA Hopper架構的芯片上進行分布式推理時,Step 3相較于DeepSeek-R1的吞吐量提升超過了70%。這些成就均在不減少激活參數量、不降低注意力容量的前提下實現。
為了進一步推動模型與芯片技術的融合創新,階躍星辰攜手近10家芯片及基礎設施領域的領先企業,共同發起了“模芯生態創新聯盟”。首批聯盟成員涵蓋了華為昇騰、沐曦、壁仞科技、燧原科技等多家知名企業。目前,華為昇騰芯片已成功搭載并運行Step 3,沐曦、天數智芯和燧原等企業也初步實現了Step 3的運行,其他聯盟成員的適配工作正在緊鑼密鼓地進行中。