在2025世界人工智能大會即將拉開帷幕之際,上海迎來了階躍星辰公司的新一代基礎大模型發布盛會。7月25日,階躍星辰正式揭曉了其傾力打造的Step 3大模型,這一舉動標志著公司在人工智能領域邁出了重要一步。
作為階躍星辰的主力基座模型,Step 3不僅智能高效,更是專為推理時代設計,力求成為最貼合實際應用需求的模型。據官方介紹,該模型將于7月31日向全球企業和開發者開放源代碼,為全球開源社區帶來一款頂尖的多模態推理模型。
在發布會上,階躍星辰還宣布了一個重大舉措:聯合多家國內領先的芯片與平臺廠商,共同發起“模芯生態創新聯盟”。這一聯盟旨在通過促進模型與芯片產業鏈的協同創新,加速大模型應用的落地進程,推動整個行業的快速發展。
階躍星辰的創始人兼CEO姜大昕分享了公司的研發理念。他表示,經過Step 1和Step 2兩代模型的快速迭代,公司深刻認識到回歸客戶需求、立足真實應用場景的重要性。正是基于這一出發點,階躍星辰研發出了新一代Step 3基礎模型。
Step 3作為階躍星辰的首個全尺寸、原生多模態推理模型,在模型架構創新和算法工程協同設計上實現了大膽突破。該模型采用MoE架構,總參數量達到321B,激活參數量為38B。在性能上,Step 3顯著提升了視覺感知和復雜推理能力,能夠準確完成跨領域的知識理解、數學與視覺信息的交叉分析,以及日常生活中的各類視覺分析問題。
在多個權威榜單上,Step 3取得了開源多模態推理模型的頂尖成績,包括MMMU、MathVision、SimpleVQA、AIME 2025以及LiveCodeBench等。在成本方面,Step 3在國產芯片上的推理效率表現出色,最高可達DeepSeek-R1的300%,且對所有芯片均表現出良好的兼容性。在基于NVIDIA Hopper架構的芯片上進行分布式推理時,Step 3的吞吐量相較于DeepSeek-R1提升了超過70%,且這一提升是在不犧牲激活參數量、不降低注意力容量的前提下實現的。
目前,Step 3已經授權給國內多家芯片公司,其中華為昇騰芯片已經成功搭載并運行Step 3。沐曦、天數智芯和燧原科技等公司也已初步實現Step 3的運行,其他廠商的適配工作也在緊鑼密鼓地進行中。
除了發布Step 3模型外,階躍星辰還宣布將與近10家芯片及基礎設施廠商共同發起“模芯生態創新聯盟”。這一聯盟的成員包括華為昇騰、沐曦、壁仞科技、燧原科技、天數智芯、無問芯穹、寒武紀、摩爾線程以及硅基流動等。聯盟旨在打通芯片、模型和平臺的全鏈路技術,推動整個生態系統的協同發展。