日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

階躍星辰創始人談AI未來:多模態模型如何鋪就通往AGI之路?

   時間:2025-05-08 23:28:10 來源:ITBEAR編輯:快訊團隊 發表評論無障礙通道

在AI領域,階躍星辰以其驚人的速度和創新力,在短短兩年內推出了16款多模態大模型,迅速在業界贏得了“多模態卷王”的稱號。近日,階躍星辰的創始人兼CEO姜大昕在接受采訪時,深入分享了他對于AI未來的思考,尤其是多模態在通向通用人工智能(AGI)道路上的關鍵作用。

姜大昕強調,無論是從AGI的定義出發,還是從AI應用的實際需求來看,多模態能力都至關重要。他認為,AGI旨在模擬人類智能,這意味著它不僅要具備語言模態對應的符號智能,還需擁有視覺智能、空間智能、運動智能等。任何一個方向的短板,都可能阻礙AGI的實現。同樣,從應用角度來看,智能系統只有具備了聽、看、說等能力,才能真正理解用戶環境,實現與用戶的自然交互。

在AI技術演進的過程中,階躍星辰始終認為,多模態是實現AGI的必經之路。姜大昕將AI技術的發展分為三個階段:模仿學習、探索世界和歸納世界。在模仿學習階段,模型從海量數據中學習多種模態的表征,統一表達多種模態是核心問題。探索世界階段,模型需要復雜問題求解能力和慢思考能力,這些能力可以通過強化學習技術獲得。歸納世界階段,模型將逐漸具備自主學習能力,發現客觀世界的規律。

階躍星辰在多模態模型上的投入是顯而易見的,他們幾乎每個月都會發布一款基礎大模型。例如,他們與Ace Studio聯合開源的Ace-Step音樂大模型,參數量僅3.5B,卻能支持19種語言,最快可在15秒內生成一首歌曲。他們發布的Step-R1-V-Mini多模推理模型,具備高精度感知能力,已在門店巡檢、短劇審核等生產場景中得到了應用。

姜大昕特別提到了多模態理解生成一體化的技術路徑。在語言層面,大語言模型已經能夠完成理解與生成任務。然而,在多模態領域,由于圖片、視頻等模態的復雜度極高,理解生成一體化的難題尚待突破。姜大昕認為,生成需要理解控制,理解需要生成監督。目前,多模態模型仍處于“前Transformer”時期,尚未出現可拓展的模型架構。但階躍星辰內部已有多個團隊在探索這一方向,并開源了Step1X-Edit圖像編輯模型,該模型已初步具備了一定的理解生成一體化能力。

在應用層面,階躍星辰堅持超級模型+超級應用雙輪驅動的策略。他們看到了智能終端Agent的潛力,認為多模態能力和慢思考能力使Agent能夠感知環境、理解任務上下文,并處理復雜任務。目前,階躍星辰的智能終端Agent已在手機、汽車、機器人等領域得到了應用。例如,OPPO手機上的“一鍵問屏”功能就使用了階躍星辰的多模態模型,吉利的智能座艙則采用了他們的端到端語音交互技術。

對于AI的未來,姜大昕表示,階躍星辰將繼續堅持基礎大模型的研發,追求AGI的初心不會改變。在當前的基礎大模型格局中,階躍星辰將多模態作為其差異化優勢,積極探索多模態理解與生成一體化這一前沿方向。他們相信,這一領域存在著巨大的機會,將推動AI技術邁向新的高度。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  RSS訂閱  |  開放轉載  |  滾動資訊  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 松潘县| 伊宁市| 礼泉县| 荃湾区| 怀安县| 延川县| 苏尼特左旗| 永善县| 广平县| 始兴县| 安多县| 锦屏县| 吕梁市| 郯城县| 凯里市| 轮台县| 兴安县| 西充县| 罗甸县| 锡林浩特市| 吉首市| 灵川县| 突泉县| 天柱县| 祁东县| 万载县| 湘阴县| 三江| 苏州市| 修文县| 满城县| 麻江县| 新疆| 吴江市| 邢台县| 油尖旺区| 襄垣县| 霍州市| 云阳县| 响水县| 浑源县|