12月18日,火山引擎在FORCE原動力大會上正式發布豆包大模型1.8及音視頻創作模型Seedance 1.5 pro。權威評測數據顯示,豆包大模型在多模態理解、生成能力及Agent能力上,已躋身全球第一梯隊。
據火山引擎總裁譚待介紹,截至今年12月,豆包大模型日均token使用量突破50萬億,較去年同期增長超過10倍;目前已有超過100家企業客戶累計token使用量超過一萬億。

圖:火山引擎總裁 譚待
豆包大模型1.8:打造更強多模態Agent“大腦”
作為豆包家族的最新旗艦模型,豆包大模型1.8(Doubao-Seed-1.8)面向多模態Agent場景進行了定向優化。其工具調用能力、復雜指令遵循能力及OS Agent能力均得到增強,提升了模型在處理復雜任務時的規劃與執行水平。
在視覺理解方面,豆包1.8的單次視頻理解幀數從640幀倍增至1280幀。模型支持以低幀率理解超長視頻,并能調用工具對關鍵片段進行高幀率理解。該能力可廣泛用于在線教育、產品質檢等場景中。


圖:豆包大模型1.8測試表現
在多項公開評測中,豆包1.8展現出極具競爭力的全面表現:在視覺推理、通用視覺問答、空間理解及視頻理解等任務中,均獲得最佳或接近最佳成績;在通用智能體測評集BrowserComp上表現全球領先;在數學與推理等基礎能力維度上,整體水平已接近全球頂尖的通用模型。
Seedance 1.5 pro:音畫高精同步,重塑AI視頻生產力
針對日益增長的視頻創作需求,火山引擎推出了Seedance 1.5 pro音視頻創作模型。該模型不僅具備影視級的敘事張力,能夠精準捕捉運動細節并細膩呈現人物情緒,更在音畫同步技術上取得了突破性進展。
Seedance 1.5 pro采用創新的原生音視頻聯合生成架構,支持環境音、背景音樂、人聲等多種元素,實現了毫秒級的音畫同步輸出。在對白處理上,模型支持多人多語言對話,口型對齊精準,覆蓋中文方言(如四川話、粵語等)、英文及小語種,極大地提升了視頻內容的真實感與全球化創作潛力。
為進一步降低創作門檻與成本,Seedance系列即將上線“Draft樣片”功能。創作者可先生成低分辨率樣片進行預覽,其關鍵要素與最終成片高度一致,真正做到“預覽即所得”。數據顯示,該功能可幫助創作者提升65%的整體效率,并減少60%的無效創作成本。
目前,個人用戶已可在豆包、即夢AI等平臺體驗該模型;企業用戶則可從12月23日起,通過火山引擎API接入Seedance 1.5 pro模型服務。
升級AI云原生架構,構建Agent規模化落地基座
譚待指出,傳統的IT架構已無法滿足Agent時代的需求,以模型為中心的AI云原生架構正在形成,并圍繞Agent的開發與運營進行重構。
在Agent開發層面,火山引擎全面升級了企業級AI Agent平臺——AgentKit。該平臺覆蓋了Agent從開發、部署到管控的全生命周期,旨在解決企業在Agent落地中面臨的身份權限管理、模型確定性及系統集成等核心挑戰。
在Agent運營層面,火山引擎推出了HiAgent智能體工作站。該工作站通過構建統一的企業AI任務調度中心、提供一系列開箱即用的通用智能體,以及支持個性化定制智能體應用,幫助企業實現Agent的規模化管理與應用。
此外,為降低企業使用門檻,火山引擎推出了業內首個“AI節省計劃”。該計劃覆蓋所有按量后付費的大模型產品,通過階梯式折扣,幫助企業最高節省47%的成本。
譚待表示,通過從模型能力到基礎設施的全面革新,火山引擎正在推動AI應用從單一的模型調用向復雜的Agent智能體生態演進,加速AI能力在各行各業的深度落地。











