7月7日消息,百度6月30日一次性開源10款文心大模型4.5模型,涵蓋從47B激活參數的混合專家(MoE)模型到輕量級0.3B稠密型模型,覆蓋文本、多模態等多種任務需求。據中興通訊今日消息,AiCube智算一體機,在文心4.5開源當天便同步實現全系列模型的適配。
據介紹,AiCube智算一體機同步完成對ERNIE-4.5-300B-A47B等全系列模型的深度適配。這一突破得益于AiCube開放智算基座的靈活架構,可選配昆侖芯P800 AI加速卡,原生支持文心4.5系列模型。同時,AiCube內置一站式模型遷移工具,用戶無需修改代碼,便可通過可視化界面快速完成模型部署,將傳統需要數周的部署周期縮短至小時級。
另外,依托昆侖芯P800超大顯存,AiCube實現了文心4.5全系列模型的單機部署。針對多模態任務,AiCube通過軟硬件深度集成和優化,確保各組件高效協同;創新的動態資源調度和緩存優化技術,有效緩解I/O瓶頸,大幅提升GPU利用率。多維優化技術讓AiCube充分挖掘算力資源潛能,為大模型提供了性能支撐。
注意到,AiCube一體機不僅深度支持文心系列模型,還全面兼容Qwen3、DeepSeek等主流開源大模型。官方表示,其底層架構采用模塊化設計,著眼于未來多模態模型的部署需求,全面適配PyTorch、TensorFlow等主流AI框架,靈活滿足當前及未來多樣化的模型場景需求,打造一機多模的“大模型統一底座”,降低了企業擁抱不同AI技術的門檻。
▲ 圖源:中興官網 | 中興通訊 AiCube 訓推一體機