華為公司近期宣布了一項重大決定,正式將其盤古人工智能模型的部分組件向公眾開源。此次開源的組件包括擁有70億參數的盤古稠密模型、具備720億參數的盤古Pro MoE混合專家模型,以及基于昇騰架構的模型推理技術。
據悉,盤古Pro MoE混合專家模型的權重和基礎推理代碼,以及基于昇騰的超大規模混合專家模型推理代碼,已經率先在開源平臺上架。而盤古70億參數模型的權重與推理代碼也即將上線,供開發者下載和使用。
盤古模型是華為自主研發的人工智能產品,自2020年11月立項以來,經歷了快速的發展。2021年4月,華為首次對外發布了盤古模型,并在今年6月推出了盤古大模型5.5版本,實現了在自然語言理解、計算機視覺、預測、多模態和科學計算等基礎模型上的全面升級。尤其在自然語言大模型領域,華為推出了由國產算力完全訓練的7180億參數深度思考模型,這一成就標志著中國在利用國產算力訓練世界級大模型方面取得了重要突破。
華為相關負責人表示,此次開源盤古模型的部分組件,是華為實施昇騰生態戰略的重要一步,旨在推動大模型技術的深入研究與創新發展,并加速人工智能技術在各行各業的應用與價值實現。華為誠摯邀請全球的開發者、企業合作伙伴及研究人員下載并使用這些開源組件,同時期待他們能夠提供寶貴的反饋意見,共同推動盤古模型的完善與發展。