近期,網絡上流傳著一則關于華為與阿里巴巴在大型語言模型領域的技術爭議。據傳,華為推出的盤古大模型Pro MoE版本與阿里巴巴達摩院發布的通義千問Qwen-2.5 14B模型在參數結構上存在高度相似性,這一發現迅速引起了業界的廣泛關注。
具體而言,有研究團隊在GitHub上的一個名為HonestAGI/LLM-Fingerprint的項目中,對多個主流大型語言模型進行了深入比對。他們驚訝地發現,華為盤古Pro MoE與阿里巴巴的Qwen-2.5 14B模型在注意力模塊上表現出了極高的相似性,而這種相似性在其他模型的對比中并未出現。這一發現引發了關于盤古Pro MoE是否基于Qwen-2.5進行修改或訓練的猜測。
面對這一爭議,華為盤古Pro MoE技術開發團隊迅速作出了回應。他們在聲明中明確表示,盤古Pro MoE開源模型的部分基礎組件代碼實現確實參考了業界的開源實踐,并涉及到了其他開源大模型的部分代碼。但華為強調,他們在使用這些開源代碼時,嚴格遵循了開源許可證的要求,并在開源代碼文件中清晰標注了版權聲明。這一做法不僅符合開源社區的通行慣例,也體現了華為對開源協作精神的尊重。
華為團隊進一步指出,他們始終秉持開放創新的理念,尊重第三方的知識產權。同時,他們也積極倡導包容、公平、開放、團結和可持續的開源理念。華為表示,他們將繼續致力于推動開源技術的發展和應用,為行業的繁榮和發展做出貢獻。
此次爭議雖然引起了業界的廣泛關注,但也再次凸顯了開源技術在當前科技領域中的重要地位。隨著開源技術的不斷發展和普及,越來越多的企業和研究機構開始積極參與到開源社區的建設中來。可以預見的是,在未來的科技發展中,開源技術將繼續發揮重要作用,推動行業的不斷創新和進步。