近期,網絡上流傳了一則關于華為與阿里巴巴在大型語言模型領域的爭議消息。據傳,一項在GitHub和arXiv平臺上發布的研究,將華為推出的盤古大模型(Pangu Pro MoE)與阿里巴巴達摩院發布的通義千問Qwen-2.5 14B模型進行了對比,指出兩者在參數結構上存在“高度相似性”。此消息迅速引起了業界的廣泛關注和討論,并附上了一些疑似證據。
具體而言,據相關爆料,一個名為HonestAGI/LLM-Fingerprint的研究團隊在GitHub上進行了多個主流模型的對比實驗。他們發現,盤古Pangu Pro MoE與Qwen-2.5 14B模型在注意力模塊上展現出了極高的相似性,而這種相似性在其他模型的對比中并未出現。這一發現引發了關于盤古模型是否基于Qwen模型進行訓練或修改的質疑。
面對這一爭議,華為盤古Pro MoE技術開發團隊迅速做出了回應。他們表示,盤古Pro MoE開源模型的部分基礎組件代碼實現參考了業界的開源實踐,并涉及其他開源大模型的部分代碼。華為強調,他們嚴格遵循了開源許可證的要求,并在開源代碼文件中清晰標注了開源代碼的版權聲明。這一做法不僅符合開源社區的通行規則,也體現了業界倡導的開源協作精神。
華為團隊進一步指出,他們始終堅持開放創新的原則,尊重第三方的知識產權。同時,他們也提倡包容、公平、開放、團結和可持續的開源理念。華為對全球開發者與合作伙伴對盤古大模型的關注和支持表示感謝,并高度重視開源社區的建設性意見。他們希望通過盤古大模型的開源,與志同道合的伙伴一起探索并不斷優化模型能力,加速技術突破與產業落地。