近日,由國網山東電科院主導申報的IEEE國際標準《面向語音大模型構建的數據與知識處理框架指南》正式獲得立項批準。這一成果標志著該院在語音大模型領域的技術影響力邁上新臺階,為我國參與國際標準制定提供了重要范例。
隨著智能汽車、物聯網設備、智能客服等領域的快速發展,語音大模型的應用需求持續攀升。然而,構建此類模型所需的數據與傳統文本數據存在顯著差異,涉及存儲形態、標注格式、特征結構等多方面技術挑戰。這些差異導致數據格式混亂、跨機構共享困難、版本管理缺失、安全隱患突出等問題,嚴重制約了模型的迭代優化效率。
針對行業痛點,國網山東電科院在國網山東省電力公司數字化部的指導下,依托多年人工智能技術研發積累,率先發起國際標準申報工作。項目團隊通過系統調研和技術論證,編制了標準提案(PAR)及技術匯報材料,并在IEEE知識工程標準化委員會全會上進行專題匯報。經過嚴格審核和專家意見反饋,該標準最終獲得電氣與電子工程師協會標準委員會(IEEE SA)批準立項。
該標準首次系統規范了語音大模型數據處理與管理的技術框架,重點解決了數據存儲規范不統一、跨組織共享障礙、版本管理缺失、安全風險突出、查詢效率低下、標注成本高昂等核心問題。通過建立統一的數據處理標準,實現了數據安全管理與高效共享,顯著提升了模型訓練效率,為語音大模型技術發展提供了關鍵支撐。
目前,國網山東電科院正聯合國內外科研機構加速推進標準編制工作。項目組將嚴格遵循國際標準制定規范,充分體現我國在語音數據處理領域的技術優勢,確保標準內容兼具科學性與實用性,為全球語音大模型技術發展提供中國方案。