在信息化高速發展的今天,語音通信技術的進步對應急救援和衛星通信等領域的重要性日益凸顯。衛星通信領域長期面臨窄帶寬和遠距離傳輸等技術難題,這些難題嚴重制約了相關領域的發展。
作為國內北斗應用技術領域的佼佼者,磐鈷智能依托國家第二代北斗重大專項的推動,與中山大學CPNT Lab(北斗綜合智能導航團隊)展開了深度合作。這一合作成功研發出具有自主知識產權的低碼率語音壓縮算法,并獲得了國家專利授權。如今,該算法已經迭代至3.0版本,為北斗語音通信領域帶來了革命性的變化。
3.0版本的升級以256bps為突破點,在語音傳輸效率和語音質量保障方面取得了顯著突破,為衛星物聯網通信提供了顛覆性的解決方案。該算法不僅大幅提升了語音壓縮效率,還確保了在低碼率下的高清語音質量。
在技術升級方面,該算法采用了基于VQ-VAE與Transformer的端到端聲碼器,融合了中山大學的技術研究成果。這一創新技術實現了高效壓縮和卓越音質。通過殘差矢量量化(RVQ)和因果Transformer序列預測模型,算法成功實現了從1000bps到256bps的壓縮,壓縮比低至24.8%,顯著減少了傳輸數據量。同時,在低至256bps的碼率下,DNSMOS評分仍然保持在2.8以上,主觀音質完全達標。
該算法還具備在復雜環境下的抗噪能力。針對混響和嘈雜噪聲的干擾,算法采用了頻域RNNOISE模型和時頻域DPCRN模型,實現了雙重技術突破。這些技術不僅大幅降低了計算量,還提高了語音清晰度,使聲碼器在含噪環境下的平均DNSMOS評分從2.1提升至2.8,語音清晰度提升超過40%。
在實際應用中,該算法已經展現出了強大的技術實力。在應急通信設備中,通過低碼率語音技術,實現了實時語音回傳,為野外救援和遠洋船舶等場景提供了有力支持。同時,該算法還適配了智能物聯網終端,采用低功耗設計,延長了設備續航時間,保障了通信質量。
在研發歷程方面,磐鈷智能與中山大學CPNT Lab的合作始于對國家重大需求的積極響應。自2021年啟動“北斗語音壓縮算法”專項研究以來,團隊歷經多次技術突破,終于在2022年成功研發出低碼率語音壓縮算法,并在2023年獲得國家發明專利授權。此后,算法不斷迭代升級,最終在2025年推出了3.0版本,實現了從1000bps到256bps的壓縮,同時保持了卓越的語音質量。
這一技術成果不僅體現了磐鈷智能和中山大學CPNT Lab的創新精神和技術實力,也展示了國家重大專項在推動技術創新和產業升級方面的重要作用。未來,隨著技術的不斷發展和應用場景的不斷拓展,低碼率語音壓縮算法將在更多領域發揮重要作用,為衛星物聯網通信提供更加高效、可靠的解決方案。