阿里云近期推出了一款專為自動駕駛領域設計的訓練與推理加速框架——PAI-TurboX。這一創新框架能夠顯著提升自動駕駛模型在感知、規劃控制以及世界模型構建等多個環節的訓推效率,據測試數據顯示,它在多個行業模型的訓練任務中成功地將時間縮短了50%。
自動駕駛技術的快速發展依賴于對圖像、激光雷達、毫米波雷達、GPS等多種模態數據的高效融合。然而,業界現有的方案在處理大規模訓練樣本數據時面臨加載和預處理效率低下的難題,這不僅浪費了寶貴的GPU資源,還限制了自動駕駛模型的開發進度。阿里云PAI-TurboX的推出,正是為了解決這些挑戰。
PAI-TurboX框架從系統和數據兩個層面入手,提供了全面的解決方案。在系統層面,它通過優化CPU親和性、采用動態編譯技術以及實施流水線并行策略,顯著提升了模型的訓練與推理效率。而在數據層面,PAI-TurboX引入了高性能的DataLoader引擎,優化了數據預處理流程,并實現了智能訓練樣本分組,從而有效提高了數據處理的速度。
PAI-TurboX還具備算子優化和量化的能力。這些特性能夠進一步減少訓練階段的訪存延遲,提升吞吐效率,并在推理任務中在保證精度的前提下,降低計算開銷和內存帶寬需求。這使得PAI-TurboX能夠在異構平臺上實現高性能的推理部署,滿足了自動駕駛系統對實時性和準確性的嚴苛要求。
實測結果顯示,PAI-TurboX在多個自動駕駛模型訓練任務中表現出色。在3D物體檢測模型BEVFusion的訓練任務中,它將訓練時間縮短了58.5%;在實時在線矢量化高精地圖構建模型MapTR的訓練任務中,訓練時間減少了53%;在端到端自動駕駛模型SparseDrive的訓練任務中,PAI-TurboX在感知模塊訓練和聯合訓練兩個階段均取得了顯著的速度提升,分別縮短了51.5%和48.5%的訓練時間。
阿里云研究員林偉對PAI-TurboX的前景充滿信心。他表示:“TurboX不僅能夠有效提升自動駕駛模型的訓推效率,還將進一步加速世界模型的開發進程。我們期待通過這一框架,讓未來的終端具備像人類一樣的感知、思考和決策能力,推動自動駕駛技術的全面發展。”
自2016年誕生以來,阿里云人工智能平臺PAI已經為超過10萬家企業客戶和數百萬AI開發者提供了貫穿AI開發和運維全流程的平臺服務。它支撐了阿里云百煉、魔搭社區等MaaS服務及社區的發展,成為推動人工智能技術進步的重要力量。