全球信息安全領(lǐng)域兩大權(quán)威平臺——國際頂級會議ACM CCS與中國計算機(jī)學(xué)會A類期刊IEEE TDSC近日同步公布最新研究成果,螞蟻數(shù)科自主研發(fā)的兩項隱私計算技術(shù)突破性成果成功入選。這一成績標(biāo)志著中國企業(yè)在隱私保護(hù)人工智能領(lǐng)域的技術(shù)實(shí)力獲得國際學(xué)術(shù)界高度認(rèn)可,為跨機(jī)構(gòu)數(shù)據(jù)協(xié)作提供了更安全高效的解決方案。
針對跨機(jī)構(gòu)聯(lián)合建模場景中普遍存在的數(shù)據(jù)隱私與計算效率矛盾,螞蟻數(shù)科技術(shù)團(tuán)隊聚焦梯度提升決策樹(GBDT)模型展開攻關(guān)。該類模型包含XGBoost、LightGBM等主流算法,因其可解釋性強(qiáng)、預(yù)測效率高的特點(diǎn),已成為金融風(fēng)控、精準(zhǔn)營銷等領(lǐng)域的核心工具。但傳統(tǒng)多方協(xié)作模式下,數(shù)據(jù)隱私保護(hù)與高性能計算長期處于"安全增強(qiáng)則效率衰減"的博弈狀態(tài)。
研究團(tuán)隊突破性采用多方安全計算(MPC)技術(shù)路線,通過密碼學(xué)與機(jī)器學(xué)習(xí)算法的深度融合創(chuàng)新,在訓(xùn)練和推理兩個關(guān)鍵環(huán)節(jié)實(shí)現(xiàn)雙重突破。其中被ACM CCS 2025收錄的《Gibbon: Faster Secure Two-party Training of Gradient Boosting Decision Tree》提出新型安全兩方訓(xùn)練框架,相比2023年USENIX Security會議發(fā)布的"Squirrel"方案,訓(xùn)練速度提升2-4倍,甚至超越聯(lián)邦學(xué)習(xí)代表性方案SecureBoost的開源實(shí)現(xiàn)性能。
在推理環(huán)節(jié),入選IEEE TDSC的《Privacy-preserving Decision Graph Inference from Homomorphic Lookup Table》創(chuàng)新應(yīng)用同態(tài)查找表技術(shù),構(gòu)建起覆蓋GBDT、決策樹、評分卡等模型的隱私保護(hù)推理體系。實(shí)驗數(shù)據(jù)顯示,該技術(shù)使GBDT和決策樹模型的推理效率提升2-3個數(shù)量級,在保證數(shù)據(jù)"可用不可見"的前提下,顯著提升跨機(jī)構(gòu)協(xié)作的實(shí)時性。
相較于當(dāng)前業(yè)界廣泛采用的聯(lián)邦學(xué)習(xí)方案,螞蟻數(shù)科的技術(shù)路徑展現(xiàn)出獨(dú)特優(yōu)勢。隱私計算聯(lián)盟2024年發(fā)布的《隱私計算產(chǎn)品通用安全分級白皮書》指出,主流聯(lián)邦學(xué)習(xí)方案存在中間結(jié)果泄露風(fēng)險。而MPC技術(shù)路線通過密碼學(xué)協(xié)議確保數(shù)據(jù)始終處于加密狀態(tài),從根本上規(guī)避信息泄露隱患,為醫(yī)療、金融等強(qiáng)監(jiān)管領(lǐng)域的數(shù)據(jù)協(xié)作提供更可靠的技術(shù)保障。
目前這兩項技術(shù)已全面集成至螞蟻數(shù)科隱私計算產(chǎn)品矩陣。該體系包含四大核心模塊:支撐可信數(shù)據(jù)流通的基礎(chǔ)設(shè)施平臺FAIR、專注金融營銷場景的摩斯(Morse)解決方案、為AI/BI系統(tǒng)提供嵌入式保護(hù)的密態(tài)中間件,以及針對大語言模型的全生命周期隱私保護(hù)方案。這些產(chǎn)品已在銀行、保險、政務(wù)等多個領(lǐng)域?qū)崿F(xiàn)規(guī)?;瘧?yīng)用,日均處理隱私計算任務(wù)超百萬次。
作為信息安全領(lǐng)域最具影響力的學(xué)術(shù)平臺之一,ACM CCS與中國計算機(jī)學(xué)會保持同級認(rèn)證標(biāo)準(zhǔn),其收錄的論文需經(jīng)過全球頂尖學(xué)者的三重匿名評審。IEEE TDSC作為IEEE Computer Society旗艦期刊,長期聚焦可信計算、安全協(xié)議等前沿方向,兩平臺的同時認(rèn)可充分印證了研究成果的學(xué)術(shù)價值與工程意義。