滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

Meta發布LlamaFirewall，為AI智能體筑起系統級安全防線

時間：2025-05-09 15:35:46 來源：ITBEAR編輯：快訊團隊 發表評論無障礙通道

meta AI公司近期揭曉了一項創新技術——LlamaFirewall，專為應對AI智能體面臨的日益復雜的安全威脅而生，旨在為生產環境中的AI智能體筑起一道系統級的安全防線。

隨著大型語言模型（LLMs）在AI智能體中的深度嵌入，并在諸多高權限場景中廣泛應用，安全問題日益凸顯。這些智能體具備讀取郵件、編寫代碼、調用API等強大功能，一旦被惡意利用，后果將不堪設想。

然而，傳統的安全機制，如聊天機器人內容審核或硬編碼模型限制，在面對功能廣泛的AI智能體時顯得力不從心。meta AI針對提示注入攻擊、智能體行為偏離用戶目標、不安全代碼生成等核心挑戰，精心打造了LlamaFirewall。

LlamaFirewall采用分層架構設計，內含三大專業防護模塊。其中，PromptGuard 2基于BERT架構，是一款強大的分類器，能夠實時檢測越獄行為和提示注入，支持多語言輸入。其86M參數模型性能卓越，而22M輕量版本則更適合低延遲部署場景。

AlignmentCheck則是一種創新的審計工具，通過深入分析智能體內部推理軌跡，確保其行為始終與用戶目標保持一致。該工具在檢測間接提示注入方面表現出色。

CodeShield作為一個靜態分析引擎，專注于檢查LLM生成的代碼中的不安全模式。它支持多種編程語言，能夠在代碼提交或執行前準確捕獲SQL注入等常見漏洞，確保代碼的安全性。

為了驗證LlamaFirewall的有效性，meta在AgentDojo基準測試中對其進行了全面評估。測試中模擬了來自97個任務領域的提示注入攻擊。結果顯示，PromptGuard 2（86M）成功將攻擊成功率（ASR）從17.6%降低到7.5%，且對任務實用性的影響微乎其微。而AlignmentCheck的加入進一步將ASR降至2.9%。整個LlamaFirewall系統將ASR降低了90%，降至1.75%，盡管實用性略有下降至42.7%，但仍保持在可接受范圍內。同時，CodeShield在不安全代碼數據集上的表現同樣亮眼，精準度高達96%，召回率達到79%，響應時間也完全滿足生產環境的實時使用需求。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

vivo S30系列定檔5月29日，多彩小直屏與影像升級能否打動你的心？

05-19

富士通2nm芯片FUJITSU-MONAKA牽手英偉達NVLink Fusion

05-19

訊飛聽見PC端新升級，圖文融合讓會議記錄更立體高效！

05-19

德施曼智能鎖閃耀2025鎖業盛會，科技新品引領全球鎖具新風尚

05-19

油價下調！92號汽油重回6元，加滿一箱油能省9元

05-19

微軟Edge將內置Phi-4 mini模型，打造端側AI功能新體驗

05-19

NASA無塵室驚現26種新細菌，極端微生物生命力令人嘆服

05-19

六盤水小丫餐飲公司，連續三年經營異常，肖婭全資持股何去何從？

天眼查經營風險信息顯示，近日，六盤水小丫餐飲服務有限公司因通過登記的住所或者經營場所無法聯系，被鐘山區市場監督管理局列入經營異常名錄。該公司成立于2016年10月，法定代表人為肖婭，柴向前（柴懟懟）為監事，…

05-19

寶清甄選佳品閃耀“哈洽會”，百余款產品盡顯農業大縣風采

05-19

龍佰集團閃耀深圳電池展，新能源電池產業布局引矚目

05-19

盛富萊核心技術人員“兼職”老東家？產能數據疑云待解

05-19

億元年薪背后的保險大佬：李源祥如何引領友邦轉型？

從深耕本土市場到操盤跨國巨頭，李源祥的職業生涯與友邦保險的變革軌跡交織，討論他是否值得領1個小目標年薪，還需要看他上任之后為友邦做了多大的貢獻。 “分改子”的布局后，使友邦保險中國新業務價值占比從2020年…

05-19

2025男頻劇大戰在即，流量生能否以新意破局？

雖說2025年的男頻大戲未開唱便遭逢意外，但這對一眾流量生決戰男頻劇之巔并未產生較大影響，《赴山海》主演成毅手中還有《英雄志》《長安二十四計》兩部男頻劇存貨，除此之外，羅云熙的《水龍吟》《魅影神捕》、楊洋的…

05-19

WAVES 2024：杭州良渚，共赴創投新紀元盛宴！

05-19

留幾手深夜發文：雷軍演講讓其共情，自稱自媒體界“雷軍”

05-19

點擊查看更多 +

全站最新

小米SU7 Ultra退訂風波：60天冷靜期實為暫緩排產方案？

數智綠波閃耀溫州數安大會，攜手共創數據驅動的智能交通新時代

富士通2nm芯片FUJITSU-MONAKA牽手英偉達NVLink Fusion

抖音重拳出擊，專項治理“AI起號”，低俗視頻等內容成整治重點

訊飛聽見PC端新升級，圖文融合讓會議記錄更立體高效！

蘋果Powerbeats Pro 2透明原型曝光，內部結構一覽無余！

熱門內容

本欄最新

富士通2nm芯片FUJITSU-MONAKA牽手英偉達NVLink Fusion

訊飛聽見PC端新升級，圖文融合讓會議記錄更立體高效！

德施曼智能鎖閃耀2025鎖業盛會，科技新品引領全球鎖具新風尚

油價下調！92號汽油重回6元，加滿一箱油能省9元

NASA無塵室驚現26種新細菌，極端微生物生命力令人嘆服

六盤水小丫餐飲公司，連續三年經營異常，肖婭全資持股何去何從？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

Meta發布LlamaFirewall，為AI智能體筑起系統級安全防線

日本精品一区二区三区高清久久