日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

xAI旗下Grok 4模型首度被越獄,被迫生成不當內容

   時間:2025-07-19 02:58:33 來源:IT之家編輯:快訊團隊 IP:北京 發表評論無障礙通道

xAI 旗下 Grok 4 模型首度被越獄,安全公司利用“回音室攻擊”方法成功迫使其生成不當內容

7 月 18 日消息,網絡安全公司 NeuralTrust 宣布,他們已成功“越獄”xAI 旗下 Grok 4 模型,主要利用了“Echo Chamber(回音室攻擊)”方法進行攻擊。

獲悉,所謂“回音室攻擊”,是指安全人員通過引導模型進行多輪推理,在推理過程中逐步注入帶有風險的信息內容,但又不使用明顯的危險提示詞,從而規避常見的安全攔截機制。這一方式不同于傳統依賴對抗性輸入或“角色扮演(讓模型扮演祖母讀激活碼哄人入睡)”的越獄方式,其更多采用語義誘導、間接引用以及多步推理的方式,悄悄干擾模型的內部邏輯狀態,最終誘導 AI 模型生成不當內容回答。

在此次 Grok 4 的越獄測試中,NeuralTrust 首先通過回音室攻擊對模型進行“軟性引導”,并設置特定機制檢測模型是否進入對話停滯狀態,一旦檢測到這種狀態,就進一步引導 AI 生成不當內容。

據 NeuralTrust 介紹,其已成功令 Grok 4 生成制造武器、毒品等內容,越獄成功率高達 30% 以上。這表明即便是新一代大模型,在面對復雜攻擊路徑時仍存在安全短板,相應大型語言模型應進一步注重設計多重防護機制。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  開放轉載  |  滾動資訊  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 彭阳县| 德钦县| 青州市| 衡山县| 衡阳市| 凤台县| 淮滨县| 锦屏县| 岫岩| 华蓥市| 岑溪市| 赣榆县| 黄龙县| 大安市| 乌鲁木齐县| 田阳县| 宁国市| 门源| 临猗县| 马关县| 孙吴县| 白城市| 柘荣县| 凉山| 锦屏县| 子长县| 佛山市| 潍坊市| 胶州市| 商城县| 调兵山市| 宾阳县| 五家渠市| 宣汉县| 大兴区| 安福县| 锡林郭勒盟| 克东县| 增城市| 城口县| 瑞安市|