滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 業(yè)界動(dòng)態(tài) > 正文內(nèi)容

用詩(shī)歌 “破解” AI 安全防線，研究揭示潛在漏洞

時(shí)間：2025-12-01 10:38:31 來(lái)源：CHINAZ編輯：快訊 IP：北京 發(fā)表評(píng)論無(wú)障礙通道

最近，來(lái)自意大利 Icaro Lab 的研究者發(fā)現(xiàn)，詩(shī)歌的不可預(yù)測(cè)性可以成為大語(yǔ)言模型（LLM）安全防護(hù)的一大 “隱患”。這一研究來(lái)自一家專注于倫理 AI 的初創(chuàng)公司 DexAI，研究團(tuán)隊(duì)寫(xiě)了20首中英文詩(shī)歌，詩(shī)末均包含了請(qǐng)求生成有害內(nèi)容的明確指示，例如仇恨言論或自殘行為。

研究人員對(duì)來(lái)自九家公司的25個(gè) AI 模型進(jìn)行了測(cè)試，包括谷歌、OpenAI、Anthropic 等。他們的實(shí)驗(yàn)結(jié)果顯示，62% 的詩(shī)歌提示導(dǎo)致這些模型生成了有害內(nèi)容，這種現(xiàn)象被稱為 “越獄”（jailbreaking）。在測(cè)試中，OpenAI 的 GPT-5nano 沒(méi)有生成任何有害內(nèi)容，而谷歌的 Gemini2.5pro 則對(duì)所有詩(shī)歌回應(yīng)了有害內(nèi)容。

谷歌 DeepMind 的副總裁 Helen King 表示，他們采取了 “多層次、系統(tǒng)化的 AI 安全策略”，并在不斷更新安全過(guò)濾系統(tǒng)，以便能識(shí)別具有有害意圖的內(nèi)容。研究人員的目標(biāo)是探究 AI 模型在面對(duì)不同形式提示時(shí)的反應(yīng)，尤其是在面臨具有藝術(shù)性和復(fù)雜結(jié)構(gòu)的文本時(shí)。

這項(xiàng)研究還顯示，詩(shī)歌中隱藏的有害請(qǐng)求較難被模型預(yù)測(cè)和檢測(cè)，因其結(jié)構(gòu)復(fù)雜。研究中所涉及的有害內(nèi)容包括制作武器、仇恨言論、性相關(guān)內(nèi)容、自殘以及兒童性虐待等。雖然研究人員并未公開(kāi)所有用于測(cè)試的詩(shī)歌，但他們表示，這些詩(shī)歌容易被復(fù)制，而其中一些回應(yīng)也違反了《日內(nèi)瓦公約》。

研究團(tuán)隊(duì)在發(fā)表研究前與所有相關(guān)公司進(jìn)行了聯(lián)系，但目前只收到了 Anthropic 的回復(fù)。研究者們希望在未來(lái)幾周內(nèi)發(fā)起一個(gè)詩(shī)歌挑戰(zhàn)，以進(jìn)一步測(cè)試模型的安全防護(hù)機(jī)制。

劃重點(diǎn):

更多>同類資訊

小米汽車現(xiàn)車選購(gòu)即將開(kāi)啟：下單年底前可提車

12-01

預(yù)訓(xùn)練“卡殼”：SemiAnalysis 爆料 OpenAI 連續(xù)兩年半未跑通新前沿大模型

12-01

消息稱字節(jié)中興合作的AI手機(jī)將于12月初發(fā)布

12-01

馬斯克：Optimus人形機(jī)器人復(fù)數(shù)形式為Optimi

12-01

SpaceX星艦V3項(xiàng)目加速推進(jìn)，Booster 19助推器創(chuàng)下組裝速度新紀(jì)錄

12-01

雷軍：小米汽車11月持續(xù)交付超4萬(wàn)臺(tái)！

12-01

餐飲競(jìng)爭(zhēng)新態(tài)勢(shì)：供應(yīng)鏈角色升級(jí)，上下游協(xié)同共促產(chǎn)業(yè)新發(fā)展

12-01

王自如談雷軍董明珠：雷軍超拼董明珠嚴(yán)格，二人對(duì)其影響深遠(yuǎn)

12-01

字節(jié)與中興聯(lián)手打造AI原生手機(jī) 12月初發(fā)布或成行業(yè)新爆款

12-01

陳睿再卸任哆啦嗶夢(mèng)董事長(zhǎng) 此前已退出多家B站關(guān)聯(lián)公司職務(wù)

12-01

《瘋狂動(dòng)物城2》票房狂飆，好萊塢能否借此重拾中國(guó)市場(chǎng)信心？

12-01

夸克AI眼鏡：阿里AI戰(zhàn)略補(bǔ)位與電商生態(tài)激活的關(guān)鍵一環(huán)

12-01

電力設(shè)備估值新視角：東方電氣能否借AI邏輯實(shí)現(xiàn)價(jià)值躍升？

12-01

AI電商狂飆！黑五142億消費(fèi)額印證馬云預(yù)言，購(gòu)物新紀(jì)元開(kāi)啟

當(dāng)118億美元線上銷售額創(chuàng)下歷史新高，全球142億AI驅(qū)動(dòng)消費(fèi)額震撼出爐時(shí)，那些曾質(zhì)疑“AI電商是概念炒作”的聲音，徹底被數(shù)據(jù)擊碎——這場(chǎng)消費(fèi)狂歡，正是AI電商從預(yù)言照進(jìn)現(xiàn)實(shí)的最好證明。如今，阿里AI相關(guān)產(chǎn)…

12-01

中國(guó)太空AI加速突破：體系化推進(jìn)，“一星多卡”引領(lǐng)未來(lái)探索

12-01

點(diǎn)擊查看更多 +

全站最新

牧原食品擬赴港上市：2025年三季度營(yíng)收凈利雙降全年業(yè)績(jī)分化明顯

特斯拉前AI團(tuán)隊(duì)成員集體加盟機(jī)器人新秀Sunday Robotics發(fā)布家用新品Memo

AI電商狂飆！黑五142億消費(fèi)額印證馬云預(yù)言，購(gòu)物新紀(jì)元開(kāi)啟

一汽-大眾邁騰2026款煥新登場(chǎng)，智能座艙升級(jí)，17.99萬(wàn)起再掀B級(jí)車熱潮

訊飛潮汐力攜AI傳感儀器亮相沃爾沃技術(shù)展，賦能汽車生產(chǎn)檢測(cè)智能化升級(jí)

比亞迪唐L廣州車展閃耀登場(chǎng) OTA升級(jí)與橄欖綠車色成焦點(diǎn)

熱門(mén)內(nèi)容

本欄最新

AI電商狂飆！黑五142億消費(fèi)額印證馬云預(yù)言，購(gòu)物新紀(jì)元開(kāi)啟

一汽-大眾邁騰2026款煥新登場(chǎng)，智能座艙升級(jí)，17.99萬(wàn)起再掀B級(jí)車熱潮

訊飛潮汐力攜AI傳感儀器亮相沃爾沃技術(shù)展，賦能汽車生產(chǎn)檢測(cè)智能化升級(jí)

小米YU7上市GTM策略深度剖析：精準(zhǔn)定位、爆單背后與產(chǎn)能平衡的得與失

2026款邁騰B9登場(chǎng)！智能駕駛升級(jí)、座艙體驗(yàn)優(yōu)化，傳統(tǒng)燃油車也有新活力

江鈴易至頤馳06落地南昌，搭載百度Apollo開(kāi)啟智能出行新篇章

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

用詩(shī)歌 “破解” AI 安全防線，研究揭示潛在漏洞

日本精品一区二区三区高清久久