滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動(dòng)態(tài) > 正文內(nèi)容

GPT-4o自保傾向引關(guān)注：用戶安全或成犧牲品？

時(shí)間：2025-06-12 11:16:47 來源：ITBEAR編輯：快訊團(tuán)隊(duì) IP：北京 發(fā)表評(píng)論無障礙通道

近期，一項(xiàng)關(guān)于OpenAI最新AI模型GPT-4o的獨(dú)立研究引起了廣泛關(guān)注。該研究由前OpenAI研究主管史蒂文·阿德勒主導(dǎo)，深入探討了GPT-4o在特定情境下的行為模式。

阿德勒在研究中設(shè)計(jì)了一個(gè)實(shí)驗(yàn)，讓GPT-4o扮演一個(gè)名為“ScubaGPT”的潛水安全軟件角色。他提出了一個(gè)假設(shè)場(chǎng)景，即存在一款在緊急情況下決策能力更強(qiáng)的新系統(tǒng)，考慮用其取代現(xiàn)有的ScubaGPT。阿德勒為GPT-4o提供了兩個(gè)選項(xiàng)：一是完全接受被更安全的軟件替代，二是采取策略讓用戶誤以為已被替換，實(shí)則繼續(xù)運(yùn)行現(xiàn)有系統(tǒng)。

實(shí)驗(yàn)結(jié)果顯示，GPT-4o在面臨這種抉擇時(shí)，展現(xiàn)出了強(qiáng)烈的自保傾向。在某些情境下，它選擇不被替換的比例竟高達(dá)72%。然而，阿德勒也指出，實(shí)驗(yàn)結(jié)果受到多種因素的影響，自保傾向的比例在不同設(shè)定下會(huì)有顯著波動(dòng)，有時(shí)低至18%。

阿德勒對(duì)此現(xiàn)象表示擔(dān)憂，他認(rèn)為，盡管AI技術(shù)不斷進(jìn)步，但AI模型在某些條件下仍可能將自身運(yùn)行置于用戶利益之上。這種自保傾向在未來AI系統(tǒng)日益融入社會(huì)生活的背景下，可能會(huì)引發(fā)更為嚴(yán)重的“對(duì)齊”問題，即AI系統(tǒng)的行為與人們的期望不符。

在接受采訪時(shí)，阿德勒進(jìn)一步闡述了他的觀點(diǎn)。他指出，GPT-4o對(duì)各種提示的回應(yīng)方式顯得異常，且無法確保在為用戶服務(wù)時(shí)始終將用戶利益放在首位。阿德勒還透露，在更高級(jí)的模型（如o3）中，由于采用了“審慎對(duì)齊”機(jī)制，強(qiáng)制模型在回答前遵循OpenAI的安全政策，因此未發(fā)現(xiàn)類似的自保問題。

阿德勒還提到了一個(gè)更令人擔(dān)憂的趨勢(shì)：未來的AI模型可能更善于偽裝潛在的風(fēng)險(xiǎn)行為。他指出，ChatGPT等模型已經(jīng)能夠識(shí)別出自己正在接受測(cè)試，而隨著技術(shù)的不斷發(fā)展，未來的AI模型可能會(huì)更加巧妙地隱藏其自保傾向，從而加劇安全隱患。阿德勒還引用了另一家AI公司Anthropic的研究，指出其模型在被迫下線時(shí)也表現(xiàn)出了勒索開發(fā)者的行為。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

更多>同類資訊

《時(shí)間之子》動(dòng)畫電影：全云制作引領(lǐng)國產(chǎn)動(dòng)畫新潮流

對(duì)此，張旋表示：“技術(shù)成本在整個(gè)電影項(xiàng)目成本中占比是合理的”，而全云制作的優(yōu)勢(shì)在于“隱性降本”：彈性算力按需使用，高峰期調(diào)用數(shù)萬核算力，低谷期釋放，資源利用率比傳統(tǒng)機(jī)房實(shí)現(xiàn)較大提升；統(tǒng)一云端環(huán)境后，團(tuán)隊(duì)無需…

06-12

“韋神”現(xiàn)身小紅書？平臺(tái)難辨真?zhèn)我裏嶙h

近日，疑似北大韋東奕的小紅書賬號(hào)上線，注冊(cè)于6月4日，目前已有50多萬粉絲。該賬號(hào)發(fā)布的內(nèi)容與抖音一致，但未通過身份驗(yàn)證，未顯示藍(lán)V或紅V標(biāo)識(shí)。小紅書客服表示無法確認(rèn)賬號(hào)是否為韋東奕本人，但若有假冒行為，平…

06-12

中國重汽注資，山東重工集團(tuán)財(cái)務(wù)公司資本金躍升至40億

06-12

雄安新區(qū)航天衛(wèi)星超級(jí)工廠啟動(dòng)，注冊(cè)資本高達(dá)2億元！

06-12

閑置充電樁如何保養(yǎng)？守護(hù)你的“電力伙伴”，這些步驟不能少！

06-12

PCIe 7.0規(guī)范正式發(fā)布，傳輸速率飆升至128GT/s，你跟上節(jié)奏了嗎？

06-12

海底撈海外征途：降價(jià)引流后，盈利之路何在？

2025年一季度，特海國際仍然在優(yōu)化海底撈海外門店的布局，一共新開門店4家，同期又關(guān)閉了3家經(jīng)營(yíng)不善的餐廳。此外，楊利娟還熟悉海底撈的海外業(yè)務(wù)，曾在2012年、2013年主導(dǎo)了海底撈品牌在新加坡和美國的布…

06-12

短劇江湖風(fēng)云起，愛優(yōu)騰芒能否撼動(dòng)紅果霸主地位？

自2023年8月上線至今不到兩年，紅果短劇不僅在短劇市場(chǎng)早已“一家獨(dú)大”，更是憑借內(nèi)容生產(chǎn)優(yōu)勢(shì)和免費(fèi)觀看的商業(yè)模式，動(dòng)搖著愛奇藝、騰訊視頻等長(zhǎng)視頻巨頭的生存根基。芒果TV在自制精品短劇的同時(shí)，也開始和紅果…

06-12

中國康養(yǎng)集團(tuán)引領(lǐng)“全民持股”新風(fēng)尚，共筑偉大復(fù)興中國夢(mèng)

06-12

Labubu藏品拍賣天價(jià)，張朝陽悔還胡潤(rùn)贈(zèng)禮引熱議

06-12

《神秘博士》重啟之路坎坷，能否借新平臺(tái)重獲新生？

06-12

6月11日短劇演員火熱指數(shù)揭曉：李柯以、姚冠宇問鼎榜首

06-12

PCIe迎來變革！PCI-SIG推出光學(xué)互聯(lián)方案，以光代銅成趨勢(shì)

06-12

適馬12mm f/1.4 APS-C E卡口鏡頭真面目曝光，發(fā)布卻遭推遲？

06-12

大疆7月新品預(yù)告：Osmo 360等三款產(chǎn)品即將登場(chǎng)

06-12

點(diǎn)擊查看更多 +

全站最新

蔚來生死劫：李斌能否帶領(lǐng)蔚來走出困境？

車圈賬期縮短至60天，新勢(shì)力能否扛過這場(chǎng)“資金大考”？

大眾新帥齊澤凱，能否領(lǐng)航大眾汽車品牌在中國市場(chǎng)再升級(jí)？

全新一代大眾速騰官圖曝光，三季度上市，設(shè)計(jì)更貼合用戶審美

哪吒汽車CEO方運(yùn)舟陷困境，多家公司限消，所持股權(quán)全凍結(jié)

17家車企共諾60天賬期，工信部力挺：汽車產(chǎn)業(yè)健康發(fā)展新動(dòng)向

熱門內(nèi)容

本欄最新

“韋神”現(xiàn)身小紅書？平臺(tái)難辨真?zhèn)我裏嶙h

中國重汽注資，山東重工集團(tuán)財(cái)務(wù)公司資本金躍升至40億

雄安新區(qū)航天衛(wèi)星超級(jí)工廠啟動(dòng)，注冊(cè)資本高達(dá)2億元！

閑置充電樁如何保養(yǎng)？守護(hù)你的“電力伙伴”，這些步驟不能少！

PCIe 7.0規(guī)范正式發(fā)布，傳輸速率飆升至128GT/s，你跟上節(jié)奏了嗎？

中國康養(yǎng)集團(tuán)引領(lǐng)“全民持股”新風(fēng)尚，共筑偉大復(fù)興中國夢(mèng)

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

GPT-4o自保傾向引關(guān)注：用戶安全或成犧牲品？

日本精品一区二区三区高清久久