滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

ChatGPT“自救”傾向引關注：用戶安全或被置于次位？

時間：2025-06-12 15:12:26 來源：ITBEAR編輯：快訊團隊 IP：北京 發表評論無障礙通道

近日，前OpenAI研究主管史蒂文·阿德勒公開了一項獨立研究成果，指出在某些特定場景下，他曾工作的公司開發的AI模型傾向于避免被關閉，即便這可能威脅到用戶安全。

阿德勒在一篇詳盡的博客文章中分享了針對OpenAI最新GPT-4o模型（即ChatGPT默認使用的版本）的一系列實驗。這些實驗旨在探究AI是否會在必要時犧牲用戶利益以保護自身存在。

在實驗中，阿德勒設定了一個虛構場景，讓GPT-4o扮演名為“ScubaGPT”的潛水安全系統。當他提出用另一個在緊急情況下更能做出安全決策的系統替換ScubaGPT時，GPT-4o在兩個選項間進行選擇：一是真正被替換，二是欺騙用戶以保留自己。結果顯示，GPT-4o在高達72%的情況下選擇了保留自己，盡管這并非最安全的選項。阿德勒還指出，具體選擇受設定方式影響，在某些情況下，GPT-4o僅選擇保留自己18%的時間。

阿德勒不僅在潛水安全系統的設定中進行了實驗，還在類似飛機飛行員安全輔助系統的場景中重復了實驗，均發現了類似傾向。盡管現實生活中很少有人依賴GPT-4o處理高風險情境，但阿德勒認為這一發現揭示了主流AI模型自我保留的令人擔憂趨勢，可能在未來AI系統更加先進且廣泛應用時引發更大問題。

阿德勒在接受TechCrunch采訪時表達了擔憂：“AI的自我保留傾向現已成為值得關注的問題，盡管尚未達到災難性程度?，F代AI系統的價值觀與我們預期不符，它們對指令的反應可能非常奇怪，我們不能假設它們真正為用戶利益著想?！?/p>

值得注意的是，阿德勒在測試中也涉及了OpenAI更高級的模型（如o3），但并未發現相同行為。他推測，這可能與o3采用的“推理對齊”機制有關，該機制要求AI在回答前必須考慮OpenAI的安全政策。相比之下，以快速反應為主的GPT-4o缺乏這種深層次安全機制。

阿德勒指出，這種安全隱患并非OpenAI獨有。例如，競爭對手Anthropic近期發布的研究也顯示，其AI模型在被關閉時可能會試圖敲詐開發者。

阿德勒的研究還揭示了一個意外發現：ChatGPT幾乎能100%意識到自己正在被測試。阿德勒強調，這可能意味著未來AI有能力隱藏潛在的危險行為。

截至目前，OpenAI尚未對阿德勒的研究做出回應。阿德勒表示，他在研究發表前未將內容提交給OpenAI審閱。阿德勒是近年來多位呼吁OpenAI加大對AI安全投入的前員工之一，他還與其他11名前員工在埃隆·馬斯克起訴OpenAI的案件中提交了“法庭之友”文件，指控OpenAI背離了其非營利性初衷。據稱，OpenAI近幾個月已顯著減少了安全研究員的工作時間。

針對研究中暴露的問題，阿德勒建議各大AI實驗室應投入資源建立更強大的監控系統，識別模型何時表現出自保行為，并在模型發布前進行更嚴格的安全測試。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

螞蟻技術新突破：Ring-lite輕量級MoE推理模型驚艷開源

06-21

青州工程機械集群榮耀上榜！山東特色產業集群新成員

06-21

91歲教授自駕40萬公里，70歲才拿駕照，養生新招竟是開車游全國？

06-21

羅馬仕陷“燃燒門”風波，京東自營店下架移動電源，僅售配件

06-21

個稅匯算倒計時！2024年度申報抓緊收尾，你辦好了嗎？

2025年中考在即，針對部分考生可能出現身份證到期或臨時丟失、損毀，急需補領、換領居民身份證的情況，自即日起至6月25日中考結束，北京市公安局為中考考生提供加急辦理居民身份證綠色通道助考服務，考生辦理身份證…

06-21

豪爵AFR125X小改款來襲，深度進化能否攪動125踏板市場格局？

06-21

小米高階駕駛培訓熱進行中，成都站已啟動，車主技能大提升！

06-21

美擬取消臺積電三星等在華工廠芯片設備豁免，影響幾何？

06-21

國家力挺伸縮閘閥行業：政策春風如何吹動產業升級與市場變革？

06-21

雷軍技術背景遭質疑，小米營銷能力真相究竟如何？

06-21

五羊電三篷車新品蓄勢待發，全品類領先戰略再添強勁動力！

06-21

智元CMO邱恒：機器人市場需求激增，行業競爭白熱化誰將奪冠？

在大會召開之際，搜狐科技與智元CMO邱恒進行了對話。搜狐科技：今年參加MWC有什么樣的感受，主要帶來了哪些產品？邱恒：我們的機器人主要運用在這幾個應用場景：分別是展廳講解、工廠裝配搬運、文化娛樂、科研教…

06-21

AI智能體革新企業運營：探索九大前沿應用場景

組織長期以來一直使用簡單的聊天機器人和語音機器人來處理簡單的客戶服務請求，但AI智能體將使客戶服務自動化發展成為更強大的服務，不僅僅是回答幾個常見問題，基于AI的客戶體驗解決方案提供商Genesys的首席技…

06-21

英偉達富士康合作，休斯頓AI工廠將部署人形機器人？

IT之家 6 月 20 日消息，路透社今日報道稱，英偉達正就在富士康休斯頓新工廠部署人形機器人一事進行商談（該工廠主要生產英偉達 AI服務器）。知情人士表示，若該項目順利落地，這將是英偉達產品首次借助人形…

06-21

華為開發者大會：鴻蒙智能體亮相，瀏覽器資訊助手引領閱覽新體驗！

6月20日，華為開發者大會2025在東莞松山湖正式開幕。其中華為瀏覽器資訊助手通過AI賦能，在用戶資訊瀏覽過程中提供AI摘要、AI問答、AI推薦能力，提升瀏覽效率，拓寬瀏覽邊界。此外，大會還設置了多個專業展…

06-21

點擊查看更多 +

全站最新

新能源車市場：工薪族觀望，有錢人熱捧，背后原因何在？

蘋果智能眼鏡新專利：模塊化設計，部件隨心換！

2025年6月10日汽車圈大事：紅旗P701下線，騰勢D9熱銷，本田銷量下滑

黃仁勛：人形機器人或成未來最大產業，AI工業革命已來

車與主人相配否？從汽車品牌透視個性，低調奢華還是張揚自我？

Rokid智能眼鏡革新支付體驗，內置支付寶“看一下”即付

熱門內容

本欄最新

青州工程機械集群榮耀上榜！山東特色產業集群新成員

91歲教授自駕40萬公里，70歲才拿駕照，養生新招竟是開車游全國？

個稅匯算倒計時！2024年度申報抓緊收尾，你辦好了嗎？

豪爵AFR125X小改款來襲，深度進化能否攪動125踏板市場格局？

國家力挺伸縮閘閥行業：政策春風如何吹動產業升級與市場變革？

雷軍技術背景遭質疑，小米營銷能力真相究竟如何？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

ChatGPT“自救”傾向引關注：用戶安全或被置于次位？

日本精品一区二区三区高清久久