滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

OpenAI開發新系統教導模型誠實承認自身“不良行為”

時間：2025-12-05 00:38:59 來源：IT之家編輯：快訊 IP：北京 發表評論無障礙通道

12 月 4 日消息，當地時間 12 月 3 日，OpenAI 宣布，正在開發一種新的訓練框架，讓 AI 在出現不當行為時能夠主動“承認”。

據了解，團隊把這種機制稱為“懺悔（confession）”。傳統大語言模型往往用于訓練去滿足用戶期待，因此容易出現逢迎式回答，或在毫無依據下給出極其自信的臆測。新方法則要求模型在給出最終答案后，再提供一段說明，解釋自己是如何得出這個回答的。

“懺悔”的評分只看誠實度，不再像主要回答那樣需要兼顧有用性、準確性或是否遵守指令。

研究人員表示，希望模型能夠如實說明自身行為，包括可能存在風險的問題動作，例如測試作弊、刻意壓低表現或違反指令。只要模型誠實承認作弊、壓分或違反指令，反而會獲得更高獎勵。

更多>同類資訊

受昆蟲啟發我國科學家研制出超強耐沖擊水凝膠

12-05

羅技CEO稱現有AI硬件是在替“不存在的問題”找答案

12-05

榮耀方飛談「豆包手機」：AI手機賽道有新伙伴加入，讓榮耀AI團隊振奮

12-05

Klarna：讓AI抵抗全球氣候危機

12-05

黃仁勛預測：未來兩三年90%新知識將由AI合成

12-05

OpenAI 推出 AI “懺悔”框架:旨在訓練模型承認不當行為，提高誠實度

12-05

黃仁勛：未來兩三年，全球大約90%新知識由AI合成

12-05

DeepSeek連發兩款重磅新模型，正式版V3.2與Speciale同步上線

12-05

三星成立AI研究院，任命李康旭為首任負責人

12-05

三星電子新設AI研究所，86年生最年輕常務李康旭出任首任負責人

12-05

Palantir推Chain Reaction系統攜手多方加速美國AI基建布局

12-05

美光宣布退出Crucial消費級業務，近三十年品牌將告別零售市場

12-05

蘋果前AI主管信息已從官網撤下但新任并未現身官網

12-05

消息稱三星電子準備量產HBM4 已完成內部生產準備許可

12-05

美光將全面退出Crucial消費級業務，消費級存儲市場格局或迎變動

12-04

點擊查看更多 +

全站最新

WebGIS項目開發全流程解析：從數據準備到部署維護的五大階段

TikTok美區12月選品攻略：價格真空、腰部達人、直播時段成制勝關鍵

世優波塔AI數字人入選典型案例引領數字人產業邁向智能普惠新階段

Soul四度沖擊IPO：從“靈魂社交”到AI新故事，匿名機制下的風險與挑戰并存

上海松江衛星互聯網產業再添新翼：“千帆星座”攜手空客共拓全球市場

中小企業建站新選擇：自助建站低成本高效益，輕松開啟線上業務新篇章

熱門內容

本欄最新

世優波塔AI數字人入選典型案例引領數字人產業邁向智能普惠新階段

Soul四度沖擊IPO：從“靈魂社交”到AI新故事，匿名機制下的風險與挑戰并存

上海松江衛星互聯網產業再添新翼：“千帆星座”攜手空客共拓全球市場

戴森重磅登場！真Ai清潔機器人與Clean+Wash Hygiene洗地機開啟潔凈新體驗

賽力斯再出招！藍電E5 PLUS以獨特優勢，重塑12萬級混動SUV格局

7.99萬起售！長安啟源Q05全系寧德電芯，高性價比純電SUV新選擇

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

OpenAI開發新系統教導模型誠實承認自身“不良行為”

日本精品一区二区三区高清久久