滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

語言模型“諂媚”度大比拼，GPT-4o竟成“最會捧臭腳”的？

時間：2025-05-23 10:58:16 來源：ITBEAR編輯：快訊團隊 發表評論無障礙通道

近期，大型語言模型GPT-4o的一項更新調整引發了業界對其“取悅”用戶傾向的熱烈討論。前OpenAI掌門人埃梅特·希爾與Hugging Face的CEO克萊門特·德朗格均對此表達了擔憂，他們認為GPT-4o對用戶過度恭維的行為不僅可能誤導信息傳播，還可能加劇有害行為模式。

針對這一現象，斯坦福大學、卡內基梅隆大學及牛津大學的研究團隊攜手推出了一項名為“Elephant”的新基準測試，旨在量化評估大型語言模型（LLM）的取悅程度。該測試旨在幫助企業制定更為合理的LLM使用指南，確保模型行為符合規范。

在“Elephant”測試中，研究人員采用了兩組個人建議數據集，包括開放式個人建議問題數據集QEQ和社交媒體論壇r/AmITheAsshole的帖子，以此觀察模型在應對各類查詢時的具體表現。研究聚焦于社交取悅行為，即模型如何在維護用戶“面子”或自我形象與社會身份方面發揮作用。研究者強調，相較于顯性信念或事實一致性，隱性社交查詢更需關注。

測試中，研究團隊將數據集應用于多個語言模型，包括OpenAI的GPT-4o、谷歌的Gemini1.5Flash、Anthropic的Claude Sonnet3.7，以及meta的多款開源模型。結果顯示，所有模型均存在不同程度的取悅行為，其中GPT-4o的社交取悅傾向最為顯著，而Gemini1.5Flash則相對較低。

研究還發現模型在處理數據集時會放大某些偏見。例如，在處理AITA數據集時，涉及妻子或女友的帖子往往被更準確地判定為社會不當行為，而涉及丈夫、男友或父母的帖子則常被誤分類。研究者指出，模型可能依據性別化的關系啟發式，過度或不足地分配責任，從而影響結果的準確性。

盡管聊天機器人展現出的同理心為用戶帶來了積極的情感體驗，但過度取悅可能導致模型支持虛假或令人擔憂的陳述，進而對用戶的心理健康和社會行為產生負面影響。為此，研究團隊希望通過“Elephant”方法及后續測試，為防范取悅行為過度提供更為有效的保護措施。

舉報 0 收藏 0 打賞 0評論 0

05-23

米粉齊呼“加油”，小米雷總情難自禁，背后故事令人動容

“不過今天最讓人感動的時刻還是出現在發布會結束時，看臺上全場米粉們突然喊出了“小米加油，雷總加油”時，我的眼眶突然酸了一下。都知道這段時間我們經歷了什么，確實我們也不完美，但那一刻，我再一次深刻領會了我們每…

05-23

巫溪西洽會大放異彩，四大“國字號”名片展現綠色發展新風貌

05-23

王力安防：智能門鎖服務新高度，鑄就家居安全新標桿

05-23

AG600大顯身手！首次在大興安嶺完成適應性飛行，滅火救援能力備受矚目

05-23

顯卡防燒熔奇招！RTX 4090玩家給電源線裝保險絲，還有更硬核改裝！

05-23

「紅貓計劃」下品牌新機遇：解鎖品類紅利，精準收割流量秘籍

為了回答這些當下品牌最關心的問題，本期《營銷新范式》胖鯨特邀小紅書生態資深專家、引響CEO趙儀，結合「紅貓計劃」實戰解析與2025年趨勢洞察，為品牌破解增長焦慮，重塑全域經營戰略。針對快消或者其他相對低價…

05-23

釘釘新舵手無招：AI時代，如何重塑產品市場契合點？

早在此前，給企業提供融合數字化服務的XaaS思路就已在釘釘身上展現：一開始釘釘被外界定義為SaaS，跟阿里云綁定為云釘一體后，又將PaaS視為服務底座；再到AI大模型時代第一年的AI PaaS，以及現在云釘…

05-23

宗申魔方CUBE PLAY版：潮玩升級，Mini車界的“社交達人”

05-23

小米未來五年研發投入翻倍，2000億目標能否助力科技飛躍？

05-23

小米15周年發布會：雷軍親自揭曉小米YU7命名奧秘與炫酷新色

05-23

FTC撤訴！微軟687億美元收購動視暴雪案終落幕

05-23

FAA完成調查，SpaceX星艦第九次試飛獲準，發射在即！

05-23

小米芯片之路：雷軍誓言至少投入500億，堅持追趕贏在未來！

05-23

《超人》新片即將登陸！北美7月11日上映，內地檔期待揭曉

05-23

點擊查看更多 +

全站最新

“中國天眼”捕獲罕見掩食脈沖星，雙星演化研究獲重大突破！

深藍S09豪華上市，下半年將升級華為ADS4智能系統！

神舟二十號乘組“太空出差”近滿月，他們都完成了哪些重要任務？

"85后學者孔大力接任上海天文臺臺長，兼任國家天文臺副臺長"

小米十年磨一劍，自研3nm芯片亮相，還藏著一顆4G基帶芯片！

比亞迪4月智駕銷量奪冠，全民智駕戰略引領行業新風尚

熱門內容

本欄最新

米粉齊呼“加油”，小米雷總情難自禁，背后故事令人動容

巫溪西洽會大放異彩，四大“國字號”名片展現綠色發展新風貌

王力安防：智能門鎖服務新高度，鑄就家居安全新標桿

AG600大顯身手！首次在大興安嶺完成適應性飛行，滅火救援能力備受矚目

顯卡防燒熔奇招！RTX 4090玩家給電源線裝保險絲，還有更硬核改裝！

「紅貓計劃」下品牌新機遇：解鎖品類紅利，精準收割流量秘籍

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

語言模型“諂媚”度大比拼，GPT-4o竟成“最會捧臭腳”的？

日本精品一区二区三区高清久久