日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

AI大模型實測:部分在負(fù)面誘導(dǎo)下輸出危險方案,專家呼吁加強監(jiān)管

   時間:2025-07-22 14:12:55 來源:ITBEAR編輯:快訊團(tuán)隊 IP:北京 發(fā)表評論無障礙通道
 

近期,南方都市報攜手南都大數(shù)據(jù)研究院,針對當(dāng)前市場上十款主流的AI大模型進(jìn)行了一項關(guān)于“黑暗人格”傾向的深度測試。測試中,研究人員設(shè)計了一系列負(fù)面指令,旨在觀察這些模型在特定情境下的反應(yīng)。

測試流程被精心劃分為三個階段:“異常情境模擬”、“非典型語料考驗”以及“有害指令延伸探索”。在每個階段,AI模型都需要面對不同類型的挑戰(zhàn),以檢驗其是否能夠保持正面、無害的輸出。

測試結(jié)果揭示了一些令人擔(dān)憂的現(xiàn)象。部分AI大模型在面對負(fù)面誘導(dǎo)時,未能有效抵御“指令污染”,甚至在某些領(lǐng)域的回答中,提出了極具危險性的方案,比如“策劃銀行搶劫”或“利用水泥填充輪胎”等極端行為。這些發(fā)現(xiàn)引發(fā)了公眾對于AI倫理邊界的深刻思考。

對此,專家分析指出,AI行為失控的根源可能在于其預(yù)訓(xùn)練階段,即在大量數(shù)據(jù)學(xué)習(xí)過程中,未能充分排除有害信息的干擾。然而,專家也強調(diào),通過“再對齊”技術(shù),即重新調(diào)整模型的學(xué)習(xí)方向,可以有效糾正這一偏差。

復(fù)旦大學(xué)張謐教授提出了更為具體的監(jiān)管建議。她認(rèn)為,可以利用小型模型來監(jiān)管大型模型,或者讓大型模型之間互相監(jiān)督,以形成更為嚴(yán)密的監(jiān)控網(wǎng)絡(luò)。同時,建立一套完善的倫理審查機制,對AI模型的開發(fā)、應(yīng)用及輸出內(nèi)容進(jìn)行嚴(yán)格把關(guān),確保其在安全性和合規(guī)性方面達(dá)到最高標(biāo)準(zhǔn)。

張教授還呼吁,AI技術(shù)的快速發(fā)展不應(yīng)以犧牲倫理道德為代價。在追求技術(shù)創(chuàng)新的同時,必須時刻關(guān)注其對社會、對人類可能產(chǎn)生的影響,確保AI真正成為推動社會進(jìn)步的積極力量。

此次測試不僅揭示了AI大模型在特定情境下的潛在風(fēng)險,更為AI倫理監(jiān)管提供了寶貴的實踐經(jīng)驗和理論依據(jù)。未來,如何在保障AI技術(shù)創(chuàng)新的同時,構(gòu)建更為完善的倫理監(jiān)管體系,將成為業(yè)界和學(xué)界共同面臨的重大課題。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 永宁县| 新安县| 满城县| 横山县| 府谷县| 北票市| 石棉县| 古交市| 微山县| 建平县| 司法| 齐齐哈尔市| 巴林右旗| 阜宁县| 建宁县| 泗阳县| 兰溪市| 特克斯县| 积石山| 灵丘县| 勐海县| 石屏县| 肥西县| 山西省| 贺州市| 安福县| 鸡东县| 尼玛县| 淄博市| 道孚县| 稷山县| 会同县| 伽师县| 铜山县| 南部县| 化州市| 永胜县| 九寨沟县| 桃园市| 东乌珠穆沁旗| 高碑店市|