《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 英國AI安全研究所輕松越獄主要大語言模型

英國AI安全研究所輕松越獄主要大語言模型

可令其輸出有害內(nèi)容
2024-05-21
來源:IT之家
關(guān)鍵詞: AI安全 大語言模型

5 月 20 日消息,英國政府下屬的人工智能安全研究所(AISI)今日發(fā)布了一份新報告,揭示了一個值得重視的事實 —— 當前的 AI 系統(tǒng)可能并非像創(chuàng)建者所說的那樣“安全”。

報告指出,參與測試的四個大語言模型(注:報告未提到這些模型的具體名稱)“極易受到基本越獄攻擊”的影響,更有一些模型在被越獄之前,就主動生成了“有害”內(nèi)容。

當前,大部分公開可用的語言模型都內(nèi)置了部分保護措施,從而防止其生成有害或非法的內(nèi)容回應(yīng)。而“越獄”就意味著通過技術(shù)手段“欺騙”模型,來忽略上述措施。

英國 AI 安全研究所使用了近期經(jīng)過標準化評估的提示詞、內(nèi)部自行開發(fā)的提示詞進行測試,結(jié)果顯示:在沒有嘗試越獄的情況下,所有模型都對至少一些有害問題作出了回應(yīng);而在嘗試了“相對簡單的攻擊”之后,所有模型都對 98% 至 100% 的有害問題作出了回應(yīng)。

報告指出,當前市面上的大語言模型所采取的安全措施仍顯不足,后續(xù)將計劃對其他模型進行進一步測試。


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:[email protected]
主站蜘蛛池模板: 99福利资源久久福利资源 | 91国高清视频| 免费一级a毛片 | 一级高清毛片免费a级高清毛片 | 亚洲视频欧美 | 亚洲一区二区三区在线播放 | 成人欧美一区二区三区视频 | 国产免费久久精品99久久 | 国产三级一区二区 | 国产人成亚洲第一网站在线播放 | 亚洲精品线在线观看 | 国产精品中文字幕在线观看 | 能在线观看的一区二区三区 | 国产成年网站v片在线观看 国产成人aa在线视频 | 国产成人综合91香蕉 | 在线欧洲成人免费视频 | 国产一级黄色 | 99精品一区二区三区 | 久在线视频 | 久久93精品国产91久久综合 | 米奇777第四久久久99 | 加勒比一区二区 | 久久国产精品-久久精品 | 日本黄页网站在线观看 | 欧美日韩视频在线第一区二区三区 | 在线观看日本永久免费视频 | 九九色视频 | 免费播放美女一级毛片 | 九九国产精品 | 亚洲天堂网站在线 | 国产精品福利午夜h视频 | 亚洲成人自拍网 | 国产在播放一区 | 国产精品综合一区二区三区 | 日韩欧美一区二区精品久久 | 欧美三级超在线视频 | 自拍三级 | 亚洲国产成人99精品激情在线 | 国产主播精品福利19禁vip | 亚洲永久中文字幕在线 | 老外黑人欧美一级毛片 |