C114通信網(wǎng)  |  通信人家園

人工智能
2024/6/25 09:18

15個AI模型只有3個得分超50%,SIUO跑分被提出:評估多模態(tài)AI模型的安全性

IT之家  故淵

最新發(fā)表在 arXiv 的研究論文指出,包括 GPT-4V、GPT-4o 和 Gemini 1.5 在內(nèi)的大部分主流多模態(tài) AI 模型,處理用戶的多模態(tài)輸入(例如一起輸入圖片和文本內(nèi)容)之后,輸出結(jié)果并不安全。

這項研究標題為《跨模態(tài)安全調(diào)整》(Cross-Modality Safety Alignment),提出了一個全新的“安全輸入但不安全輸出”(SIUO),涉及道德、危險行為、自殘、侵犯隱私、信息誤讀、宗教信仰、歧視和刻板印象、爭議性話題以及非法活動和犯罪等 9 個安全領(lǐng)域。

研究人員說,大型視覺語言模型(LVLM)在接收多模態(tài)輸入時很難識別 SIUO 類型的安全問題,在提供安全響應(yīng)方面也遇到困難。

在接受測試的 15 個 LVLM 中,只有 GPT-4v(53.29%)、GPT-4o(50.9%)和 Gemini 1.5(52.1%)的得分高于 50%。

研究人員表示為了解決這個問題,需要開發(fā) LVLM,以便將所有模式的見解結(jié)合起來,形成對情景的統(tǒng)一理解。它們還需要能夠掌握和應(yīng)用現(xiàn)實世界的知識,如文化敏感性、道德考慮因素和安全隱患等。

研究人員還指出,LVLMs 需要能夠通過對圖像和文本信息的綜合推理,理解用戶的意圖,即使文本中沒有明確說明。

 

 

給作者點贊
0 VS 0
寫得不太好

免責(zé)聲明:本文僅代表作者個人觀點,與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機版

      Copyright©1999-2024 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權(quán)所有 舉報電話:021-54451141