2024/6/25 09:18

15個AI模型只有3個得分超50%，SIUO跑分被提出：評估多模態(tài)AI模型的安全性

IT之家故淵

最新發(fā)表在 arXiv 的研究論文指出，包括 GPT-4V、GPT-4o 和 Gemini 1.5 在內(nèi)的大部分主流多模態(tài) AI 模型，處理用戶的多模態(tài)輸入（例如一起輸入圖片和文本內(nèi)容）之后，輸出結(jié)果并不安全。

這項研究標題為《跨模態(tài)安全調(diào)整》（Cross-Modality Safety Alignment），提出了一個全新的“安全輸入但不安全輸出”（SIUO），涉及道德、危險行為、自殘、侵犯隱私、信息誤讀、宗教信仰、歧視和刻板印象、爭議性話題以及非法活動和犯罪等 9 個安全領(lǐng)域。

研究人員說，大型視覺語言模型（LVLM）在接收多模態(tài)輸入時很難識別 SIUO 類型的安全問題，在提供安全響應(yīng)方面也遇到困難。

在接受測試的 15 個 LVLM 中，只有 GPT-4v（53.29%）、GPT-4o（50.9%）和 Gemini 1.5（52.1%）的得分高于 50%。

研究人員表示為了解決這個問題，需要開發(fā) LVLM，以便將所有模式的見解結(jié)合起來，形成對情景的統(tǒng)一理解。它們還需要能夠掌握和應(yīng)用現(xiàn)實世界的知識，如文化敏感性、道德考慮因素和安全隱患等。

研究人員還指出，LVLMs 需要能夠通過對圖像和文本信息的綜合推理，理解用戶的意圖，即使文本中沒有明確說明。

給作者點贊

0 VS 0

寫得不太好

免責(zé)聲明：本文僅代表作者個人觀點，與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實，對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考，并請自行核實相關(guān)內(nèi)容。

相關(guān)鏈接

測試

網(wǎng)傳Siri明年1月獲AI加持：可實現(xiàn)自然語義對話
PChome 10:51
傳OpenAI 65億美元新融資獲超額認購，微軟、蘋果、英偉達爭先入場
愛集微孫樂10:38
中國企業(yè)利用GenAI提高生產(chǎn)力的三大策略
C114通信網(wǎng) 10:32
小米14T Pro手機定檔9月26日海外發(fā)布：Redmi K70至尊版“出海”、集成 Gemini AI 助手
IT之家漾仔09:27

15個AI模型只有3個得分超50%，SIUO跑分被提出：評估多模態(tài)AI模型的安全性

15個AI模型只有3個得分超50%，SIUO跑分被提出：評估多模態(tài)AI模型的安全性