僅在2024年上半年,IEEE Xplore數(shù)字圖書館就發(fā)表了300多篇專注于為深度偽造創(chuàng)建檢測工具的文章。
IEEE高級會員Aiyappan Pillai表示:“在人工智能使深度造假算法能夠制造出更難檢測的贗品的同時,人工智能檢測技術(shù)也在通過采用不同的技術(shù)和算法來識別偽造品。”
什么是深度偽造?
深度偽造一詞是兩個術(shù)語的混合:深度學(xué)習(xí)和偽造。深度偽造是人工智能生成的逼真視頻、音頻片段或靜止圖像,描繪了真實的人做或說他們沒有做過提過的事情。近年來,這種深度偽造出現(xiàn)在了政治領(lǐng)域,同時也影響了娛樂界。深度偽造可能會通過模仿流行音樂行為的歌曲來擾亂娛樂經(jīng)濟,而這些歌曲通常未經(jīng)表演者授權(quán)。
新興檢測方法
目前存在兩大類技術(shù)用于識別深度偽造,并且已經(jīng)進行了大量研究來確定它們的工作效果(https://ieeexplore.ieee.org/document/10376174)。
機器學(xué)習(xí):識別深度偽造的一種方法是向機器學(xué)習(xí)模型提供大量深度偽造和真實內(nèi)容,以便它能夠?qū)W習(xí)發(fā)現(xiàn)它們之間的差異。這些技術(shù)可能根本不涉及機器視覺。相反,它們將圖像轉(zhuǎn)換為數(shù)據(jù),并從其模式中學(xué)習(xí)。如果一個新的深度偽造與訓(xùn)練的數(shù)據(jù)有顯著差異,那么這種方法的一個挑戰(zhàn)可能是難以識別它。
語義分析:與依賴原始數(shù)據(jù)的機器學(xué)習(xí)方法相比,語義分析使用與幫助人工智能系統(tǒng)識別圖片中的蘋果或書籍相同的機器視覺技術(shù)來查看圖像的內(nèi)容和上下文。這些方法可以分析說話者面部的血流模式、頭部的形狀,或者他們的外表是否隨著時間的推移而保持一致。語義分析還涵蓋了沒有意義的對象之間的關(guān)系。例如,想象一個浴室的建筑渲染。人工智能生成的圖像可能會將淋浴頭放置在無法正常使用的位置。
數(shù)字水印
識別深度偽造的需要導(dǎo)致一些生成性人工智能公司為此目的創(chuàng)建標記。在某些情況下,用戶可以看到這些標記;在其他情況下則相反。
IEEE高級會員Rahul Vishwakarma說:“檢測深度偽造最有效的技術(shù)之一是使用生成式AI平臺對生成的圖像進行數(shù)字水印!
偏見問題
大約有五六個常用的數(shù)據(jù)集——人的視頻和圖像——被用來訓(xùn)練深度學(xué)習(xí)模型來檢測深度偽造。一個數(shù)據(jù)集完全由名人組成。研究人員面臨的一個挑戰(zhàn)是,這些數(shù)據(jù)集中的人更有可能是白人和男性。這引發(fā)了人們對深度偽造檢測工具在面對來自不同背景的人的數(shù)據(jù)時是否會遇到困難的質(zhì)疑。
人類或許表現(xiàn)更好嗎?
雖然深度偽造是真實的,但人類可以發(fā)現(xiàn)它們。最近發(fā)表在IEEE Privacy & Security上的一項研究將人類與機器對立起來。研究人員發(fā)現(xiàn),平均而言,人類能夠識別大約71%的深度偽造,而尖端的檢測方法能夠識別93%。
然而,一些深度偽造圖像欺騙了檢測算法,但人類能夠發(fā)現(xiàn)騙局。
有些人比其他人更善于發(fā)現(xiàn)深度偽造,但研究人員才剛剛開始研究原因。在另一項研究中,研究人員考察了警察和“超級識別者(super-recognizers)”檢測深度假貨的能力(https://ieeexplore.ieee.org/document/10480398)。超級識別者的能力得到了實驗室的認證,他們是真正擅長識別和辨認人臉的人。研究表明,超級識別者在識別深度偽造方面并不比普通人好。這表明,能夠判斷某物是否是深度偽造與善于識別人臉不同。