機器學(xué)習(xí)出的換臉視頻、照片那么逼真,那Deepfake技術(shù)的破綻何在呢?
逼真的技術(shù)也有小破綻
機器學(xué)習(xí)出的換臉視頻、照片那么逼真,那技術(shù)的破綻何在呢?
中國有句古話叫做“若想人不知,除非己莫為”。換臉技術(shù)的破綻,就出在人臉?biāo)夭牡募?xì)節(jié)上。技術(shù)使用A臉的元素來畫出B臉,這一過程是對A臉元素的精巧拼接。而這一拼接的過程,勢必不能完美地符合真實情況。
紐約州布法羅-布法羅大學(xué)的計算機科學(xué)家,就從“眼睛”——這一人臉上最精致的元素入手,實現(xiàn)了對技術(shù)的甄別。
這一技術(shù)的核心原理基于眼球的反射。當(dāng)外界環(huán)境的光照射到眼睛上時,就會產(chǎn)生反射,在角膜上生成圖像。在真正的照片中,兩只眼睛看同一物體,會具有非常相似的反射模式。但在合成的照片中,兩只眼睛的反射內(nèi)容往往并不協(xié)調(diào)。很可能出現(xiàn)左眼“看見”一只小狗,右眼“看見”一輛卡車的情況。檢測機器首先提取兩只眼睛反射的內(nèi)容,然后檢測左右眼的反射內(nèi)容、反射光強度等參數(shù)是否協(xié)調(diào)統(tǒng)一,就可以識別出照片、視頻是否經(jīng)過了合成。這一方法已被證明具有94%的實驗有效性。
除此之外,常見的檢測方法還包括:
(1)根據(jù)視頻的2D圖像估計三維姿勢。使用技術(shù)合成的視頻,三維姿勢可能會突然發(fā)生較大的突變。比如視頻中的人,如果在上一幀胸口還是鼓起正在吸氣的狀態(tài),下一幀就迅速變成胸口下沉吐氣的狀態(tài),那就說明這個視頻鐵定是合成出來的。
(2)捕捉技術(shù)在處理視頻時對圖像進(jìn)行扭曲而在環(huán)境中產(chǎn)生的“偽影”。
(3)捕捉左右虹膜異色、光照與陰影不協(xié)調(diào)、幾何建模錯誤等瑕疵。
(4)針對名人的行為習(xí)慣,檢測視頻中是否有對應(yīng)的特有行為特點(例如摸鼻子、歪嘴等)。
圖3 視頻中的虹膜異色(圖片來源:知乎)
檢測中的“貓鼠游戲”
在不斷發(fā)展的過程中,的檢測技術(shù)仍然會面對不少挑戰(zhàn)。
第一點是有的技術(shù)本身需要一定的信息量。例如前述的眼球反射檢測技術(shù),如果視頻里沒有同時存在兩只眼睛,就無法應(yīng)用。針對虹膜顏色的檢測,在視頻畫質(zhì)較低時使用起來也較為困難。
第二點是,檢測技術(shù)和換臉技術(shù)是一個“不斷發(fā)展,彼此競爭”的過程。例如前述的捕捉光照與陰影不協(xié)調(diào)的問題,換臉者可以在換臉時使用更多的資源進(jìn)行光照模擬、渲染,從而保證陰影的生成質(zhì)量。從這個角度講,檢測和換臉技術(shù)就像一場“貓鼠游戲”,二者不斷迭代,你追我趕。今天檢測技術(shù)提出了用眼球的反射光進(jìn)行檢測,明天換臉技術(shù)就可以把眼球的反射光模擬也放在學(xué)習(xí)內(nèi)容之中。檢測技術(shù)必須不斷更新,才能跟上技術(shù)發(fā)展的步伐。
第三點是,檢測技術(shù)距自動化還有一定距離。現(xiàn)有的檢測技術(shù)耗費的時間都比較長,難以做到在用戶上傳視頻的同時,短時間內(nèi)自動完成檢測和審核。距實用的自動檢測軟件,還有一段路要走。
第四點是,目前針對技術(shù)還沒有完善的法規(guī)。各個視頻平臺對于什么樣的視頻是惡意的、違規(guī)的,有著自己的界定規(guī)則。同時,目前也沒有關(guān)于技術(shù)的相關(guān)法律。這就給針對視頻的檢測、管控工作帶來了很多困難。
雖然檢測技術(shù)仍有諸多挑戰(zhàn),但是我們要相信,隨著AI技術(shù)的不斷發(fā)展,相關(guān)法規(guī)會逐漸完善,針對的檢測技術(shù)也會變得越來越準(zhǔn)確、高效。終有一天,虛假的視頻會在檢測技術(shù)的“火眼金睛”下統(tǒng)統(tǒng)現(xiàn)出原形。鉆技術(shù)的漏洞,濫用技術(shù),遲早會受到懲罰。
參考文獻(xiàn)
( Hu S , Li Y , Lyu S . GAN- [J]. 2020.)
聲明:本站所有文章資源內(nèi)容,如無特殊說明或標(biāo)注,均為采集網(wǎng)絡(luò)資源。如若本站內(nèi)容侵犯了原著者的合法權(quán)益,可聯(lián)系本站刪除。