卡内基·梅隆大学的研究人员创造了最可信的“ deepfakes”

听说过“深造假”吗? AI将一个人的脸覆盖在另一个人的身体上,被用来在无数视频片段中用Nicholas Cage代替Harrison Ford,并且出于更令人发指的目的:名人在他们不知情的情况下出现在色情和宣传中。 现在,无论好坏,卡内基梅隆大学的研究人员已经开发了一种新的,功能更强大的通用系统。


它称为“ Recycle-GAN”。 这是一种系统,用于仅按照输入的未分配数据进行学习(无需教师培训),就可以像转换另一幅视频或照片一样转换一个视频或照片的内容。 “研究人员说,在保持原始风格的同时改变内容的任务有很多用途,例如,将一个人的动作和面部表情应用到另一个人上,研究人员使用“ do as I”方法训练机器人,或者将黑白视频转换成彩色视频。”

到目前为止,即使是最先进的变换方法也都针对人脸,而且据研究人员称,“除了它们在部分隐藏的脸部中效果极差”之外,“它们几乎不可能应用于其他领域”。 其他方法使用逐帧转换,这需要费力的手动标记和数据对齐。

图片

Recycle-GAN使用生成对抗网络(GAN)和“时空标记”来“链接”两个图片或视频。 (GAN是由生成器组成的模型,该生成器试图通过从输入数据中产生越来越真实的结果来“欺骗”鉴别器。)在与人进行视频训练时,它们会创建带有难以捉摸的瞬间的视频,例如笑容形成的脸颊上的酒窝和嘴唇运动。

开发团队写道:“没有任何与视频细节有关的干预和基础知识,我们的方法就能简单地使用互联网上可公开访问的主题视频来学习。”

Recycle-GAN的功能远不止传送面部表情。 研究人员用它通过在大风天转变为完全平静来改变视频中的天气条件。 他们模仿盛开和垂死的花朵,并通过互联网上的视频合成了令人信服的日出。


测试结果相当不错:该系统在28.3%的情况下成功欺骗了15个主题,但研究小组认为,如果考虑到回放速度,例如该系统中视频中人们说快或慢的速度,则该系统的未来版本的产品会更可信。

该团队写道:“合理的样式转换甚至应该能够考虑到语音/内容再现所造成的时间差异。” “我们相信神经网络的最佳时空架构可以在不久的将来解决这个问题。”


不足为奇的是,deepfake仍然是一个热门话题。 公开提供的服务使创建它们相对容易,并且没有法律依据来保护此类视频的受害者。

Reddit,Pornhub,Twitter和其他人都表示反对,研究人员(最近加入了美国国防部)继续寻找探测深造的方法。 但是,正如圣塔克拉拉大学的法学教授兼高科技研究所所长埃里克·高德曼(Eric Goldman)最近表示,最好“为生活在一个真实,伪造的照片和视频都围绕着我们的世界里做准备”。

Source: https://habr.com/ru/post/zh-CN420541/


All Articles