AI在生成人脸时会穿透什么

2014年,机器学习研究员Jan Goodfellow提出了生成竞争网络 (GAN)的概念。 “具有创造力”的事实在于,他们的工作结果是图像,而不是对输入的评估(例如“是否有热狗”)和“竞争性”,即两个神经网络像伪造的伪装动物一样玩猫捉老鼠 :一个神经网络试图通过创建逼真的图片来欺骗另一个神经网络,第二个神经网络则试图区分伪造的事物。

最初的GAN图像易于识别。 看看2014年的这些面孔


Radford等人,“利用深度卷积生成竞争网络进行无老师学习来表示”(2014年)。

但是, 2017年10月以来最后生成的面孔已经很难识别。


Karras等人,“渐进式GAN增长以改善质量,稳定性和多样性”(2017年),也称为PGAN或ProGAN

这是GAN生成的图像的一些功能。 我们将重点放在面孔上,因为它们是研究人员的通用测试平台,并且许多最明显的伪像出现在其他类型的图像中。

直发看起来像油漆




长长的头发通常看起来直发肥大,就好像有人用调色刀或巨大的刷子涂抹了一堆丙烯酸树脂一样。

文字不可解密




如果GAN训练在脸上,那么她很难在背景中找到稀有的结构化物体。 此外,GAN在图像的标准版和镜像版上均受过训练,这在建模文本(通常仅以一种方向显示)时会导致问题。

超现实的背景




生成的面孔看起来可信的原因之一是因为所有训练图像都居中。 这减少了例如眼睛和耳朵的产生中的变化。 另一方面,背景可以包含任何内容。 建模太困难了,因此神经网络最终会复制一般的背景纹理,而不是“真实”的背景场景。

不对称




GAN可能难以管理距离较远的依赖项。 例如,配对的配件(例如耳环)通常在数据集中匹配,但在创建的图像中不匹配。 这些照片中的眼睛通常朝着相同的方向,并且通常是相同的颜色,并且所产生的脸部经常患有斜视和异色症。 不对称经常出现在不同高度或大小的耳朵上。

奇怪的牙齿




GAN可以组成一个共同的场景,但是目前正面临着诸如牙齿之类的半规则重复性细节的困难。 有时,GAN会以奇怪的方式发出弯曲的牙齿,拉伸或咬紧单个牙齿。 从历史上看,该问题已在其他领域表现出来,例如使用砖块之类的图像合成纹理

混乱的头发




这是识别伪造图像的最快方法之一。 通常,GAN将头发收集成团块,在肩膀周围形成随机的束,然后将粗毛粗毛扔到额头上。 真实的发型非常多样且详细,使其成为现实GAN生成中最困难的对象之一。 异物有时会变成毛茸茸的纹理。

难以理解的地板




该GAN在CelebA套件中接受了训练,其中包含10,000名名人的200,000张图像。 在这个场景中,我没有同时见到面发,耳环和化妆的任何人。 但是GAN经常混合使用不同性别的典型特征。 总的来说,我认为这是由于GAN并不总是对人类社会所接受的相反的二元类别(在这种情况下为“男人对女人”)有一个认识。

半常规噪声




代替单色背景,某些区域可能会接收到带有水平或垂直条纹的半规则噪声。 在上述情况下,网络可能正在尝试模仿织物的质地。 较旧的GAN会产生更明显的噪声,通常被称为国际象棋文物

彩虹耀斑




一些浅色实心填充区域会发出多种颜色的耀斑:这些是领子,脖子和白眼睛(此处未显示)。

真实图像的例子




注意清晰的背景,文字,成对的耳环,相同大小的牙齿,详细的发型。 了解所有GAN技巧后,尝试玩游戏并检查如何区分真人面孔和假面孔。 注意: 有些按钮在“开始”按钮上有问题

Source: https://habr.com/ru/post/zh-CN432580/


All Articles