2014年,机器学习研究员Jan Goodfellow提出了
生成竞争网络 (GAN)的概念。 “具有创造力”的事实在于,他们的工作结果是图像,而不是对输入的评估(例如“是否有热狗”)和“竞争性”,即两个神经网络像伪造的伪装
动物一样
玩猫捉老鼠 :一个神经网络试图通过创建逼真的图片来欺骗另一个神经网络,第二个神经网络则试图区分伪造的事物。
最初的GAN图像易于识别。 看看
2014年的这些面孔 。
Radford等人,“利用深度卷积生成竞争网络进行无老师学习来表示”(2014年)。但是,
2017年10月以来最后生成的面孔已经很难识别。
Karras等人,“渐进式GAN增长以改善质量,稳定性和多样性”(2017年),也称为PGAN或ProGAN这是GAN生成的图像的一些功能。 我们将重点放在面孔上,因为它们是研究人员的通用测试平台,并且许多最明显的伪像出现在其他类型的图像中。
直发看起来像油漆

长长的头发通常看起来直发肥大,就好像有人用调色刀或巨大的刷子涂抹了一堆丙烯酸树脂一样。
文字不可解密

如果GAN训练在脸上,那么她很难在背景中找到稀有的结构化物体。 此外,GAN在图像的标准版和镜像版上均受过训练,这在建模文本(通常仅以一种方向显示)时会导致问题。
超现实的背景

生成的面孔看起来可信的原因之一是因为所有训练图像都居中。 这减少了例如眼睛和耳朵的产生中的变化。 另一方面,背景可以包含任何内容。 建模太困难了,因此神经网络最终会复制一般的背景纹理,而不是“真实”的背景场景。
不对称

GAN可能难以管理距离较远的依赖项。 例如,配对的配件(例如耳环)通常在数据集中匹配,但在创建的图像中不匹配。 这些照片中的眼睛通常朝着相同的方向,并且通常是相同的颜色,并且所产生的脸部经常患有斜视和异色症。 不对称经常出现在不同高度或大小的耳朵上。
奇怪的牙齿

GAN可以组成一个共同的场景,但是目前正面临着诸如牙齿之类的半规则重复性细节的困难。 有时,GAN会以奇怪的方式发出弯曲的牙齿,拉伸或咬紧单个牙齿。 从历史上看,该问题已在其他领域表现出来,例如使用砖块之类的图像
合成纹理 。
混乱的头发

这是识别伪造图像的最快方法之一。 通常,GAN将头发收集成团块,在肩膀周围形成随机的束,然后将粗毛粗毛扔到额头上。 真实的发型非常多样且详细,使其成为现实GAN生成中最困难的对象之一。 异物有时会变成毛茸茸的纹理。
难以理解的地板

该GAN在
CelebA套件中接受了训练,其中包含10,000名名人的200,000张图像。 在这个场景中,我没有同时见到面发,耳环和化妆的任何人。 但是GAN经常混合使用不同性别的典型特征。 总的来说,我认为这是由于GAN并不总是对人类社会所接受的相反的二元类别(在这种情况下为“男人对女人”)有一个认识。
半常规噪声

代替单色背景,某些区域可能会接收到带有水平或垂直条纹的半规则噪声。 在上述情况下,网络可能正在尝试模仿织物的质地。 较旧的GAN会产生更明显的噪声,通常被称为
国际象棋文物 。
彩虹耀斑

一些浅色实心填充区域会发出多种颜色的耀斑:这些是领子,脖子和白眼睛(此处未显示)。
真实图像的例子

注意清晰的背景,文字,成对的耳环,相同大小的牙齿,详细的发型。 了解所有GAN技巧后,尝试玩
游戏并检查如何区分真人面孔和假面孔。
注意: 有些按钮在“开始”按钮上有问题 。