📈 🔅 ✍🏽 AI在生成人脸时会穿透什么 🍂 🏩 🙏

2014年，机器学习研究员Jan Goodfellow提出了生成竞争网络（GAN）的概念。 “具有创造力”的事实在于，他们的工作结果是图像，而不是对输入的评估（例如“是否有热狗”）和“竞争性”，即两个神经网络像伪造的伪装动物一样玩猫捉老鼠：一个神经网络试图通过创建逼真的图片来欺骗另一个神经网络，第二个神经网络则试图区分伪造的事物。

最初的GAN图像易于识别。看看2014年的这些面孔。

Radford等人，“利用深度卷积生成竞争网络进行无老师学习来表示”（2014年）。

但是， 2017年10月以来最后生成的面孔已经很难识别。

Karras等人，“渐进式GAN增长以改善质量，稳定性和多样性”（2017年），也称为PGAN或ProGAN

这是GAN生成的图像的一些功能。我们将重点放在面孔上，因为它们是研究人员的通用测试平台，并且许多最明显的伪像出现在其他类型的图像中。

直发看起来像油漆

长长的头发通常看起来直发肥大，就好像有人用调色刀或巨大的刷子涂抹了一堆丙烯酸树脂一样。

文字不可解密

如果GAN训练在脸上，那么她很难在背景中找到稀有的结构化物体。此外，GAN在图像的标准版和镜像版上均受过训练，这在建模文本（通常仅以一种方向显示）时会导致问题。

超现实的背景

生成的面孔看起来可信的原因之一是因为所有训练图像都居中。这减少了例如眼睛和耳朵的产生中的变化。另一方面，背景可以包含任何内容。建模太困难了，因此神经网络最终会复制一般的背景纹理，而不是“真实”的背景场景。

不对称

GAN可能难以管理距离较远的依赖项。例如，配对的配件（例如耳环）通常在数据集中匹配，但在创建的图像中不匹配。这些照片中的眼睛通常朝着相同的方向，并且通常是相同的颜色，并且所产生的脸部经常患有斜视和异色症。不对称经常出现在不同高度或大小的耳朵上。

奇怪的牙齿

GAN可以组成一个共同的场景，但是目前正面临着诸如牙齿之类的半规则重复性细节的困难。有时，GAN会以奇怪的方式发出弯曲的牙齿，拉伸或咬紧单个牙齿。从历史上看，该问题已在其他领域表现出来，例如使用砖块之类的图像合成纹理。

混乱的头发

这是识别伪造图像的最快方法之一。通常，GAN将头发收集成团块，在肩膀周围形成随机的束，然后将粗毛粗毛扔到额头上。真实的发型非常多样且详细，使其成为现实GAN生成中最困难的对象之一。异物有时会变成毛茸茸的纹理。

难以理解的地板

该GAN在CelebA套件中接受了训练，其中包含10,000名名人的200,000张图像。在这个场景中，我没有同时见到面发，耳环和化妆的任何人。但是GAN经常混合使用不同性别的典型特征。总的来说，我认为这是由于GAN并不总是对人类社会所接受的相反的二元类别（在这种情况下为“男人对女人”）有一个认识。

半常规噪声

代替单色背景，某些区域可能会接收到带有水平或垂直条纹的半规则噪声。在上述情况下，网络可能正在尝试模仿织物的质地。较旧的GAN会产生更明显的噪声，通常被称为国际象棋文物。

彩虹耀斑

一些浅色实心填充区域会发出多种颜色的耀斑：这些是领子，脖子和白眼睛（此处未显示）。

真实图像的例子

注意清晰的背景，文字，成对的耳环，相同大小的牙齿，详细的发型。了解所有GAN技巧后，尝试玩游戏并检查如何区分真人面孔和假面孔。 注意：有些按钮在“开始”按钮上有问题 。

AI在生成人脸时会穿透什么