🏂🏾 🤛🏼 🏩 AI，实践课程。图像预处理和添加 📜 🚤 ✅

预处理是在传输数据模型之前对数据执行的所有操作的总称，包括居中，归一化，平移，旋转，修剪等。通常，在两种情况下需要进行预处理。

数据清理 。假设图像中存在一些伪像。为了促进模型训练，必须在预处理阶段删除工件。
数据加法 。有时，小的数据集不足以进行高质量的深度模型训练。数据补充方法对于解决此问题非常有帮助。这是以各种方式转换每个数据样本并将此类修改后的样本添加到数据集的过程。这样，可以增加数据集的有效大小。

让我们考虑一下预处理过程中的一些可能的转换方法，以及它们通过Keras实施的方法。

资料

在本文和后续文章中，将使用数据集来分析图像的情感色彩。它包含1,500个图像示例，分为正反两类。让我们看一些例子。

负面的例子

积极的例子

清洗转换

现在考虑一组通常用于清理数据，其实现和对图像的影响的可能转换。

所有代码段都可以在Preprocessing.ipynb一书中找到。

重新缩放

图像通常以RGB（红色绿色蓝色）格式存储。以这种格式，图像由三维（或三通道）阵列表示。

图像的RGB分解。 图表取自Wikiwand

一个维度用于渠道（红色，绿色和蓝色），另外两个维度代表位置。因此，每个像素用三个数字编码。每个数字通常存储为8位无符号整数类型（0到255）。

重新定标是通过简单地将数据除以预定常数来更改数据数值范围的操作。在深度神经网络中，由于可能的溢出，优化问题，稳定性等，可能有必要将输入数据限制为0到1的范围。

例如，我们从[0; 255]到[0; 1]。在下文中，我们将使用Keras ImageDataGenerator类，该类允许您即时执行所有转换。

让我们创建该类的两个实例：一个用于转换后的数据，另一个用于源：

（或用于默认数据）。只需要指定比例常数。此外， ImageDataGenerator类允许您使用flow_from_directory方法直接从硬盘驱动器上的文件夹中流式传输数据。

所有参数都可以在文档中找到，但是主要参数包括：流的路径和目标图像大小（如果图像与目标大小不匹配，则生成器将对其进行剪切或构建）。最后，我们从生成器中获取样本并考虑结果。

在视觉上，两个图像都是相同的，但这是因为Python *工具会自动调整图像大小

到默认范围，以便它们可以显示在屏幕上。考虑原始数据（数组）。如您所见，原始地块相差255倍。

灰阶

另一种可能有用的转换是灰度，它将彩色RGB图像转换为所有颜色均以灰色阴影表示的图像。常规图像处理可以结合随后的阈值使用灰度转换。这对变换可以拒绝噪点像素并定义图像中的形状。今天，所有这些操作都是由卷积神经网络（CNN）执行的，但是将灰度转换作为预处理步骤仍然有用。使用相同的生成器类在Keras中运行此步骤。

在这里，我们仅创建该类的一个实例，并从中获取两个不同的生成器。第二个生成器将color_mode参数设置为“灰度”（默认值为“ RGB”）。

居中样本

我们已经看到原始数据的值在从0到255的范围内。因此，一个样本是从0到255的三维数字数组。根据优化的稳定性原理（摆脱值消失或饱和的问题）， 可能有必要对数据集进行标准化因此每个数据样本的平均值为0 。

为此，有必要计算整个样本的平均值，然后从给定样本中的每个数字中减去该平均值。
在Keras中，这是使用samplewise_center参数完成的。

样品标准偏差的归一化

此预处理阶段基于与样本居中相同的思想，但不是将平均值从设置为0，而是将标准偏差设置为1。

标准偏差的归一化由参数samplewise_std_normalization控制。应该注意的是，这两种标准化样本的方法经常一起使用。

此转换可用于深度学习模型中，以通过减少爆炸梯度的影响来提高优化稳定性。

功能中心

前两节使用归一化技术来查看每个单独的数据样本。标准化过程还有另一种方法。将图像数组中的每个数字视为一个符号。那么每个图像都是一个特征向量 。数据集中有许多这样的向量。因此，我们可以将它们视为未知分布。此分布是多参数的，其尺寸将等于要素的数量，即宽度×高度×3。尽管数据的真实分布是未知的，但您可以尝试通过减去平均分布值来对其进行归一化。应当注意，平均值是相同维度的向量，即，它也是图像。换句话说，我们对整个数据集求平均值，而不是对一个样本求平均值。

有一个特殊的Keras参数，称为featurewise_centering ，但不幸的是，截至2017年8月，其实现存在错误；因此，我们自己实施。首先，我们考虑内存中的整个数据集（我们可以负担得起，因为我们要处理的是很小的数据集）。为此，我们将数据包大小设置为数据集的大小。然后，我们在整个数据集上计算平均图像，最后从测试图像中减去它。