在人工智能教学的所有任务中,都有一个令人不快的现象-训练序列标记中的错误。 这些错误是不可避免的,因为所有标记都是手动完成的,因为如果有一种以编程方式标记真实数据的方法,那么为什么我们需要其他人教他们进行标记,并花时间和金钱来创建绝对不必要的设计!
在大量训练序列中查找和删除假面具的任务非常复杂。 您可以手动查看所有内容,但这不会使您免于重复的错误。 但是,如果仔细看一下
先前文章中提出的用于研究神经网络的工具,就会发现有一种简单有效的方法可以从训练序列中检测和提取所有伪像。
在这篇文章中有一个具体的例子,很明显,对于普通的U型网络,用椭圆和多边形表示的简单例子再次成为沙盒中的乐高玩具,但它异常具体,有用和有效。 我们将展示一种简单的方法如何识别并找到几乎所有工件,训练序列的所有谎言。
因此,让我们开始吧!
和以前一样,我们将研究图片/遮罩对的顺序。 在随机选择的不同季度的图片中,我们还将放置一个随机大小的椭圆和任意大小的四边形,并且两种颜色都使用相同的颜色,并且还随机选择了其中的两个。 在剩下的第二种颜色中,我们为背景着色。 椭圆和四边形的尺寸当然是有限的。
但是在这种情况下,我们将更改引入结对生成程序中,并与完全正确的蒙版一起准备一个不正确的蒙版,该蒙版被谎言毒害-在大约百分之一的情况下,用椭圆替换蒙版中的四边形,即 真正的分割对象用假蒙版表示为椭圆,而不是四边形。
随机例子10
随机10的示例,但来自错误的标记。 上遮罩为true,下遮罩为false,训练序列中的数字显示在图片中。
对于细分,我们采用相同的指标和损失计算程序以及相同的简单U-net,但我们不会使用Dropout。
图书馆import numpy as np import matplotlib.pyplot as plt from matplotlib.colors import NoNorm %matplotlib inline import math from tqdm import tqdm
度量和损失函数 def dice_coef(y_true, y_pred): y_true_f = K.flatten(y_true) y_pred = K.cast(y_pred, 'float32') y_pred_f = K.cast(K.greater(K.flatten(y_pred), 0.5), 'float32') intersection = y_true_f * y_pred_f score = 2. * K.sum(intersection) / (K.sum(y_true_f) + K.sum(y_pred_f)) return score def dice_loss(y_true, y_pred): smooth = 1. y_true_f = K.flatten(y_true) y_pred_f = K.flatten(y_pred) intersection = y_true_f * y_pred_f score = (2. * K.sum(intersection) + smooth) / (K.sum(y_true_f) + K.sum(y_pred_f) + smooth) return 1. - score def bce_dice_loss(y_true, y_pred): return binary_crossentropy(y_true, y_pred) + dice_loss(y_true, y_pred) def get_iou_vector(A, B):
普通U网 def build_model(input_layer, start_neurons):
用于生成图片和遮罩的程序-正确和错误。 图片的第一层放置在数组中,第二层是真实蒙版,第三层是错误蒙版。
def next_pair_f(idx): img_l = np.ones((w_size, w_size, 1), dtype='float')*0.45 img_h = np.ones((w_size, w_size, 1), dtype='float')*0.55 img = np.zeros((w_size, w_size, 3), dtype='float') i0_qua = math.trunc(np.random.sample()*4.) i1_qua = math.trunc(np.random.sample()*4.) while i0_qua == i1_qua: i1_qua = math.trunc(np.random.sample()*4.) _qua = np.int(w_size/4) qua = np.array([[_qua,_qua],[_qua,_qua*3],[_qua*3,_qua*3],[_qua*3,_qua]]) p = np.random.sample() - 0.5 r = qua[i0_qua,0] c = qua[i0_qua,1] r_radius = np.random.sample()*(radius_max-radius_min) + radius_min c_radius = np.random.sample()*(radius_max-radius_min) + radius_min rot = np.random.sample()*360 rr, cc = ellipse( r, c, r_radius, c_radius, rotation=np.deg2rad(rot), shape=img_l.shape ) p0 = np.rint(np.random.sample()*(radius_max-radius_min) + radius_min) p1 = qua[i1_qua,0] - (radius_max-radius_min) p2 = qua[i1_qua,1] - (radius_max-radius_min) p3 = np.rint(np.random.sample()*radius_min) p4 = np.rint(np.random.sample()*radius_min) p5 = np.rint(np.random.sample()*radius_min) p6 = np.rint(np.random.sample()*radius_min) p7 = np.rint(np.random.sample()*radius_min) p8 = np.rint(np.random.sample()*radius_min) poly = np.array(( (p1, p2), (p1+p3, p2+p4+p0), (p1+p5+p0, p2+p6+p0), (p1+p7+p0, p2+p8), (p1, p2), )) rr_p, cc_p = polygon(poly[:, 0], poly[:, 1], img_l.shape) if p > 0: img[:,:,:1] = img_l.copy() img[rr, cc,:1] = img_h[rr, cc] img[rr_p, cc_p,:1] = img_h[rr_p, cc_p] else: img[:,:,:1] = img_h.copy() img[rr, cc,:1] = img_l[rr, cc] img[rr_p, cc_p,:1] = img_l[rr_p, cc_p] img[:,:,1] = 0. img[:,:,1] = 0. img[rr_p, cc_p,1] = 1. img[:,:,2] = 0. p_f = np.random.sample()*1000. if p_f > 10: img[rr_p, cc_p,2] = 1. else: img[rr, cc,2] = 1. i_false[idx] = 1 return img
备忘单计算程序 def make_sh(f_imgs, f_msks, val_len): precision = 0.85 batch_size = 50 t = tqdm() t_batch_size = 50 raw_len = val_len id_train = 1
主程序计算。 我们在上一篇文章中对同一程序进行了一些小的更改,并且一些变量需要说明和注释。
i_false = np.zeros((train_num), dtype='int')
有一个掩码错误指示器。 如果为1,则来自F_msks的掩码与来自f_msks的掩码不匹配。 这表明我们实际上正在寻找的东西-假面具。
m2_select = np.zeros((train_num), dtype='int')
指示在备忘单中选择了该图片。
batch_size = 50 val_len = batch_size + 1
我们建立图片/遮罩对的序列进行训练,并建立另一个序列进行测试。 即 我们将检查10,000对新的独立序列。 我们显示和视觉选择性地检查带有真假蒙版的随机图片。 显示了上面的图片。
在此特定情况下,获得了93个错误的蒙版,在该蒙版上将椭圆而不是四边形标记为真正。
我们从正确的位置开始训练,使用f_msks作为遮罩
input_layer = Input((w_size, w_size, 1)) output_layer = build_model(input_layer, 25) model = Model(input_layer, output_layer) model.compile(loss=bce_dice_loss, optimizer=Adam(lr=1e-4), metrics=[my_iou_metric]) v_false = make_sh(f_imgs, f_msks, val_len) t_pred = model.predict(t_imgs,batch_size=batch_size) print (get_iou_vector(t_msks,t_pred.reshape(-1,w_size ,w_size ,1)))
Accuracy 0.9807 loss 0.0092 selected img 404 tested img 10000 : : 1801it [08:13, 3.65it/s] 0.9895299999999841
该备忘单仅显示404张图片,并且在独立的测试序列上获得了可接受的准确性。
现在,我们重新编译网络并按照相同的训练序列进行训练,但是作为掩码,我们将F_msks和1%错误的掩码馈入输入
input_layer = Input((w_size, w_size, 1)) output_layer = build_model(input_layer, 25) model = Model(input_layer, output_layer) model.compile(loss=bce_dice_loss, optimizer=Adam(lr=1e-4), metrics=[my_iou_metric]) v_false = make_sh(f_imgs, F_msks, val_len) t_pred = model.predict(t_imgs,batch_size=batch_size) print (get_iou_vector(t_msks,t_pred.reshape(-1,w_size ,w_size ,1)))
Accuracy 0.9821 loss 0.0324 selected img 727 tested img 10000 : : 1679it [25:44, 1.09it/s] 0.9524099999999959
我们得到了727张图片的备忘单,该备忘单要好得多,并且测试预测的准确性与先前的测试序列相同,从0.98953降低到0.9525。 我们在训练序列中增加了不到1%的谎言,在10,000个口罩中只有93个是假的,但结果恶化了3.7%。 这不只是一个谎言,而是一个真正的狡猾! 备忘单也从404张增加到了727张。
抚慰和愉悦只有一件事
print (len(set(np.arange(train_num)[m2_select>0]).intersection(set(np.arange(train_num)[i_false>0])))) 93
让我解释一下这个长公式,我们将在备忘单中选择的图片集与虚假图片集相交,然后看到算法选择了备忘单中的所有93张虚假图片。
这项任务得到了极大简化,手动查看的图像不是10,000张,只有727张,所有的谎言都集中在这里。
但是,还有一种更加有趣和有用的方法。 当我们编写备忘单时,我们仅包括预测小于阈值的那些图片/蒙版对,在我们的特殊情况下,我们将预测精度的值保存到
v_false数组中。 让我们看一下训练序列中预测值非常小(例如小于0.1)的对,看看其中有多少个谎言
print (len(set(np.arange(train_num)[v_false<0.01]).intersection(set(np.arange(train_num)[i_false>0])))) 89
如您所见,错误掩码的主要部分(93个中的89个)掉入了这些掩码中。
np.arange(train_num)[v_false<0.01].shape (382,)
因此,如果我们仅手动检查382个口罩,并且不超过10,000个,我们将毫不留情地识别并销毁大多数错误口罩。
如果可以在决定将其包括在备忘单中的过程中查看图片和蒙版,则从一个步骤开始,所有错误的蒙版,所有谎言都将由经过稍微训练的网络的最低预测级别确定,并且正确的蒙版的预测将大于该级别。
总结一下
如果在某个想象的世界中,真相始终是四边形,而椭圆形的谎言和某个未知实体决定歪曲真相并称某些椭圆为真相,而四边形是假的,那么利用人工智能和自然能力制作备忘单,当地的宗教裁判所将迅速而轻松地找到并彻底彻底地消除谎言和欺骗。
PS能够检测椭圆形,三角形,简单多边形是创建任何可控制汽车的AI的先决条件。 如果您不知道如何查找椭圆形和三角形,那么您将找不到所有的路标,并且您的AI会落在错误的车上。