Netology数据科学负责人Elena Gerasimova翻译了 Lai Queffelec 的一篇文章,介绍了抚养孩子和教授AI的过程是如何相似的。如果像我一样,您抚养长大的孩子并同时教授算法,那么很可能您将这两个过程进行了比较。 即使您不喜欢人工智能,但对儿童却了解很多,也欢迎您进入机器教育的美好世界……哎呀,机器学习。
在撰写本文时,没有一个孩子受伤。 就像我的父母一样,我花了很多时间观察我的孩子如何学习世界,并惊讶地看到他的行为方式。 就像数据科学家所做的那样,观察训练/测试样本的结果(
用于训练算法的训练数据样本/对新数据起作用的算法的结果-大约为Ed )。
“起初他像软木塞一样愚蠢”
这是《人工智能市场营销:实际应用》一书的作者
吉姆·斯特恩 (
Jim Stern )的话,摘自关于机器学习的讲座-并非关于孩子(我爱孩子!)。
机器学习的本质是实际上要
教机器执行特定的任务,就像父母梦想着教孩子如何收集脏衣服并将其放在洗衣机中,而爸爸妈妈则在沙发上休息(承认吗,尝试过吗?)。
但是,主要的区别在于,当一个孩子被要求洗衣服时,他已经知道衣服是什么样子了。 他知道如何走路,抓握,拉动和折叠-他在年轻时就学会了这些动作。
那么,最终神奇地洗衣服的钥匙在哪里开了呢? 上下文。 我们给孩子们一些例子:我们展示了如何执行每个步骤,并感谢他们正确地完成了每件事-因为我们爱他们。
在很大程度上,机器学习是相同的,只是“虚拟孩子”仍然具有新生的经验,具有长大的婴儿的能力。 因此,您必须从头开始进行解释:这五个类似于香肠的东西,是在一根长香肠状棒的末端伸出来的,是棍子,手指,手和手掌。 只有这样,您才应该展示如何使用它们执行必要的操作-抓取和拉动。 您提供给机器的数据集是入门所需的一切,也是世界上存在的一切。 她还没有拥有的是...
...常识
通常,人们会区分成功的男人和女人。 我的儿子利亚姆(Liam)在这方面也做得很好-我在输入时没有给他提供大量的标记数据。 我没有和他坐在公园里,也没有指出人们在说“男人,男人,女人,男人,女人”,因为老实说,那很奇怪。 是的,不需要。 机器无法获得儿童拥有的常识性奢侈品,并且在初次遇到新概念时就已经使用了。
按照常识,我的意思是:
根据逻辑思维和经验做出正确决定和做出正确假设的能力-维基词典当然,当孩子决定从高处跳入地面时,我们有理由怀疑他具有常识。 尽管如此,它仍然存在,并允许儿童从他们的全部经验中学到东西。 而且,没有人清楚地向他们广播如何学习区分男人和女人。
我向非数据学家解释AI的主题,我喜欢使用一个类比。 孩子只需要一点观察,几个例子和一些纠正就可以学会说“先生”或“太太”。 而要训练一辆汽车做同样的事情,您需要给它上千张照片。 缺乏常识可能是汽车尚未准备好占领世界的第一原因。
规范和奇数
利亚姆(Liam)做奇怪的事情,例如,吃热狗,把它的末端抱住,在中间咬住。 标准的反应是告诉他:“利亚姆! 他们不这样做!” 但是后来我退缩了,认为“开箱即用”的决定并不是我能给他的最好的决定。 尽管当他试图用鼻子hold住汤匙时,他确实必须在桌子上设定可接受行为的界限。
这是婴儿和汽车之间的巨大相似之处-它们没有社会规范和偏见(或来自英国偏见的贝叶斯-)。 这就是父母与科学家日期之间的区别。 需要给孩子们一些价值观和社会规范,以帮助他们建立自己的经验。 “好的边界”,我们称其为“边界”。 作为数据科学家,您很可能扮演相反的角色。 机器必须没有您自己的规范和偏见。 算法中的偏见或成瘾非常危险。
每个人都喜欢八卦和炒作。 例如,
亚马逊的AI招聘者是性别歧视者(
亚马逊的招聘AI是性别歧视者 ),或者
FaceApp的 “改善”过滤器是种族主义者(
FaceApp的“热门”过滤器是种族主义者 )。 这是向与数据科学无关的人们解释科学家的角色和科学家的任职时间在很大程度上降低了防止偏见并创建尽可能符合道德的算法的好方法。
相关和因果关系
Xkcd图片来源相关并不意味着因果关系。 而且,尼古拉斯·凯奇(Nicolas Cage)并不是在游泳池中招致溺水的怪兽(
请在闲暇时阅读 )。 不过,我了解到这个规则对孩子并不明显。
不久前,我与全家度假,我告诉孩子我要吃饭了,并开始在盘子上铺食物。 就是在那一刻,他哭了起来,对我大喊(“别吃,妈妈!!!”),拍我的手,把插头从我的手敲下来。
当我设法从地板上捡起下巴时,我试图了解我的孩子是否是一个不想让母亲吃东西的怪物,仅两天后,他躺在床上睡觉,她才意识到一切都来自哪里。
我们的日常工作如下:我下班回来,给婴儿喂奶,洗澡,上床,然后终于吃了。 结果,每次我把婴儿躺在床上,给他看书时,我晚上都这样说:“妈妈要吃饭了。” 之后,我将孩子独自留在接下来的10-12个小时的睡眠中。 由于这种相关性,他的思想引起了因果关系:“如果我的母亲要吃饭,她很快就会离开我一个人。” 喔...
在这里,母亲的任务是改变这种方式,以使儿子不了解食物和分离之间的联系。 在Data Scientist中,如果机器选择了错误的症状或原因,则主要任务是确认错误。
回到亚马逊未能成功地将AI用作招聘工具。 他们用来评估候选人的10年数据样本更容易选择男性,因为“大多数履历都是从男性那里获得的,这反映了男性在技术行业中的统治地位。”
现在,亚马逊的AI似乎在说:“嘿,大多数申请人是男性,所以你必须雇用男性,如果有女性寄了简历,我会把它扔掉,因为那是一个异常现象。”
不,AI 它只会使您成为性别歧视者。 在这里,孩子们有优势(大人,让我们保持乐观):学会不做性别歧视永远不会太晚。
父母身份和数据科学都与人有关。
没有一个单亲父母会把抚养孩子的事情称为愉快和轻松(如果有人仍然这样说,他会大胆撒谎)。 每个父母都必须不断问自己一个问题:“婴儿学到了什么?” 并适应其不断发展的神经网络。
在某种程度上,数据科学家负有相同的责任。
在数据科学家公司雇用或学习时,不能指望所有工作只会与编程相关联。 这相当于期望一个快乐的成年人可以像狗一样训练他,并命令他“坐着”和“翻身”他整个童年,从而从孩子那里抚养长大。 从经验来看,这一直有效,直到孩子6个月大为止。一旦他学会了如何翻身,就该教他一些人类的知识了。
那么,哪个更容易-抚养孩子或抚养汽车?
我将在这里留下一个咧着嘴笑的图释。 如果您是父母,那么您已经了解了一切。
来自编辑