当我的第一个儿子只有两个时,他已经爱上了汽车,知道所有的品牌和型号(在我的帮助下,我的汽车比我还多),可以通过一小部分图像识别它们。 大家都说:天才。 尽管他们指出此知识完全徒劳。 同时,儿子与他们同睡,滚动它们,将它们精确地排成一排或正方形。

当他4岁时,他学会了数数,到5岁时,他已经可以乘以1000以内了。我们甚至玩过Math Workout(这款游戏在Android上是这样的-我喜欢下班后在地铁上进行计算),在某个时候,他开始对我了做到这一点。 闲暇时,他数到一百万,但后来却冻结了。 天才! 他们说,但是我们怀疑那根本不是。
顺便说一句,在市场上,他对母亲的帮助很好-他用计算器计算出的总金额比卖方快。
此外,他从未在球场上玩过,没有与同龄人交流,与花园里的孩子和老师相处得并不融洽。 总的来说,我是一个有点内向的孩子。
下一阶段是地理-我们试图将人们对数字的热爱引导到某个地方,并将我们的儿子交给一本旧的苏联地图集。 他投入了一个月,然后开始以以下方式向我们提出棘手的问题:
-爸爸,您认为哪个国家/地区大:巴基斯坦或莫桑比克?
“可能是莫桑比克,”我回答。
-在这里! 儿子高兴地答道,巴基斯坦的面积高达2350平方公里。

同时,他对这些国家的人民,他们的语言,服饰,民间音乐完全不感兴趣。 仅裸露的数字:面积,人口,矿产储量等。
大家再次钦佩。 他们说:“我的岁月很聪明,”但又一次感到担心,因为 我知道这是完全无用的知识,与生活经验无关,并且很难继续发展。 我发现的所有内容的最佳应用是一个建议,如果某个特定国家/地区用沥青将沥青卷起来(不考虑多山地形),但很快就停了下来,则可以计算出停车场可以容纳多少辆汽车。 它带有种族灭绝的痕迹。
有趣的是,此刻汽车的话题完全消失了,儿子甚至不记得他收藏的收藏中他最喜欢的汽车的名字了,我们开始对它失去兴趣。 然后他开始慢慢地盘算,很快就忘记了这些国家的地区。 同时,他开始与同龄人进行更多的交流,变得更加联系。 天才过去了,朋友们不再佩服,儿子成了一个好学生,对数学和精确科学很感兴趣。
重复-学习之母
看来,为什么要这样。 这在许多儿童中都观察到。 他们的父母向所有人宣布他们的孩子是天才,祖母则热情并且称赞孩子的“知识”。 然后,普通的聪明孩子从他们身上长出来,不比母亲儿子的朋友聪明。
在研究神经网络时,我遇到了类似的现象,在我看来,可以从这种类比中得出某些结论。 我不是生物学家或神经科学家。 所有这些-我的猜测并没有声称自己特别科学。 我很乐意对专业人士发表评论。
当我试图了解我的儿子如何学得如此陡峭以至于无法比我更快地计数时(他在20.4秒内通过了数学锻炼的水平,而我的成绩是21.9),我意识到他根本没有计数。 他记住,当出现55 + 17时,您需要按72。在45 + 38时,您需要单击83,依此类推。 起初,他当然会数,但是在他能够记住所有组合的那一刻,速度就突飞猛进了。 很快,他开始记住不是具体的铭文,而是符号的组合。 这正是在学校学习乘法表的方法-记住对应表MxN->P。
事实证明,他将大多数信息准确地理解为输入和输出之间的关系,并且我们用来滚动以获得答案的非常通用的算法并不仅简化为非常精确的高度专业化的用于计算两位数的算法。 他完成了一些出色的任务,但速度却慢得多。 即 对于每个人来说看起来超酷的东西实际上只是由训练有素的神经网络模拟完成的特定任务。
额外的知识
为什么有些孩子有能力记住这一点,而另一些却没有呢?
想象一下孩子的兴趣领域(这里我们定性地解决了这个问题,没有任何衡量标准)。 左侧是普通儿童的兴趣领域,右侧是“天才”儿童的兴趣领域。 不出所料,主要兴趣集中在特殊倾向的领域。 但是,在日常事务和与同伴的交流中,重点不再足够。 他认为这些知识是多余的。
 |  |
一个5岁普通儿童的兴趣 | 5岁“灿烂”儿童的利益 |
在这类儿童中,大脑仅对选定的主题进行分析和训练。 通过训练,大脑中的神经网络必须学会成功分类传入的数据。 但是大脑有很多神经元。 如此简单的任务远远超出了正常工作所必需的。 通常,在生活中,孩子们会解决许多不同的问题,但是在这里,所有相同的资源都被投入到更小的任务范围中。 在这种模式下进行培训很容易导致ML专业人员称之为过拟合。 使用大量系数(神经元)对网络进行训练,使其始终能够给出正确的答案(但可以完全废除中间输入数据,但没人能看到)。 因此,训练并不会导致大脑挑出主要特征并记住这些特征,而是会调节许多系数以对已知数据产生准确结果(如右图)。 此外,在其他主题上,大脑训练得很差,因此马马虎虎(如左图所示)。

什么是欠拟合和过拟合?对于那些不是主题的人,我会简短地告诉您。 训练神经网络时,任务是选择多个参数(神经元之间的通信权重系数),以便响应训练数据(训练样本)的网络尽可能紧密,准确地回答。
如果此类参数太少,则网络将无法考虑样本的详细信息,这将导致非常粗略和平均的答案,即使在训练样本中也无法很好地解决问题。 就像上面的左图一样。 这是不合时宜的。
使用足够数量的参数,网络将获得良好的结果,“吞噬”训练数据中的严重偏差。 这样的网络不仅会很好地响应训练集,而且还会响应其他中间值。 就像上面的中间图片一样。
但是,如果为网络提供了太多可配置的参数,则需要对其进行训练以重现甚至强烈的偏差和波动(包括由错误引起的偏差和波动),这在尝试从训练集中获取输入数据的答案时可能会导致完全的垃圾。 就像上面的右图一样。 这太合身了。
一个简单的说明性示例。

假设您有几个点(蓝色圆圈)。 您需要绘制一条平滑的曲线,以便预测其他点的位置。 例如,如果我们采用多项式,那么对于小角度(最多3或4),我们的平滑曲线将非常准确(蓝色曲线)。 在这种情况下,蓝色曲线可能无法通过起点(蓝色点)。
但是,如果增加系数的数量(并因此增加多项式的阶数),则蓝点通过的准确性将增加(或者甚至会达到100%的命中率),但是这些点之间的行为将变得不可预测(请参见红色曲线如何波动)。
在我看来,正是孩子对特定主题的偏爱(注视)以及对其余主题的完全无视,导致了这样一个事实,那就是在培训期间,这些主题被赋予了太多的“因素”。
考虑到网络是为特定的输入数据配置的,并且没有分配“功能”,而是愚蠢地“记住”了输入数据,因此不能将其与稍有不同的输入数据一起使用。 这种网络的适用性非常狭窄。 随着年龄的增长,视野扩大,焦点逐渐消失,不再有机会为同一任务分配尽可能多的神经元-它们开始被用于对孩子更必要的新任务中。 过度适应的网络的“设置”崩溃,孩子变成“正常”,天才消失。
当然,如果孩子本身具有有用的技能并且可以发展(例如,音乐或运动),那么他的“天才”可以维持很长时间,甚至可以使这些技能达到专业水平。 但是在大多数情况下,这种方法无法解决,并且根据过去的技能和经验,到8-10岁时也不会保留。
结论
- 你有一个聪明的孩子吗? 它会通过;)
- 视野和“天才”是相关的事物,它们通过学习机制精确地联系在一起
- 这个可见的“天才”-很可能根本不是天才,但是对一个特定任务进行过多的大脑训练却没有理解它的效果-只是所有资源都专用于该任务
- 在纠正孩子的狭interests兴趣时,他的天才消失了
- 如果您的孩子“聪明”并且比同龄人更有保留,那么您需要仔细培养这些相同的技能,同时积极地发展自己的视野,而不是专注于这些“酷”但通常无用的技能