面向所有八年级学习数学的人的机器学习

哈Ha! 我向您介绍由凯尔·加拉廷(Kyle Gallatin)撰写的文章“面向八年级数学学习者的机器学习”


机器学习


我通常会注意到,可以通过以下两种方式之一来解释人工智能:通过各种媒体日益引起轰动的棱镜,或者通过过多的语言和特定于区域的术语所渗透的密集的科学文献。


在这两种极端之间,我认为文学的出版领域应该少一些。 像笨拙的Sophia机器人这样的突发新闻围绕人工智能进行了大肆宣传,这看起来像是人类的意识,而实际上Sophia并不比AOL Instant Messenger的SmarterChild聪明


科学文献可能会变得更糟,甚至在几段毫无意义的伪知识垃圾之后,甚至最精明的研究人员都不得不闭上眼睛。 要正确评估AI ,人们通常必须了解它的真正含义。 而且您需要了解人工智能的基础知识只是一点点高中数学。


我可能会过于简化了-我会请数学,数据科学和工程学领域的所有同事容忍我的解释-有时这是艺术科学所需要的。


人工智能和机器学习基础


典型的经典人工智能是模仿人类智能的全部。 从视频游戏机器人到Deepmind Alphago之类的复杂平台,任何东西都可以。


人工智能机器学习深度学习
忽略深度学习-在这种情况下,它与机器学习相同。 图片: 地理空间世界


机器学习是人工智能的子集。 这使机器可以从实际数据中“学习”,而不是按照一组预定义的规则进行操作。


但是学习意味着什么? 它可能不像看起来那样具有未来性。


我最喜欢的解释:机器学习就是 在裂缝上。 如果您看过类似《 黑镜》的影片 ,就很容易将现代人工智能想象为一种有意识的存在,即思考,感觉和做出困难的决定。 这在媒体中更为普遍,在这种媒体中,依次对AI进行个性化,然后与《终结者》的天网或电影《黑客帝国》相提并论。


实际上,事实并非如此。 在目前的状态下,人工智能只是数学。 有时它是复杂的数学,有时它需要计算机科学,统计学和其他领域的深入知识。 但是最后,现代AI的核心只是一个数学函数。


如果您不是数学函数的朋友,请不要担心,因为您不会记住或使用它们。 要了解要点,我们只需要记住一些简单的事情:有一个输入( ),并且有一个出路( ),那么函数就是输入和输出之间发生的事情-它们之间的连接。


我们可以让计算机查看收件箱( )和传出( )数据并找出将它们绑定在一起的内容。

超级简化人工智能的一个例子是表示为 。 我们已经知道 (来自下表); 我们只需要找到 了解之间有什么关系


(输入)(退出)
1个2
23
34
45

表格: Kyle Gallatin


为了获得此模板 来自 我们需要乘以 在1( )并加1( ) 这样功能就会出来


太好了! 我们已经确定 。 我们只是从上表中获取了一些数据,并创建了一个描述它们的函数。 本质上,这是机器学习。 现在,使用获得的函数,我们可以假设等于 用于其他输入数据


有趣的部分是如何教会机器查找最能描述数据的功能,但是当您完成处理后,通常会得到某种形式的信息 。 一旦获得此函数,我们还可以将其绘制在图形上:
线性方程
Tecmath视频的屏幕截图


有关功能的更详细说明, Math Is Fun提供了一个直观而简单的网站(即使该名称对您来说是一个潜在的危险信号,并且该网站看起来像他们的Web设计师在2000年代初期逃脱了)。


人们将无法数数,汽车将无法数数


明显地 是一个非常简单的例子。 机器学习存在的唯一原因是因为人们无法查看数以百万计的输入和输出数据点,而无法提供描述结果的复杂功能。 相反,我们可以训练计算机为我们执行此操作。


无论如何,应该有足够的数据来找到正确的功能。 如果我们只有一个数据点 ,我们和机器都无法预测一个确切的函数。 在原始示例中, 功能可能是 或许多其他 如果我们没有足够的数据,则当我们尝试将其用于更多数据时,计算机发现的功能可能会导致很多错误。


此外,真实数据并不总是那么完美。 在下面的示例中,机器已识别出与大多数数据相对应的几个功能,但是该线并没有穿过每个点。 与前面的示例使用来自数学类的表格不同,从现实世界中收集的数据更加不可预测,并且永远无法完整描述。


回归分析
这个基本示例显示了机器如何学习以最佳方式描述所呈现的数据。 图片:迈向数据科学


最后,人们不能做的最后一件事就是看一堆变量。 它只是在使用 但是,如果输入变量更多,该怎么办? 如果呢 影响 ,... 。 很快,功能会变得更加复杂(对人而言)。


现实世界的机器学习和人工智能


让我们看一个真实的例子。 我从事制药领域的工作,因此假设我们有一个与癌症相关的数据集,其中有两个输入变量对应于肿瘤的大小-半径和周长,然后退出,具有两个可能的值:肿瘤是良性还是转移性(潜在危险)一生)。 看起来似乎很复杂,但是我们只需要应用一个熟悉的概念


  • 是诊断,可能为0(良性)或1(转移性)。
  • -半径。
  • -周边。
  • 每个 有你的未知数 ; 叫他们
  • -未知常数。

现在我们的线性方程是什么样的? 与上面的示例没有太大区别:



如前所述,我们正在超越人类可能性的范围。 因此,我们使用机器来代替查看数据并试图找出应该乘以变量的方式。 他们将为我们做到这一点,我们将对诊断进行准确的评估。 这就是机器学习!


当然,即使是最详细的多因素数据也不是理想的,因此我们的机器学习模型也不会那样。 但是在100%的情况下,我们不需要它们是正确的。 我们只需要他们想出最好的功能,就适合大多数情况。




这篇文章仅涉及了机器学习中不可思议的数学和计算机科学的表面。 但是即使在复杂的层次上,概念也是相同的。 不管机器学习和人工智能看起来多么令人印象深刻或奇怪,这一切都源于机器学习以最佳方式描述数据的功能。

Source: https://habr.com/ru/post/zh-CN449558/


All Articles