无需Python,Anaconda和其他爬行动物的机器学习

不,当然,我不认真。 在简化主题的范围上必须有一个限制。 但是对于最初的阶段,了解基本概念并快速“进入”该主题可能是允许的。 以及如何正确命名该材料(选项:“机器学习傻瓜”,“分析尿布数据”,“最小算法”),我们将在最后讨论。

为了业务。 他在MS Excel上编写了几个应用程序,用于可视化和分析数据时在不同的机器学习方法中发生的过程。 最终,根据所开发的大多数方法的文化媒体(顺便说一句,绝不是所有。),我们相信,最强大的“支持向量法”(SVM)是支持向量机,是我们同胞莫斯科管理学院的弗拉基米尔·瓦普尼克的发明。顺便说一句,1963年!然而,现在他在美国教书和工作。

三个文件进行审查

1. K-均值聚类


这类任务与“无师傅学习”有关,当我们需要将初始数据分解为预先已知的一定数量的类别,但是我们没有任何“正确答案”时,我们必须从数据本身中提取它们。 寻找鸢尾花亚种的基本古典问题(Ronald Fisher,1936年!)具有这种性质,被认为是该领域知识的第一个标志。

该方法非常简单。 我们有一组表示为矢量的对象(N个数字的集合)。 对于鸢尾花,这些是由4个数字组成的集合,这些数字代表一朵花:外部和内部花被裂片的长度和宽度( 艾里斯·费舍尔-维基百科 )。 作为对象之间的距离或接近度的度量,选择了通常的笛卡尔度量。

此外,任意地(或不任意地,见下文)选择聚类的中心,并且计算从每个物体到聚类的中心的距离。 此迭代步骤中的每个对象都标记为属于最近的中心。 然后,将每个簇的中心转移到其成员坐标的算术平均值上(类似于物理学,它也称为“质心”),然后重复该过程。

该过程收敛得足够快。 在二维图片中,它看起来像这样:

1.平面上点的初始随机分布和簇数



2.定义聚类中心并为聚类分配点



3.转移聚类中心的坐标,重新计算点,直到中心稳定为止。 可以看到群集中心到最终位置的轨迹。



您可以随时设置新的群集中心(而无需生成新的点分布!),并且可以看到分区过程并不总是唯一的。 从数学上讲,这意味着对于优化函数(从点到聚类中心的距离的平方之和),我们发现不是全局最小值,而是局部最小值。 可以通过非随机选择群集的初始中心或通过选择可能的中心来解决此问题(有时将它们精确地放置在某个点上是有利的,至少可以保证我们不会得到空的群集)。 无论如何,有限集始终具有确切的下界。

您可以在此链接上使用此文件进行播放 (不要忘记启用宏支持。将检查文件是否包含病毒)

维基百科方法说明-k-均值方法

2.多项式近似和数据分解。 再培训


数据科学的杰出科学家和普及者 沃龙佐夫简要地将机器学习方法称为“通过点绘制曲线的科学”。 在此示例中,我们将通过最小二乘法在数据中找到模式。

显示了将源数据分为“训练”和“控制”的技术,以及对数据进行再训练或“再训练”的现象。 有了正确的近似值,我们在训练数据上将有一定的误差,而在控制数据上将有稍大的误差。 如果不正确,那就是对训练数据的精确调整,并且控件上存在巨大的错误。

(众所周知的事实是,通过N个点可以绘制N-1st度的单个曲线,并且该方法通常无法提供所需的结果。Wikipedia上Lagrange插值多项式

1.我们设置初始分布



2.将分数按70:30的比例分为“训练”和“控制”。



3.我们为训练点绘制一条近似曲线,我们看到它在控制数据上产生的误差



4.我们在训练点上绘制了精确的曲线,并且在控制数据上看到了一个巨大的错误(训练上为零,但是那是什么意思?)。



当然,示出了具有单个分区为“训练”和“控制”子集的最简单的变体,在通常情况下,为了最佳地调整系数,反复进行此操作。

该文件位于此处,已进行防病毒检查。 打开宏以正常工作

3.梯度下降和误差动态


将有一个4维情况和线性回归。 线性回归系数将通过梯度下降法逐步确定,最初所有系数均为零。 单独的图表显示了随着系数的调整越来越精细,误差减少的动态。 可以看到所有四个二维投影。

如果您将梯度下降步幅设置得太大,那么很明显,每次我们都会跳过最小值,并且我们将以更大的步数得出结果,尽管最终我们还是会来(除非我们过多地触摸下降步幅,否则算法将“间距”)。 误差对迭代步骤的依赖性图将变得不平滑,而是“生涩的”。

1.生成数据,设置梯度下降步骤



2.通过正确选择梯度下降步骤,我们可以平稳,迅速地将变化降至最低



3.如果错误选择了梯度下降的步长,我们将跳过最大步长,误差图会变得“生涩”,收敛需要更多步长






4.如果选择了一个完全不正确的梯度下降步骤,我们将远离最小值



(要使用图片中所示的梯度下降步骤的值重现该过程,请选中“参考数据”框)。

文件-通过此链接,您需要启用宏,没有病毒。

根据一个受人尊敬的社区,这样的简化和表示方法可以接受吗? 我应该将文章翻译成英文吗?

Source: https://habr.com/ru/post/zh-CN446150/


All Articles