数学是数据科学的基石。 尽管某些定理,公理和公式似乎过于抽象并且与实践相距甚远,但实际上,如果没有它们,就不可能真正地分析和系统化庞大的数据集。
下列数学领域对于数据科学专家非常重要:
在上一篇文章
“数据科学:入门级书籍”中, Plarium Krasnodar推荐了有关Python编程以及结果可视化和机器学习的文献。 在本文中,他们提供了一些对数据科学有用的数学材料和书籍。

统计与概率论
很难高估任何级别的数据科学家对统计知识的重要性。 所有经典的机器学习都基于统计学习。 而且,标准的A / B测试是基于此的。
灵感来源:
所有统计
拉里·瓦瑟曼正如作者本人写道:“这本书是为那些想要快速学习概率和统计信息的人而设计的。”
本书给出了概率论和统计学的所有基本规定。
统计基础(3部分)
Stepik教育平台初学者统计课程。 涵盖所有基本概念。
统计基础知识简明凯瑟琳
亚历克西斯·科曼尼克
上
一篇文章中已经推荐过这本书,但是重复这本书不会错位。 :-)
前几节提供基本定义,包括插图和注释,最后几节揭示了T检验和Z检验的重要性。 这些材料以一种易于使用的语言进行呈现,并具有最少的数学工具。 从实用的角度来看,该指南是对统计的极好的介绍。
概率论与数理统计
N·史·克雷默该教科书面向经济学家,因此概念的复杂性和深度不会震惊数据科学初学者。 适合在学习专业文献之前学习基础知识。
概率论与数理统计
A.I. Kibzun,E.R。Goryainova,A.V。Naumov,A.N。Sirotin本基础课程比上一课程提供更深刻的见解。 除了
理论包括实践练习和参考资料。
概率论和数理统计的基本概念
亚·凯伯特(Y. M. Sukhov)对于已经熟悉该主题并希望获得更深入知识的人来说,这是一个不错的选择。
数学分析
乍一看,在大学的城墙中需要更多的方向,但是如果没有这个方向,就不可能以定性的方式应对反向传播或掌握深度学习课程。
填补统计方面的空白,是时候开始研究本节中的材料了。 其中有很多。
微积分
版麻省理工学院的一门课程,分为三部分:
- 微积分1A:微分-一种寻找导数,其几何解释和物理意义的课程。
- 微积分1B:积分-查找积分及其与导数的关系以及在工程设计,科学分析,概率论和统计中的应用的课程。
- 微积分1C:坐标系和无穷级数-关于计算曲线,坐标系,逼近多项式和无穷级数的课程。 所有这些对于建立现实世界的数学模型都是必需的。
微积分一
教育平台Coursera本课程针对初学者,但是对材料的便捷介绍将有助于刷新经验丰富的数据科学家的记忆。
汗学院
教育平台资源中提供的各种材料非常适合进行数学,编程和计算机科学的学习。
微积分
詹姆斯·斯图尔特这本书以其精心设计的内容和相当简单的语言而闻名。
数学分析课程
L·D·库德里亚夫采夫对于那些想要获得有关微积分和积分,基础理论,泛函和谐波分析的更多基础知识的人。
您还可以关注MIT的两门课程:
- 单变量微积分 -用于独立研究微分,积分微积分和无限级数的课程。
- 多变量微积分是独立研究微分以及数个变量函数的积分和矢量微积分的另一门课程。
线性代数
如果没有数学的这一部分,将无法开发机器学习方法,模拟各种对象的行为或优化聚类过程并降低数据描述的维数。
线性代数
乔治·希洛夫(Georgi E. Shilov)该教科书包含完善的材料。 这本书适合学习线性代数入门课程。
线性代数
V.A.Ilyin,E.G.Poznyak
这本教科书是根据莫斯科国立大学物理系老师的讲课编写的。 所有材料均以易于访问的语言呈现,适合深入研究线性代数的基本理论。
最后,另一个建议是MIT
线性代数培训课程。 他揭示了矩阵理论和线性代数的位置。