数据科学-数据科学出现在以下几个广泛领域的交界处:编程,数学和机器学习。 这是由于进入该行业的门槛很高以及需要不断获得新知识。
初学者的关键技能是:
- 编写代码的能力(Python);
- 可视化结果的能力;
- 了解“幕后”发生的事情。
Plarium Krasnodar专家为具有数据科学基础知识的读者选择的书分为这三类。

巨蟒
有人在R中搜索自己,但真理之路在于Python。 以下书籍是学习的绝佳选择。
Python技巧:这本书
丹·巴德尔这本书讲述了各种技巧和实用性,这些技巧和实用性有助于提高生产力和更好地编程。
我们正在谈论Python语言的基本数据类型以及编写代码的方法-从OOP到使用依赖项。 不论是初学者还是想通过典型的pythonic设计来刷新记忆的人,都值得一读。
高性能Python:实用的人类编程
伊恩·奥兹瓦尔德(Mian Gorelick)这本书在内部描述了该语言。 它解释了解释器和代码机制的工作,主要数据类型以及它们如何与内存交互。 本指南还将帮助您了解如何利用Python的隐藏功能。
可视化
每位数据科学家都面临着展示其工作结果的需求。 如您所知,没有比高质量可视化更好的方法了。 这就是花式饼图出现的地方...
用数据讲故事:业务专业人员的数据可视化指南
科尔努斯鲍默尔关于如何以高质量方式可视化结果的精彩书籍。 前Google员工在其中详细描述了创建正确图形的所有阶段,并提供了反例。
您还可以访问作者的网站,该网站收集了大量的选项,可用来显示最佳专家的数据。 当然,在这里找不到找到完美作品的分步说明,在哪里都可以找到!
仪表盘大书。 使用实际业务场景可视化数据
史蒂夫·韦克斯勒,杰弗里·谢弗,安迪·科特格雷夫数据可视化是一项艰苦的工作,但是当您知道理想的外观时,就会了解需要努力的地方。
对于所有场合,这都是仪表板的理想选择,在这些场合中,几乎所有业务任务都建议使用解决方案。 不幸的是,关于Tableau中的实现,没有任何评论,只有视觉组件,以及关于如何以及为什么更好的解释。
ML算法
这是一个相对容易理解算法功能的领域,但是很难掌握。
使用Scikit-Learn和Tensor Flow进行动手机器学习:构建智能系统的概念,工具和技术
Auréliengéron本书可以安全地推荐给任何想了解模型是如何构建的人-从线性到树形。 可访问语言的第一部分概述了算法的原理。 对于刚进入该行业的人来说,它将特别有用。 第二部分专用于TensorFlow。
深度学习。 沉浸在神经网络世界中
S. Nikolenko,A。Kadurin,E。Arkhangelskaya现代世界中几乎所有的IT文献都是用英语出版的,数据科学领域也不例外。 甚至有一种表达:“我想成为一名程序员,学习什么语言? 首先学习英语。”
这是俄罗斯作家用俄语编写的关于深度学习和神经网络的唯一一本有价值的书。 而且,它非常有表现力,有大量的例子,从科学到参考文献的各种故事(本著作中的一本文献清单比许多出版物更有用)。
统计学习的要素:数据挖掘,推理和预测,第二版
Trevor Hastie,Robert Tibshirani,Jerome Friedman只是任何Data Science集合中的必读内容。 可以用作手册的机器学习算法的基础知识。 需要一些准备,适合高级水平。
选配
简洁的统计基础
凯瑟琳·亚历克西斯·科尔曼尼克在Succinctly系列中,经常发现珍珠,这就是其中之一。 本书的开头是带有图片和注释的基本定义,其余的则致力于测试的重要性(T和Z测试)。
易于使用的语言和最少的数学知识(需要理解的数量)使该手册从实用的角度成为统计学的极佳入门。
深度工作:在分散注意力的世界中获得成功的规则
加州纽波特
作者谈论了他的经验以及在最大程度地专注于一项任务时同事的经验。 这本书很容易阅读,包括对方法本身的描述,各种示例和规则。
主要思想是,大脑的这种状态可以使我们达到最佳性能,并将结果提升到一个全新的水平。 不幸的是,大脑的极限是有限的,但是我们训练。 我们建议大家阅读。