给初学者的信,以学习数据科学

我想在三年前刚开始学习数据科学 (DS)时收到这封信。 有必要链接到有用的材料。 本文并不旨在涵盖DS的广阔领域。 但是,对于新手专家来说将很有用。


神经网络是...


DS中最常使用以下技术:



而且,随着时间的流逝,您将需要许多不同的附加库和工具来处理图像和数据。 有几十个。 对我来说最有用的( 图像处理 )按重要性降序排列:


  • 虚拟环境 -用于各种项目的虚拟开发环境,其中封装了不同版本的库和工具。
  • NumPy-使用矩阵,线性代数。
  • OpenCV-处理图像的许多不同算法。
  • Jupyter Notebook是一个Web应用程序,用于在浏览器和云中开发和运行Python程序。
  • Tensorflow-gpu-神经网络的配置和图形卡上的计算。
  • iPython是使用Python命令的更便捷的控制台,建议您使用它代替默认控制台。
  • Matplotlib-绘制图形和图表。
  • 枕头 -适用于所有流行的图像格式。
  • 熊猫 -处理数据。
  • SciPy-使用算法的高级工作,它是MatLab程序的免费替代品。
  • Scikit-learn-机器学习算法。
  • Scikit-image-高级图像处理。
  • K3D-在Jupyter Notebook中处理三维图形和图像。

没有数据,机器学习(ML机器学习),尤其是深度学习(Deep Learning)是不可能的。 必要的数据库(数据集,数据集)可以通过Google数据集搜索服务2.5万个Kaggle数据 集进行搜索


好吧,给我们看例子


我所拥有的:



感谢您的关注!

Source: https://habr.com/ru/post/zh-CN482652/


All Articles