Mathématiques pour Data Scientist: Sections nécessaires

Les mathématiques sont la pierre angulaire de la science des données. Bien que certains théorèmes, axiomes et formules semblent trop abstraits et loin de la pratique, en fait, sans eux, il est impossible d'analyser et de systématiser véritablement d'énormes ensembles de données.

Les domaines suivants des mathématiques sont importants pour un spécialiste de la science des données:

  • statistiques;
  • théorie des probabilités;
  • analyse mathématique;
  • algèbre linéaire.

Dans un article précédent, «Data Science: Entry-Level Books», Plarium Krasnodar a recommandé la littérature sur la programmation Python, ainsi que la visualisation des résultats et l'apprentissage automatique. Dans cet article, ils proposent une sélection de matériaux mathématiques et de livres utiles en science des données.



Statistiques et théorie des probabilités


Il est difficile de surestimer l'importance de la connaissance des statistiques pour Data Scientist à quelque niveau que ce soit. Tout l'apprentissage automatique classique est basé sur l'apprentissage statistique. De plus, les tests A / B standard sont basés sur elle.

Sources d'inspiration:



Toutes les statistiques
Larry wasserman

Comme l'écrit l'auteur lui-même: "Ce livre est destiné aux personnes qui veulent apprendre rapidement les probabilités et les statistiques."

Le livre donne toutes les dispositions de base de la théorie des probabilités et des statistiques.



Bases des statistiques (3 parties)
Plateforme pédagogique Stepik

Cours de statistiques pour débutants. Couvre tous les concepts élémentaires.



Principes fondamentaux de la statistique succinctement Katharine
Alexis Kormanik

Ce livre était déjà recommandé dans un article précédent, mais le répéter ne sera pas déplacé. :-)

Les premières sections fournissent des définitions de base avec des illustrations et des commentaires, la dernière révèle l'importance des tests T et Z. Le matériel est présenté dans une langue accessible, avec le minimum d'appareil mathématique nécessaire. Ce guide est une excellente introduction aux statistiques d'un point de vue pratique.



Théorie des probabilités et statistiques mathématiques
N. Sh. Kremer

Le manuel est destiné aux économistes, donc la complexité et la profondeur des concepts ne choquent pas le débutant en science des données. Convient pour apprendre les bases avant de plonger dans la littérature spécialisée.



Théorie des probabilités et statistiques mathématiques
A.I. Kibzun, E.R. Goryainova, A.V. Naumov, A.N. Sirotin

Ce cours de base fournit des informations plus approfondies que le précédent. Sauf
La théorie comprend des exercices pratiques et des documents de référence.



Concepts de base de la théorie des probabilités et des statistiques mathématiques
M. Ya. Kelbert, Yu. M. Sukhov

Une excellente option pour ceux qui connaissent déjà le sujet et souhaitent approfondir leurs connaissances.

Analyse mathématique


À première vue, cette direction est davantage nécessaire dans l'enceinte des universités, mais sans elle, il ne sera pas possible de traiter la rétropropagation ou de maîtriser un cours d'apprentissage profond de manière qualitative.

Combler les lacunes dans les statistiques, il est temps de commencer à étudier les matériaux de cette section. Et il y en a beaucoup.



Calcul
edX

Un cours du Massachusetts Institute of Technology, composé de 3 parties:

  • Calcul 1A: Différenciation - un cours sur la recherche d'une dérivée, son interprétation géométrique et sa signification physique.
  • Calcul 1B: Intégration - un cours sur la recherche de l'intégrale, sa relation avec la dérivée et son application dans la conception technique, l'analyse scientifique, la théorie des probabilités et les statistiques.
  • Calcul 1C: Systèmes de coordonnées et séries infinies - un cours sur le calcul de courbes, de systèmes de coordonnées, l'approximation de fonctions de polynômes et de séries infinies. Tout cela est nécessaire pour construire des modèles mathématiques du monde réel.



Calcul un
Plateforme pédagogique Coursera

Le cours s'adresse aux débutants, mais une présentation pratique du matériel aidera à rafraîchir la mémoire de Data Scientist expérimenté.



Académie Khan
Plateforme pédagogique

Une variété de documents présentés sur la ressource sont parfaits pour commencer une étude des mathématiques, de la programmation et de l'informatique.



Calcul
James Stewart

Le livre est célèbre pour son contenu soigneusement conçu et son langage assez simple.



Cours d'analyse mathématique
L. D. Kudryavtsev

Pour ceux qui veulent acquérir des connaissances plus fondamentales sur le calcul différentiel et intégral, la théorie des séries, l'analyse fonctionnelle et harmonique.

Vous pouvez également faire attention à deux cours du MIT:
  1. Calcul à variable unique - un cours pour une étude indépendante de la différenciation, du calcul intégral et des séries infinies.
  2. Le calcul multivarié est un autre cours pour l'étude indépendante de la différenciation, ainsi que le calcul intégral et vectoriel des fonctions de plusieurs variables.

Algèbre linéaire


Sans cette section de mathématiques, il ne sera pas possible de développer des méthodes d'apprentissage automatique, de simuler le comportement de divers objets ou d'optimiser le processus de clustering et de réduire la dimension de la description des données.



Algèbre linéaire
Georgi E. Shilov

Le manuel contient un matériel bien développé. Le livre est adapté pour étudier un cours d'introduction à l'algèbre linéaire.



Algèbre linéaire
V. A. Ilyin, E. G. Poznyak

Ce manuel a été rédigé sur la base de conférences données par des enseignants du Département de physique de l'Université d'État de Moscou. Tous les matériaux sont présentés dans une langue accessible et conviennent à une étude approfondie des théories de base de l'algèbre linéaire.

Et enfin, une autre recommandation est le cours de formation sur l' algèbre linéaire du MIT. Il révèle la théorie des matrices et les positions de l'algèbre linéaire.

Source: https://habr.com/ru/post/fr442772/


All Articles