Ce qu'il faut lire et voir pour commencer en science des données: livres, dictionnaires et cours

Une sélection de ressources en mathématiques, statistiques et programmation pour les scientifiques débutants. Consultez le matériel si vous prévoyez d'étudier des cours en ligne. Ainsi, vous devancez vos camarades de classe et, en même temps, vous acquérez une compétence utile - étudier vous-même du matériel supplémentaire.

Anglais technique


La plupart des documents de la collection sont en anglais. Par conséquent, tout d'abord, vous devez comprendre le vocabulaire technique et apprendre à comprendre des termes complexes. Ces ressources vous aideront à naviguer dans la littérature technique si votre niveau d'anglais est intermédiaire ou inférieur à la moyenne.



Dictionnaire Cambridge

Math



Tout d'abord, apprenez à maîtriser rapidement tous les concepts mathématiques. Le didacticiel Comment apprendre les mathématiques rapidement vous aidera à cet égard.
Stimulez la pensée mathématique et apprenez:


Pour voir la polyvalence des mathématiques, consultez la série d'ateliers Edward Frenkel Mathématiques: le langage de la nature .

Théorie et pratique supplémentaires en mathématiques


Les ressources suivantes aideront à rafraîchir les concepts de base des mathématiques:



Cours de théorie des probabilités à Coursera

Tâche avec un astérisque. Pour mieux maîtriser vos connaissances de l'algèbre matricielle, suivez le cours d' algèbre linéaire du MIT.

Statistiques


Pour une formation sur le cours Net Scientology Data Scientist, une connaissance de base des statistiques est suffisante. Ils peuvent être obtenus auprès de la section Statistiques et probabilités de la Khan Academy. Pour une liste complète des sujets statistiques que nous aborderons pendant la formation, voir Les 10 techniques statistiques que les scientifiques doivent maîtriser . Pour l'admission, il n'est pas nécessaire de les comprendre en détail, mais il vaut mieux se faire une idée générale.

Cours Net Scientology Data Scientist

Tâche avec un astérisque. De plus, il vaut la peine de suivre le cours Statistics for Applications du MIT, mais pour cela, vous devez comprendre:

  • qu'est-ce qu'un échantillon et une population;
  • mesures de la tendance centrale et de la variabilité;
  • comparaison des moyennes.

Programmation


Les étudiants de Data Scientist écrivent du code Python. Pour écrire du code pendant la formation, il suffit de maîtriser les concepts de base du langage: opérateurs, types de données, variables, boucles, fonctions, classes. Les ressources suivantes vous aideront à comprendre rapidement les bases et la pratique par vous-même:


Si vous souhaitez comprendre Python plus en détail et sous la direction d'un mentor, vous pouvez suivre le cours Python for Data Analysis en parallèle.


Bases de données


Pour penser dans le contexte des données, vous devez comprendre comment les bases de données relationnelles sont structurées et fonctionnent. Pour ce faire, il suffit de maîtriser les bases de SQL - pour suivre la troisième semaine du cours sur les bases de l'analyse de données pour les entreprises de l'Université du Colorado à Boulder. Vous pouvez mettre en pratique vos connaissances dans les tâches suivantes:


Une connaissance approfondie des bases de données peut être obtenue dans le cours "SQL pour l'analyse".

Nous résumons: recommandations clés


  • Si vous prévoyez d'apprendre la profession de Data Scientist dans les cours, améliorez votre anglais technique. Cela sera nécessaire pour étudier du matériel et de la documentation supplémentaires.
  • Apprenez ou perfectionnez les bases des mathématiques, des statistiques, de Python et de SQL.
  • Lisez des guides, regardez des conférences de formation et effectuez des tâches pratiques pour consolider les informations.

Source: https://habr.com/ru/post/fr467011/


All Articles