Feuille de route des disciplines mathématiques pour l'apprentissage automatique, partie 1

Au lieu de l'avant-propos


Supposons que, assis dans un fauteuil chaud le soir, une pensée folle vous vienne à l'esprit: "Hmm, pourquoi ne puis-je pas découvrir pourquoi les hyperparamètres du modèle sont sélectionnés au hasard et pourquoi tout fonctionne?"

C'est une pente glissante - vous pensez que quelques soirées avec une lecture tranquille du chapitre "Deep Learning" ou des clips YouTube de 5 minutes de divers MOOC sont suffisants; en fait, pour créer la compréhension, et non son illusion, un temps décent est nécessaire (enfin, certainement pas moins de six mois pour les plus fanatiques); mais le plus triste est que le profit de cet événement n'est pas évident - heureusement (ou malheureusement), le monde n'est pas arrangé selon les lois des mathématiques, et si vous êtes docteur en physique à trois reprises, certains modèles ne fonctionneront mieux que si vous lancez ils ont plus de données prétraitées ou construisent un énorme ensemble.

Je considère qu'il est de mon devoir de vous avertir qu'il s'agit d'une courbe, et il est possible que les investissements en mathématiques ne portent pas leurs fruits dès que nous le souhaiterions. Mais les mathématiques sont intéressantes en elles-mêmes, quelles que soient les applications. De plus, si vous êtes intéressé et ce qui se passe dans cette boîte noire avec des hyperparamètres, cela signifie que les mathématiques ne vous sont probablement pas indifférentes.

Autre chose à propos de mes recommandations: je n'aime pas la littérature mathématique, qui regorge d'indices, de perles comme «a_ijk avec trois soulignements et un chapeau conjugué». Je pense que les idées sont plus importantes que des conclusions rigoureuses. Dans le même temps, les idées ne doivent pas se glisser entre «mains», tout doit être assez strict. Je n'aime pas les livres comme Bourbaki et Knut. À mon avis, ces livres sont destinés à tout, mais pas à la lecture ni à l'étude du sujet. Ils sont bons comme liens et comme encyclopédies.

Au final, je citerai quelque chose de Bertrand Russell:
Euclide méprisait l'utilité pratique introduite par Platon. Ils disent qu'un étudiant, après avoir écouté les preuves, a demandé ce qu'il avait gagné en étudiant la géométrie; alors Euclide a appelé un esclave et a dit: "Donnez au jeune homme un sou, car il doit certainement bénéficier de ce qu'il étudie."
Je vais maintenant passer à la partie principale.

Prérequis


  1. Je suppose que vous êtes plus ou moins orienté dans un cursus scolaire de mathématiques.
  2. Je suppose que vous n'êtes pas entièrement en anglais avec «vous», car beaucoup de bonne littérature et de bons cours sont écrits et narrés dans cette langue. L'anglais mathématique n'est pas aussi effrayant que l'anglais en général; c'est un vocabulaire assez limité avec des phrases construites de façon standard, sans un méli-mélo de temps, sans une débauche de couleurs, etc.
  3. Je suppose que vous avez une corde avec laquelle vous pouvez vous attacher à une chaise.

Niveaux de difficulté


Ce n'est pas un secret que beaucoup de littérature a été écrite sur chaque discipline mathématique, et parfois même le simple choix du bon livre devient un problème. Je vais souligner plusieurs niveaux de complexité dans la littérature que vous saviez où se mêler et où grimper (jusqu'à présent) n'était pas nécessaire (ou vers quoi vous tourner pour des informations plus complètes).

  1. Apportez-le - le cheval de bataille principal; Ce sont des livres qui sont appelés «must have».
  2. Faites-moi beaucoup de mal - un niveau plus élevé, vous permet de regarder le niveau 1 à vol d'oiseau, systématise les connaissances, combine différents domaines de connaissances.
  3. Cauchemar - pour les forts d'esprit, le niveau de mehmat, pour les amateurs de mathématiques et de tours d'ivoire.

Feuille de route




Je vais en fait passer à des cours spécifiques.

Analyse, il est calcul


Il est enseigné de façon assez intéressante dans les universités russes: la plupart d'entre elles, plusieurs années après la fin du cours, ne se souviennent vaguement que de certaines intégrales là-bas, et quelque chose d'autre semble être. Et cela malgré le fait que l'analyse soit une discipline, en fait, l'un des fondamentaux des mathématiques en général. En règle générale, il n'y a pas de ponts entre la théorie et la pratique, et ce cours, comme une île volante, plane quelque part dans la tête, complètement séparé de la vie réelle. Il est nécessaire de surmonter cela en résolvant des problèmes, en outre, non seulement dans le domaine des mathématiques, mais aussi quelque chose de la «vie réelle» est souhaitable.

Que devez-vous savoir de l'analyse?


Les principaux éléments dont nous aurons besoin sont les concepts de limite, continuité, dérivée, fonction de nombreuses variables, gradient, intégrale, intégrale avec limite supérieure variable, intégrale multidimensionnelle *.

Littérature


Apportez-le : tout est plus ou moins standard ici - Piskunov / Fichtenholtz .
Me fait beaucoup de mal : Zorich, Volume 1 . J'aime beaucoup ce livre; ce n'est pas un manuel, mais un roman dans les formules, quelque chose comme Eugene Onegin. Malheureusement, il est plus compliqué que les cours d'analyse standard en raison du fait que beaucoup de choses y sont données de manière plus générale, et vous devez vous y habituer; mais en raison de cette similitude, de nombreuses choses disparates sont liées entre elles (voir les mêmes limites sur la base).
Nightmare : Zorich Volume 1 + Volume 2, Rudin «Fundamentals of Mathematical Analysis», Lviv «Lectures on Mathematical Analysis», Ramanan «Global Calculus».

En général, le résumé est le suivant: la littérature d'analyse, même en russe, est pleine; les manuels ont tendance à être purement mathématiques. En plus des manuels de niveau 2-3, je peux conseiller plusieurs cours:


Je n'ai pas regardé les cours de la salle de conférence du MIPT sur l'analyse, mais pour être complet je donnerai également:


Pratique


La pratique et l'application des connaissances acquises sont non seulement «facultatives», mais strictement obligatoires, sinon toute la théorie vous pèsera lourdement et vous vous enfoncerez rapidement au fond sans même vous en rendre compte.

Je propose d'examiner les options suivantes: Demidovich, ensembles de problèmes des cours du MIT (https://ocw.mit.edu/courses/mathematics/18-01sc-single-variable-calculus-fall-2010/index.htm)

Algèbre linéaire


Pain quotidien pour la Data Science et pour la science en général. Malheureusement, les gens ont appris à bien résoudre uniquement les équations linéaires et leurs systèmes; pour les équations de degré 2 et plus, il existe toutes sortes de théories très non triviales (algèbre commutative, géométrie algébrique, et d'autres comme elles). Par conséquent, dans l'analyse des données, les modèles linéaires sont principalement utilisés (ou les modèles linéaires généralisés, tels que les régressions logistiques, les perceptrons, etc.).

Il existe de nombreux livres sur l'algèbre linéaire en russe. Le problème est qu'ils sont écrits soit pour les mathématiciens, soit ils contiennent de nombreux indices déprimants (et aucune forêt n'est visible derrière les arbres). Dans les cours universitaires, l'accent est souvent mis sur le formulaire Jordan; d'autres formes standard ne sont souvent pas mentionnées; il y a Gauss et Kramer stupide, mais rarement ce qui se passe à propos de LU, à propos de SVD.

Ce que vous devez savoir de l'algèbre linéaire?


Le concept d'espace vectoriel et vectoriel; le concept d'un opérateur linéaire; communication des opérateurs et des matrices; décompositions matricielles (LU, SVD au moins); vecteurs propres et valeurs propres; opérateurs orthogonaux, unitaires; opérateurs symétriques et hermitiens; formes quadratiques, réduction aux axes principaux.

Littérature


Apportez-le : cours OCW-MIT de Gilbert Strang sur l'algèbre linéaire + son livre .
ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/index.htm

La meilleure chose à propos de ce cours est le manque de théorèmes «complexes» et plutôt stupides d'algèbre linéaire, toutes sortes d'espaces doubles, un grand nombre de problèmes dans le livre, une approche axée sur la pratique (pas «qu'est-ce que c'est», mais «comment le calculer»). Plus de cours explicatifs d'algèbre linéaire que je n'ai pas encore rencontrés.

Me fait beaucoup de mal : Axler «Algèbre linéaire bien faite»; Gelfand "Conférences sur l'algèbre linéaire "; Cours MIPT lectoriy.mipt.ru/course/LinearAlgebra ; Kostrikin «Introduction à l'algèbre, partie 2», Tyrtyshnikov «Analyse matricielle et algèbre linéaire».

Le problème avec les livres et les cours de ce niveau de complexité est qu'ils sont théoriquement orientés. Il existe des fonctionnelles linéaires et des espaces doubles, mais il n'y a pas de matrice de projection sur le sous-espace et des méthodes pratiques pour calculer les valeurs propres. Très probablement, les cours de ce niveau devront être complétés par une solide pratique; par exemple, par des méthodes numériques d'algèbre linéaire.

À propos du dernier livre séparément. À mon avis, c'est l'un des livres de langue russe les plus réussis sur l'algèbre linéaire en ce sens qu'il n'est pas très éloigné de la pratique; en même temps, il contient toutes sortes de sujets "avancés". Dans une certaine mesure, il peut remplacer complètement les conférences de Strang, mais il doit être complété par des tâches simples pour «remplir votre main». Il y a des problèmes dans ce livre, mais ils sont assez graves.

Cauchemar : Kostrikin-Manin "Algèbre linéaire et géométrie", Shafarevich-Remizov "Algèbre linéaire et géométrie".

En général, il y a beaucoup de bonne littérature en russe, surtout au dernier niveau, mais elle souffre d'une complexité excessive.

Pratique


Comme dans le premier cas, la pratique est requise. Go SVD - Apprenez la compression d'image. Passez par des multiplications matricielles - apprenez la transformée de Fourier rapide, l'algorithme de Strassen; résoudre de nombreux problèmes (par exemple, dans les livres de problèmes de Kostrikin ou Proskuryakov ); écrivez votre décomposition LU, Gauss. Pour les plus persévérants, je peux offrir de merveilleux livres sur les méthodes numériques de l'algèbre linéaire, tels que Trefethen, Bau "NUMERICAL LINEAR ALGEBRA"; Horn, Johnson "Matrix Analysis" . Ces livres seront utiles, tout d'abord, pour vous «bourrer» les mains; Deuxièmement, il deviendra immédiatement clair que de nombreuses méthodes théoriques sont divisées en puces sur la prose de la vie (précision de la machine, instabilité des méthodes, travail avec des matrices clairsemées).

Maths discrets


Une autre baleine de CS moderne. Ici, nous nous intéressons principalement à la combinatoire et aux bases de la théorie des graphes.

Que devez-vous savoir de la combinatoire et de la théorie des graphes?


Coefficients binomiaux, leurs asymptotiques; graphiques; les arbres; recherche en profondeur et en largeur; les relations de récurrence et leurs solutions;

Littérature


Apportez-le : Anderson J. "Mathématiques discrètes et combinatoire"; Haggarti, Schlipf J., Whitesides S. "Mathématiques discrètes pour les programmeurs", Ore O. "Graphs and their application . "

Les deux premiers livres - excellents Talmuds en mathématiques discrètes, couvrent presque toutes les questions que vous devez savoir.

Me font beaucoup de mal : Graham, Knut, Patashnik «Concrete Mathematics», Harari «Graph Theory», Ore «Graph Theory».

Cauchemar : Sachkov «Introduction aux méthodes combinatoires des mathématiques discrètes», Omelchenko «Théorie des graphes».

Pratique


En règle générale, un grand nombre de problèmes sont inclus dans les manuels de combinatoire; ils doivent être résolus. En fait, toute la combinatoire est l'art de résoudre divers problèmes, plutôt qu'une théorie unique.

Source: https://habr.com/ru/post/fr432670/


All Articles