Bonjour, Habr! Je vous présente la traduction de l'article "Apprentissage automatique pour tous ceux qui ont pris les mathématiques en huitième année" par Kyle Gallatin.

Je remarque généralement que l'intelligence artificielle peut s'expliquer de deux manières: à travers le prisme de plus en plus sensationnel de divers médias, ou à travers une littérature scientifique dense pénétrée par un langage excessif et des termes spécifiques à une zone.
Entre ces extrêmes, il y a un domaine moins publié où, je pense, la littérature devrait être un peu plus active. Les dernières nouvelles, comme le stupide robot Sophia , prennent le battage médiatique autour de l'intelligence artificielle et cela pourrait ressembler à quelque chose comme un esprit humain, alors qu'en réalité Sophia n'est pas plus intelligente que SmarterChild d'AOL Instant Messenger.
La littérature scientifique peut être encore pire, obligeant même le chercheur le plus sophistiqué à fermer les yeux après quelques paragraphes d'ordures pseudo-intellectuelles dénuées de sens. Pour évaluer correctement l' IA , les gens doivent généralement comprendre ce que c'est vraiment. Et tout ce dont vous avez besoin pour comprendre les bases de l'intelligence artificielle est un peu de mathématiques au lycée.
Je suis peut-être sujet à une simplification excessive - et je demanderai à tous mes collègues en mathématiques, en science des données et en ingénierie de tolérer mon explication - c'est parfois ce dont la science artistique a besoin.
Fondements de l'intelligence artificielle et de l'apprentissage automatique
L'intelligence artificielle classique et classique est tout ce qui imite l'intelligence humaine. Cela peut aller des robots de jeux vidéo aux plateformes complexes comme Deepmind Alphago .

Ignorer le Deep Learning - dans ce contexte, c'est la même chose que le machine learning. Image: Monde géospatial
L'apprentissage automatique est un sous-ensemble de l'intelligence artificielle. Cela permet aux machines «d'apprendre» à partir de données réelles au lieu d'agir sur un ensemble de règles prédéfinies.
Mais que signifie apprendre? Ce n'est peut-être pas aussi futuriste qu'il n'y paraît.
Mon explication préférée: l'apprentissage automatique est juste y=mx+b sur le crack. Si vous avez regardé quelque chose comme Black Mirror , il est assez facile de commencer à imaginer l'intelligence artificielle moderne comme un être conscient - celui qui pense, ressent et prend des décisions difficiles. C'est encore plus courant dans les médias, où l'IA est personnifiée séquentiellement, puis comparée à Skynet de Terminator ou au film The Matrix.
En fait, ce n'est pas du tout le cas. Dans son état actuel, l'intelligence artificielle n'est que des mathématiques. Parfois, ce sont des mathématiques complexes, et parfois elles nécessitent des connaissances approfondies dans le domaine de l'informatique, des statistiques et autres. Mais au final, l'IA moderne n'est au fond qu'une fonction mathématique.
Ne vous inquiétez pas si vous n'êtes pas ami avec les fonctions mathématiques parce que vous ne vous en souvenez pas ou ne les utilisez pas. Pour obtenir l'essentiel, nous devons nous souvenir de quelques choses simples: il y a une entrée ( x ) et il existe une issue ( y ), et la fonction est ce qui se passe entre l'entrée et la sortie - la connexion entre eux.
Nous pouvons faire en sorte que l'ordinateur regarde la boîte de réception ( x ) et sortant ( y ) et découvrez ce qui les lie.
Un exemple d'intelligence artificielle super simplifiée est une fonction exprimée comme y=mx+b . Nous savons déjà x et y (du tableau ci-dessous); nous avons juste besoin de trouver m et b pour comprendre quelle est la relation entre x et y .
Tableau: Kyle Gallatin
Pour que ce modèle obtienne y de x nous devons nous multiplier x sur 1 ( m ) et ajoutez 1 ( b ) Donc la fonction sortira y=1x+1 .
Super! Nous avons déterminé que m=1 et b=1 . Nous venons de prendre quelques données (du tableau ci-dessus) et avons créé une fonction qui les décrit. Il s'agit essentiellement de l'apprentissage automatique. Maintenant, en utilisant la fonction obtenue, nous pouvons faire une hypothèse de ce qui sera égal y pour d'autres données d'entrée x .
La partie intéressante est de savoir comment vous apprenez à la machine à trouver la fonction qui décrit le mieux les données, mais lorsque vous en avez terminé, vous obtenez généralement une forme y=mx+b . Une fois que nous obtenons cette fonction, nous pouvons également la tracer sur un graphique:

Capture d'écran de la vidéo Tecmath
Pour une explication plus détaillée des fonctions, Math Is Fun a un site intuitif et simple (même si le nom est un drapeau rouge potentiel pour vous, et le site ressemble à leur concepteur Web s'est échappé au début des années 2000).
Les gens ne pourront pas compter, les voitures pourront
De toute évidence y=1x+1 Est un exemple très simple. La seule raison pour laquelle l'apprentissage automatique existe, c'est parce que les gens ne peuvent pas regarder des millions de points de données entrants et sortants et proposer une fonction complexe pour décrire les résultats. Au lieu de cela, nous pouvons former l'ordinateur à le faire pour nous.
Dans tous les cas, il devrait y avoir suffisamment de données pour trouver la bonne fonction. Si nous n'avons qu'un seul point de données pour x et y , ni nous ni la machine ne pouvions prédire une seule fonction exacte. Dans l'exemple d'origine, où x=1 et y=2 la fonction peut être y=2x , y=x+1 , y=([x+1] cdot5−9)5+1 ou bien d'autres. Si nous n'avons pas suffisamment de données, la fonction trouvée par la machine peut entraîner de nombreuses erreurs lorsque nous essayons de l'utiliser pour plus de données.
De plus, les données réelles ne sont pas toujours aussi parfaites. Dans l'exemple ci-dessous, la machine a identifié plusieurs fonctions qui correspondent à la plupart des données, mais la ligne ne passe pas par chaque point. Contrairement à l'exemple précédent avec un tableau d'une classe mathématique, les données collectées dans le monde réel sont plus imprévisibles et ne peuvent jamais être entièrement décrites.

Cet exemple de base montre comment une machine apprend à décrire au mieux les données présentées. Image: Vers la science des données
Enfin, la dernière chose que les gens ne peuvent pas faire, c'est regarder un tas de variables. C'est juste en utilisant x et y mais que faire s'il y a plus de variables d'entrée? Et si y affecte x1 , x2 , ... x100 . Très rapidement, les fonctions peuvent devenir plus complexes (pour les personnes).
Apprentissage automatique et intelligence artificielle dans le monde réel
Regardons un exemple réel. Je travaille dans le domaine pharmaceutique, donc supposons que nous ayons un ensemble de données liées au cancer qui a deux variables d'entrée qui correspondent à la taille de la tumeur - rayon et périmètre, et sortie, avec deux valeurs possibles: si la tumeur est bénigne ou métastatique (potentiellement dangereuse à vie). Cela peut sembler compliqué, mais nous avons juste besoin d'appliquer un concept familier y=mx+b :
- y est un diagnostic, et peut être 0 (bénin) ou 1 (métastatique).
- x1 - rayon.
- x2 - périmètre.
- Chacun x avoir ton inconnu m ; appelons-les quelquechose1 et quelquechose2 .
- b - constante inconnue.
À quoi ressemble notre équation linéaire maintenant? Pas très différent de l'exemple ci-dessus:
diagnostic=(quelquechose1 rayoncdot)+(quelquechose2 périmètrecdot)+inconnu
Comme je l'ai expliqué ci-dessus, nous allons au-delà de la portée des possibilités humaines. Ainsi, au lieu de regarder les données et d'essayer de comprendre par quoi multiplier nos variables, nous utilisons des machines. Ils le feront pour nous et nous obtiendrons une évaluation précise du diagnostic. Et c'est l'apprentissage automatique!
Bien sûr, même les données multifactorielles les plus détaillées ne sont pas idéales, donc notre modèle d'apprentissage automatique ne sera pas comme ça non plus. Mais nous n'avons pas besoin qu'elles soient correctes dans 100% des cas. Nous avons juste besoin d'eux pour trouver la meilleure fonction possible, qui convient à la plupart des cas.
Cette pièce ne fait qu'effleurer la surface des incroyables mathématiques et sciences informatiques qui entrent dans l'apprentissage automatique. Mais même à des niveaux complexes, le concept est le même. Peu importe à quel point l'apprentissage automatique et l'intelligence artificielle peuvent sembler impressionnants ou étranges, tout cela provient des fonctions que la machine a apprises pour décrire au mieux les données.