Hallo Habr! Ich präsentiere Ihnen die Übersetzung des Artikels "Maschinelles Lernen für alle, die in der achten Klasse Mathematik gelernt haben" von Kyle Gallatin.

Normalerweise fällt mir auf, dass künstliche Intelligenz auf zwei Arten erklärt werden kann: durch das zunehmend sensationelle Prisma verschiedener Medien oder durch dichte wissenschaftliche Literatur, die von übermäßiger Sprache und bereichsspezifischen Begriffen durchdrungen ist.
Zwischen diesen Extremen gibt es einen weniger veröffentlichten Bereich, in dem die Literatur meiner Meinung nach etwas aktiver sein sollte. Aktuelle Nachrichten, wie der dumme Sophia-Roboter , machen einen Hype um künstliche Intelligenz und es könnte wie ein menschlicher Geist erscheinen, während Sophia in Wirklichkeit nicht schlauer ist als AOL Instant Messenger's SmarterChild .
Die wissenschaftliche Literatur kann noch schlimmer sein und selbst den anspruchsvollsten Forscher dazu zwingen, nach ein paar Absätzen bedeutungslosen pseudo-intellektuellen Mülls die Augen zu schließen. Um KI richtig einschätzen zu können , müssen die Menschen im Allgemeinen verstehen, was es wirklich ist. Und alles, was Sie brauchen, um die Grundlagen der künstlichen Intelligenz zu verstehen, ist ein wenig Mathematik an der High School.
Ich neige möglicherweise zu einer starken Vereinfachung - und ich werde alle meine Kollegen in Mathematik, Datenwissenschaft und Ingenieurwesen bitten, meine Erklärung zu tolerieren - manchmal ist dies das, was die Kunstwissenschaft braucht.
Grundlagen der künstlichen Intelligenz und des maschinellen Lernens
Typische, klassische künstliche Intelligenz ist alles, was die menschliche Intelligenz nachahmt. Es kann alles sein, von Videospiel-Bots bis hin zu komplexen Plattformen wie Deepmind Alphago .

Deep Learning ignorieren - in diesem Zusammenhang ist es dasselbe wie maschinelles Lernen. Bild: Geospatial World
Maschinelles Lernen ist eine Teilmenge der künstlichen Intelligenz. Auf diese Weise können Maschinen aus realen Daten „lernen“, anstatt auf vordefinierte Regeln zu reagieren.
Aber was bedeutet Lernen? Es ist vielleicht nicht so futuristisch, wie es scheint.
Meine Lieblingserklärung: Maschinelles Lernen ist gerecht auf Riss. Wenn Sie so etwas wie Black Mirror gesehen haben , ist es ziemlich einfach, sich moderne künstliche Intelligenz als ein bewusstes Wesen vorzustellen - das, was denkt, fühlt und schwierige Entscheidungen trifft. Dies ist noch häufiger in den Medien der Fall, in denen die KI nacheinander personifiziert und dann mit Skynet von Terminator oder dem Film The Matrix verglichen wird.
In der Tat ist dies überhaupt nicht so. Künstliche Intelligenz ist im gegenwärtigen Zustand nur Mathematik. Manchmal ist es komplexe Mathematik, und manchmal erfordert es tiefe Kenntnisse in den Bereichen Informatik, Statistik und anderen. Aber am Ende ist die moderne KI im Kern nur eine mathematische Funktion.
Machen Sie sich keine Sorgen, wenn Sie mit mathematischen Funktionen nicht befreundet sind, weil Sie sich nicht an sie erinnern oder sie nicht verwenden. Um das Wesentliche zu verstehen, müssen wir uns nur an ein paar einfache Dinge erinnern: Es gibt eine Eingabe ( ) und es gibt einen Ausweg ( ), und die Funktion ist das, was zwischen dem Eingang und dem Ausgang passiert - die Verbindung zwischen ihnen.
Wir können den Computer auf den Posteingang schauen lassen ( ) und ausgehend ( ) Daten und finden Sie heraus, was sie zusammenhält.
Ein Beispiel für eine stark vereinfachte künstliche Intelligenz ist eine Funktion, ausgedrückt als . Wir wissen es bereits und (aus der folgenden Tabelle); wir müssen nur finden und zu verstehen, was die Beziehung zwischen ist und .
Tabelle: Kyle Gallatin
Damit diese Vorlage bekommen von wir müssen uns vermehren am 1 ( ) und addiere 1 ( ) Die Funktion wird also herauskommen .
Großartig! Das haben wir festgestellt und . Wir haben nur einige Daten (aus der obigen Tabelle) genommen und eine Funktion erstellt, die sie beschreibt. Im Wesentlichen ist dies maschinelles Lernen. Mit der erhaltenen Funktion können wir nun annehmen, was gleich sein wird für andere Eingabedaten .
Der interessante Teil ist, wie Sie der Maschine beibringen, herauszufinden, welche Funktion die Daten am besten beschreibt. Wenn Sie damit fertig sind, erhalten Sie normalerweise eine Form . Sobald wir diese Funktion erhalten haben, können wir sie auch in einem Diagramm darstellen:

Screenshot vom Tecmath- Video
Für eine detailliertere Erläuterung der Funktionen verfügt Math Is Fun über eine intuitive und einfache Website (auch wenn der Name eine potenzielle rote Fahne für Sie darstellt und die Website so aussieht, als wäre ihr Webdesigner Anfang der 2000er Jahre entkommen).
Die Leute werden nicht zählen können, die Autos werden es können
Offensichtlich Ist ein sehr einfaches Beispiel. Der einzige Grund, warum maschinelles Lernen existiert, besteht darin, dass Menschen nicht Millionen von In- und Out-Datenpunkten betrachten und eine komplexe Funktion zur Beschreibung der Ergebnisse entwickeln können. Stattdessen können wir den Computer trainieren, dies für uns zu tun.
In jedem Fall sollten genügend Daten vorhanden sein, um die richtige Funktion zu finden. Wenn wir nur einen Datenpunkt für haben und Weder wir noch die Maschine konnten nur eine exakte Funktion vorhersagen. Im ursprünglichen Beispiel, wo und Funktion kann sein , , oder viele andere. Wenn wir nicht genügend Daten haben, kann die Funktion, die das Gerät findet, zu vielen Fehlern führen, wenn wir versuchen, sie für mehr Daten zu verwenden.
Außerdem sind reale Daten nicht immer so perfekt. Im folgenden Beispiel hat die Maschine mehrere Funktionen identifiziert, die den meisten Daten entsprechen, aber die Linie verläuft nicht durch jeden Punkt. Im Gegensatz zum vorherigen Beispiel mit einer Tabelle aus einer mathematischen Klasse sind aus der realen Welt gesammelte Daten unvorhersehbarer und können niemals vollständig beschrieben werden.

Dieses grundlegende Beispiel zeigt, wie eine Maschine lernt, die dargestellten Daten am besten zu beschreiben. Bild: Auf dem Weg zur Datenwissenschaft
Das Letzte, was Menschen nicht tun können, ist, sich eine Reihe von Variablen anzusehen. Es benutzt nur und aber was ist, wenn es mehr Eingabevariablen gibt? Was wäre wenn betrifft , , ... . Sehr schnell können Funktionen komplexer werden (für Menschen).
Reales maschinelles Lernen und künstliche Intelligenz
Schauen wir uns ein reales Beispiel an. Ich arbeite auf dem Gebiet der Pharmazeutika. Nehmen wir also an, wir haben einen krebsrelevanten Datensatz mit zwei Eingabevariablen, die der Größe des Tumors entsprechen - Radius und Umfang - und Ausgabe mit zwei möglichen Werten: ob der Tumor gutartig oder metastasierend ist (potenziell gefährlich) fürs Leben). Es mag kompliziert erscheinen, aber wir müssen nur ein bekanntes Konzept anwenden ::
- ist eine Diagnose und kann 0 (gutartig) oder 1 (metastatisch) sein.
- - Radius.
- - Umfang.
- Jeder habe dein unbekanntes ;; Nennen wir sie und .
- - unbekannte Konstante.
Wie sieht unsere lineare Gleichung jetzt aus? Nicht viel anders als im obigen Beispiel:
Wie ich oben erklärt habe, gehen wir über den Rahmen menschlicher Möglichkeiten hinaus. Anstatt die Daten zu betrachten und herauszufinden, womit wir unsere Variablen multiplizieren sollen, verwenden wir Maschinen. Sie werden es für uns tun und wir werden eine genaue Einschätzung der Diagnose erhalten. Und das ist maschinelles Lernen!
Natürlich sind selbst die detailliertesten Multi-Faktor-Daten nicht ideal, daher wird auch unser Modell des maschinellen Lernens nicht so sein. Aber wir brauchen sie nicht, um in 100% der Fälle korrekt zu sein. Wir brauchen sie nur, um die bestmögliche Funktion zu entwickeln, die für die meisten Fälle geeignet ist.
Dieses Stück kratzt nur an der Oberfläche der unglaublichen Mathematik und Informatik, die in das maschinelle Lernen einfließt. Aber auch auf komplexen Ebenen ist das Konzept dasselbe. Egal wie beeindruckend oder seltsam maschinelles Lernen und künstliche Intelligenz erscheinen mögen, alles kommt von den Funktionen, die die Maschine gelernt hat, um die Daten am besten zu beschreiben.