DeepMind AI hat den Mathe-Test in der Schule nicht bestanden



Populärwissenschaft und sogar Unterhaltungsmedien sind heutzutage voller Nachrichten über den Erfolg von KI-Projekten. Entweder besiegt künstliche Intelligenz eine Person in Go, lernt dann StarCraft zu spielen und gewinnt einen Kampf mit anerkannten Champions. Und dies ist nur ein kleiner Teil der Erfolge, tatsächlich gibt es noch viel mehr. Ein gewöhnlicher Mensch (in gewissem Sinne nicht mit der IT-Sphäre verwandt) könnte denken, dass eine echte, „große“ künstliche Intelligenz auftauchen wird, über die ich Science-Fiction schreibe und Filme mache.

Aber alles ist alles andere als rosig. Zum Beispiel gab es neulich Informationen, dass die KI versuchte, den Test in höherer Mathematik (Schultest, Standard für Großbritannien) zu bestehen und dies nicht konnte.

Grundsätzlich können die Fehlerursachen ohne große Schwierigkeiten erklärt werden. Eine Person bei der Lösung mathematischer Probleme beinhaltet also die folgenden Fähigkeiten und Fertigkeiten.

Es ändert im Wesentlichen Symbole für sich selbst, wie Zahlen, arithmetische Operatoren, Variablen (die Funktionen in einem Komplex bilden) und Wörter (Definition einer Frage, Bedeutung einer Aufgabe usw.).

  • Planung (z. B. Rangfolgefunktionen in der Reihenfolge, die zur Lösung eines mathematischen Problems erforderlich ist).
  • Verwendung von Hilfsalgorithmen zum Zusammenstellen von Funktionen (Addition, Multiplikation).
  • Verwenden des Kurzzeitgedächtnisses zum Speichern von Zwischenwerten (z. B. h (f (x))).
  • In die Praxis umgesetztes Wissen über Regeln, Transformationen, Prozesse und Axiome.

DeepMind wurde an einer Auswahl verschiedener Arten von mathematischen Problemen und Problemen geschult und getestet. Die Entwickler verwendeten kein Crowdsourcing, sondern synthetisierten einen Datensatz, um eine große Anzahl von Testaufgaben zu generieren, ihre Komplexität zu kontrollieren usw. Das Entwicklungsteam verwendete ein "Freiform" -Textdatenformat.

Die ersten Daten basierten auf Aufgaben aus einer Auswahl von Aufgaben für Schüler an britischen Schulen (unter 16 Jahren). Die Aufgaben wurden aus Richtungen wie Arithmetik, Algebra, Wahrscheinlichkeitstheorie usw. übernommen.

Das DeepMind-Team entschied sich für eine neuronale Netzwerkarchitektur zur Lösung mathematischer Probleme und entschied sich für LSTM ( Langzeit-Kurzzeitgedächtnis ) und Transformer (eine neuronale Netzwerkarchitektur für die Arbeit mit Sequenzen).

DeepMind testete zwei LSTM-Modelle für die Arbeit mit mathematischen Problemen: ein einfaches LSTM und ein Attentional LSTM, deren Betriebsschema in der folgenden Abbildung dargestellt ist.



Unten sehen Sie ein Diagramm des Transformatormodells.



Das Ergebnis war nicht so gut. Nur 35% der KI-Antworten waren korrekt. Dies ist eine unbefriedigende Einschätzung nach den Standards einer Schule.



Natürlich haben Forscher von DeepMind gerade mit der Arbeit mit Mathematik und KI begonnen. In Zukunft ist ein größerer Erfolg zu erwarten, wie dies bei demselben AlphaGo der Fall war.

Die vollständigen Studiendaten finden Sie unter diesem Link .


Source: https://habr.com/ru/post/de447120/


All Articles