Eine Reihe von Aufgaben für das Training, die von einer starken KI im Rahmen der universellen OpenAI-Plattform unterstützt werden.Die von Ilon Mask und Mitarbeitern gegründete gemeinnützige Organisation OpenAI, die sichere (d. H. Öffentliche und offene) künstliche Intelligenz schaffen will, hat den nächsten Schritt zur Umsetzung ihrer Pläne unternommen. OpenAI führte die Universe Middleware ein, um starke KI zu trainieren und zu lernen. Theoretisch kann ein Training zu allen Informationen der Menschheit stattfinden, die über das Internet verfügbar sind. Dies sind Spiele, Websites und andere Anwendungen.Nur neun Codezeilen - und Ihre KI kann auf Tausende von Trainingsumgebungen zugreifen.Bei Verwendung der Universe-Softwareplattform verwendet ein intelligenter Agent einen Computer genauso wie eine Person: Er betrachtet die Pixel des Computerbildschirms und interagiert mit Tastatur und Maus (während er virtuell ist).
Künstliche Intelligenz lernt die Welt über die VNC-Schnittstelle für den Fernzugriff auf den Desktop.Sie soll den intelligenten Agenten in einer Reihe von Aufgaben schulen. Die Universe-Plattform öffnet für AI alle Aufgaben, die eine Person am Computer lösen kann.OpenAI Gym-Umgebungen
Die Eröffnung einer universellen universellen Plattform ist eine Fortsetzung der geplanten Maßnahmen von OpenAI zur Schaffung einer weltweit offenen universellen KI. Im April dieses Jahres veröffentlichte die Organisation eine öffentliche Beta-Version des OpenAI Gym- Toolkits , um Verstärkungslernalgorithmen zu entwickeln und zu vergleichen. Das "Fitnessstudio" OpenAI Gym besteht aus einer Vielzahl von Umgebungen (von einem humanoiden Robotersimulator bis zu Atari-Spielen ). Es gibt eine Website zum Vergleichen und Reproduzieren der Ergebnisse .OpenAI Gym ist mit Algorithmen kompatibel, die in jedem Framework geschrieben wurden, einschließlich Tensorflow und Theano. Anfänglich werden Umgebungen in Python erstellt, aber in Zukunft planen Entwickler, die Implementierung in einer beliebigen Programmiersprache zu ermöglichen.OpenAI ist der Ansicht, dass das verstärkte Lernen ein wichtiger Weg des maschinellen Lernens ist, der die KI erheblich verbessern wird. Im Lernprozess mit dieser Methode lernt das Testsystem (Agent) durch Interaktion mit einer bestimmten Umgebung. Im Gegensatz zum traditionellen Unterricht mit einem Lehrer besteht die Antwort auf die getroffenen KI-Entscheidungen in Verstärkungssignalen, während einige Verstärkungsregeln dynamisch und schwer zu verstehen sind, dh auf der gleichzeitigen Aktivität formaler Neuronen beruhen.
Das Verstärkungssignal wird vom optischen Texterkennungsmodul mit einer Geschwindigkeit von 60 fps: Video erkanntMiddleware OpenAI Universe
Das heute vorgestellte Universum ist eine Middleware, die das OpenAI Gym Toolkit und die Laufzeitumgebungen vollständig unterstützt. Dank dieser Middleware ist geplant, die Anzahl der Umgebungen für das Training von KI radikal zu erhöhen.Früher umfasste der größte Katalog von Verstärkungslernanwendungen nur 55 Atari-Spiele (Atari-Lernumgebung), aber auf der Universe-Plattform werden Spiele voraussichtlich von vielen anderen Entwicklern, einschließlich Valve, EA und Microsoft, veröffentlicht.Von Anfang an sind Tausende von Spielen (Flash-Spiele, Multiplayer-Schlangen Slither , Starcraft, GTA V und andere), eine Vielzahl von Browser-Aufgaben (wie das Ausfüllen von Formularen) und Anwendungen (wie fold.it- Rätsel) über die Middleware von Universe verfügbar) Fast jedes Spiel frei über Bibliothek Python läuft Universum , die in der Open - Access auf Github veröffentlicht wird.import gym
import universe
env = gym.make('flashgames.DuskDrive-v0')
observation_n = env.reset()
while True:
action_n = [[('KeyEvent', 'ArrowUp', True)] for _ in observation_n]
observation_n, reward_n, done_n, info = env.step(action_n)
env.render()
Der obige Code startet einen Agenten für künstliche Intelligenz, um das Spiel Dusk Drive zu spielen .
Dusk Drive-Spiel„Unser oberstes Ziel ist es, einen einzigen intelligenten Agenten zu entwickeln, der in der Lage ist, die im Universum gesammelten Erfahrungen flexibel anzuwenden, um neue Probleme zu lösen und schnell neue Erfahrungen zu sammeln. Dies wird ein wichtiger Schritt in Richtung einer starken KI sein“, heißt es in der OpenAI-Erklärung. .Universe-Softwareumgebungen werden in Docker-Containern installiert. Wie bereits erwähnt, kommunizieren sie mit dem intellektuellen Agenten über die visuelle Schnittstelle - über den "Bildschirm", die "Tastatur" und die "Maus" wie mit einer Person. Die Schnittstelle wird mit dem VNC-Programm für den Fernzugriff auf den Desktop implementiert.Theoretisch wird ihm die ständige Verbesserung der KI-Fähigkeiten durch das Sammeln von Erfahrungen in verschiedenen kleinen Aufgaben helfen, jede neue Aufgabe unter Verwendung des vorhandenen Wissens immer schneller zu meistern. Die Plattform und der Satz von Universumsumgebungen können für intellektuelle Agenten dieselbe einheitliche Standardplattform für Training und Verstärkungstraining werden wie der ImageNet- Datensatz - eine Bilddatenbank zum Trainieren von Klassifikatoren für neuronale Netze beim Unterrichten mit einem Lehrer.Verstärktes Training kann in der Tat sehr effektiv sein. Zum Beispiel trainierte der Intellektuelle Agent des Universums etwa sechs Tage lang, um das Multiplayer-Webspiel Slither zu spielen. Nach sechs Tagen erhält die KI in Spielesitzungen durchschnittlich 1.000 Punkte mit einer maximalen Punktzahl von 1.400 Punkten. Zum Vergleich: Ein Mitarbeiter einer OpenAI-Organisation mit fünf Stunden Spielerfahrung erhält durchschnittlich 1.400 Punkte mit einem maximalen Ergebnis von 7050.Derzeit stehen Agenten über die Universe-Middleware die folgenden Spiele und Anwendungen von OpenAI-Partnern zur Verfügung: Portal , Fable Anniversary , World of Goo , RimWorld , Slime Rancher , Schaufelritter , SpaceChem, Wing Commander III , Command & Conquer: Roter Alarm 2 , Syndikat , Zauberteppich , Spiegelkante , Sid Meiers Alpha Centauri und Wolfram Mathematica . Die Liste wird erweitert.