
Computer verwandelten Arbeit und Unterhaltung, Transport und Medizin, Spiele und Sport. Und trotz all ihrer Kraft sind diese Maschinen immer noch nicht in der Lage, die einfachsten Aufgaben auszuführen, die ein Kind ausführen kann - zum Beispiel in einem unbekannten Raum zu bewegen oder einen Bleistift zu verwenden.
Schließlich wird eine Lösung für dieses Problem verfügbar. Es wird an der Schnittstelle zweier Forschungsbereiche erscheinen: der umgekehrten Entwicklung des Gehirns und dem üppig blühenden Bereich der künstlichen Intelligenz. In den nächsten 20 Jahren werden diese beiden Bereiche zusammengeführt und eine neue Ära intelligenter Maschinen eingeleitet.
Warum müssen wir verstehen, wie das Gehirn arbeitet, um intelligente Autos zu bauen? Obwohl Techniken des maschinellen Lernens wie tiefe neuronale Netze in jüngster Zeit beeindruckende Ergebnisse gezeigt haben, sind sie noch weit davon entfernt, intelligent zu sein und die Welt um uns herum so zu verstehen und zu handeln, wie wir es tun. Das einzige Beispiel für Intelligenz, die Fähigkeit, einen Plan zu lernen, zu planen und auszuführen, ist das Gehirn. Daher müssen wir die Prinzipien verstehen, die der menschlichen Intelligenz zugrunde liegen, und sie bei der Entwicklung wirklich intelligenter Maschinen verwenden.
Unsere Firma
Numenta in Redwood City, pc. In Kalifornien untersuchen wir den
Neokortex (den neuen Kortex) - die größte der Komponenten des Gehirns und die Hauptkomponente, die für die Intelligenz verantwortlich ist. Unser Ziel ist es, zu verstehen, wie es funktioniert, und die Prinzipien zu identifizieren, die dem menschlichen Bewusstsein zugrunde liegen. In den letzten Jahren haben wir große Erfolge in unserer Arbeit erzielt, indem wir verschiedene Eigenschaften der biologischen Intelligenz definiert haben, von denen wir glauben, dass sie in zukünftige Denkmaschinen integriert werden sollten.
Um diese Eigenschaften zu verstehen, müssen Sie mit den Grundlagen der Biologie beginnen. Das menschliche Gehirn ähnelt dem Gehirn von Reptilien. Sie haben ein Rückenmark, das die Reflexe steuert. ein Hirnstamm, der autonomes Verhalten wie Atmung und Herzfrequenz steuert; mittleres Gehirn, Kontrolle der Emotionen und einfaches Verhalten. Aber Menschen und alle Säugetiere haben etwas, was Reptilien nicht haben: einen Neokortex.
Neocortex ist ein 2 mm dickes gefaltetes Blatt. Wenn es gedehnt werden könnte, hätte es die Größe einer großen Serviette. Beim Menschen nimmt es 75% des Gehirns ein. Es ist dieser Teil davon, der uns schlau macht.
Bei der Geburt weiß der Neokortex fast nichts, er lernt durch Erfahrung. Alles, was wir über die Welt lernen - Autofahren, Kaffee kochen in einem Automaten und Tausende anderer Dinge, mit denen wir jeden Tag interagieren - wird im Neokortex gespeichert. Er lernt, was diese Objekte sind, wo sie sind und wie sie sich verhalten. Der Neocortex generiert Befehle für die Motilität. Wenn Sie also Essen kochen oder ein Programm schreiben, ist es der Neocortex, der dieses Verhalten steuert. Eine Sprache wird auch vom Neokortex erzeugt und verstanden.
Der Neokortex besteht wie das gesamte Gehirn und das Nervensystem aus Zellen, die als Neuronen bezeichnet werden. Um zu verstehen, wie das Gehirn funktioniert, müssen wir daher mit
Neuronen beginnen . Ihr Neokortex enthält ungefähr 30 Milliarden Neuronen. Ein typisches Neuron hat ein schwanzartiges
Axon und mehrere baumartige Verlängerungen -
Dendriten . Wenn Sie sich vorstellen, dass ein Neuron ein bestimmtes Signalsystem ist, dann ist ein Axon ein Sender und Dendriten sind Empfänger. Auf den Zweigen der Dendriten befinden sich 5.000 bis 10.000 Synapsen, von denen jede mit denselben Synapsen anderer Neuronen verbunden ist. Insgesamt gibt es mehr als
100 Billionen synaptische Verbindungen im Gehirn.
Ihre Erfahrung mit der Außenwelt - dass Sie das Gesicht Ihres Freundes erkennen, die Musik genießen, Seife in der Hand halten - ergab sich aus den Eingaben von Augen, Ohren und anderen Sinnen, die an Ihren Neokortex und erzwungene Gruppen von Neuronen weitergegeben wurden trainieren. Wenn ein Neuron feuert, wandert sein elektrochemischer Ausbruch entlang des Axons und gelangt über die Synapsen zu anderen Neuronen. Wenn das empfangende Neuron genügend Eingangsimpulse empfängt, kann es als Antwort auslösen und andere Neuronen aktivieren. Von den 30 Milliarden im Neokortex enthaltenen Neuronen arbeiten 1-2% zu jedem Zeitpunkt, was bedeutet, dass Millionen von Neuronen zu einem bestimmten Zeitpunkt aktiv sind. Die Menge der aktiven Neuronen ändert sich, wenn Sie sich bewegen und mit der Welt interagieren. Ihr Friedensgefühl, das Sie als vernünftige Erfahrung betrachten, wird durch das sich ständig ändernde Muster aktiver Neuronen bestimmt.
Im Neokortex werden diese Zeichnungen aufgrund der Bildung neuer Synapsen gespeichert. Durch ihre Speicherung können Sie Gesichter und Orte erkennen, wenn Sie sie wieder sehen, und sie aus dem Speicher abrufen. Wenn Sie beispielsweise an das Gesicht Ihres Freundes denken, erscheint im Neokortex ein Muster ausgelöster Neuronen, ähnlich dem Muster, das angezeigt wird, wenn Sie sein Gesicht wirklich sehen.
Es ist erstaunlich, wie einfach und komplex der Neokortex ist. Es ist komplex, weil es in Dutzende von Orten unterteilt ist, von denen jeder für verschiedene bewusste Funktionen verantwortlich ist. In jeder Region gibt es viele Schichten von Neuronen sowie Dutzende von Arten von Neuronen, und diese Neuronen sind zu komplexen Komplexen verbunden.
Neocortex kann als einfach bezeichnet werden, da die Details jeder Site fast gleich sind. Im Verlauf der Evolution ist ein einziger Algorithmus erschienen, der für alles gilt, was der Neokortex tut. Die Existenz eines solchen universellen Algorithmus ist eine aufregende Tatsache, denn wenn wir ihn entschlüsseln können, können wir zum Kern des Konzepts der „Intelligenz“ gelangen und dieses Wissen in zukünftige Maschinen einbringen.
Aber ist es nicht das, was KI tut? Sind nicht alle AIs auf "
neuronalen Netzen " aufgebaut, die denen im Gehirn ähnlich sind? Nicht wirklich. KI-Technologien beziehen sich zwar auf die Neurobiologie, verwenden jedoch ein stark vereinfachtes Neuronenmodell, bei dem die Hauptaspekte realer Neuronen übersehen werden, und sie sind nicht auf die gleiche Weise miteinander verbunden wie in der realen und komplexen Gehirnarchitektur. Es gibt viele Unterschiede, und sie sind wichtig. Aus diesem Grund leisten die heutigen AIs gute Arbeit mit Bildmarkierungen oder Spracherkennung, können jedoch nicht kreativ argumentieren, planen und handeln.
Die jüngsten Fortschritte beim Verständnis der Funktionsweise des Neokortex führen dazu, dass wir darüber spekulieren, wie Denkmaschinen der Zukunft angeordnet werden können. Ich werde versuchen, diese Aspekte der biologischen Intelligenz zu beschreiben, die notwendig sind, aber in der modernen KI fehlen. Dies sind Schulungen zum Zusammenbau, verteilte Darstellungen und Implementierungen im Zusammenhang mit der Verwendung von Bewegung, um die Realitäten der Welt zu lehren.
Lernen durch Umverdrahtung: Das Gehirn weist erstaunliche lernbezogene Eigenschaften auf. Zuerst lernen wir schnell. Zweitens erfolgt die Ausbildung schrittweise. Wir können etwas Neues lernen, ohne das Gehirn von Grund auf zu trainieren und ohne zu vergessen, was uns bereits beigebracht wurde. Drittens lernt das Gehirn ständig. Wenn wir uns um die Welt bewegen, planen und handeln, hören wir nicht auf zu lernen. Schnelle, inkrementelle und fortlaufende Schulungen sind unverzichtbare Bestandteile, die es intelligenten Systemen ermöglichen, sich an eine sich verändernde Welt anzupassen. Neuronen sind für das Lernen verantwortlich und die Komplexität realer Neuronen macht sie zu einer leistungsstarken Lernmaschine.
In den letzten Jahren haben Neurowissenschaftler einige interessante Fakten über Dendriten erfahren. Jeder seiner Zweige arbeitet als Mustererkennungssatz. Es stellt sich heraus, dass 15 bis 20 aktive Synapsen auf dem Zweig ausreichen, um ein Aktivitätsmuster in einer großen Anzahl von Neuronen zu erkennen. Daher kann ein einzelnes Neuron Hunderte verschiedener Muster erkennen. Einige von ihnen sorgen dafür, dass es funktioniert, während andere den internen Zustand der Zelle ändern und als Vorhersagen für zukünftige Aktionen dienen.
Zu einer Zeit glaubten Neurowissenschaftler, dass das Lernen ausschließlich durch Modifizieren der Wirksamkeit vorhandener Synapsen erfolgt, so dass die Wahrscheinlichkeit, dass sich ein Neuron durch eine Synapse einschaltet, abnimmt oder zunimmt, wenn ein eingehendes Signal eintrifft. Aber jetzt wissen wir bereits, dass der größte Teil des Trainings auf die Kultivierung neuer Synapsen zwischen Zellen zurückzuführen ist - es gibt eine „Wiederzusammenstellung“ des Gehirns. Bis zu 40% der Neuronensynapsen werden täglich durch neue ersetzt. Neue Synapsen führen zur Entstehung neuer Kommunikationsschemata zwischen Neuronen und folglich zu neuen Erinnerungen. Da die Zweige der Dendriten praktisch unabhängig sind, hindert ein Neuron das Neuron nicht daran, bereits mit anderen Dendriten zu lernen, wenn es lernt, ein neues Muster auf einem der Dendriten zu erkennen.
Deshalb können wir neue Dinge lernen, ohne alte Erinnerungen zu zerstören, und wir müssen unser Gehirn nicht jedes Mal von Grund auf neu trainieren, wenn wir etwas Neues lernen. Heutige neuronale Netze verfügen nicht über solche Fähigkeiten.
Intelligente Maschinen müssen nicht die gesamte Komplexität biologischer Neuronen simulieren, aber die Möglichkeiten, die Dendriten und das Training durch Zusammenbau bieten, sind ein Muss. Diese Funktionen sollten in zukünftigen KI-Systemen vorhanden sein.
Verteilte Ansichten: Das Gehirn und der Computer präsentieren Informationen auf unterschiedliche Weise. Eine beliebige Kombination von Nullen und Einsen ist möglicherweise im Arbeitsspeicher des Computers möglich. Wenn Sie also ein Bit ändern, kann dies zu einer vollständigen Änderung der Bedeutung führen. Ebenso wie das Ersetzen der Buchstaben "o" durch "und" im Wort "cat" etwas erzeugt, das nichts damit zu tun hat das Wort "Wal". Diese Ansicht ist unzuverlässig.
Das Gehirn nutzt das sogenannte
spärlich verteilte Darstellungen (SDR). Sie werden als spärlich bezeichnet, da zu einem bestimmten Zeitpunkt nur relativ wenige Neuronen aktiv sind. Die Aktivität von Neuronen ändert sich ständig, wenn Sie sich bewegen oder denken, aber ihr Prozentsatz ist immer gering. Wenn wir uns vorstellen, dass jedes Neuron ein Bit ist, verwendet das Gehirn Tausende von Bits, um Informationen darzustellen (viel mehr als eine 8-Bit- oder 64-Bit-Darstellung in einem Computer), aber zu jedem Zeitpunkt ist nur ein kleiner Teil der Bits 1; Alle anderen sind 0.
Angenommen, Sie möchten das Konzept einer Katze mithilfe von SDR einführen. Sie können 10.000 Neuronen verwenden, von denen 100 aktiv sind. Jedes der aktiven Neuronen repräsentiert einen bestimmten Aspekt der Katze, z. B. "Haustier", "Flauschig", "Kralle". Wenn mehrere Neuronen sterben oder mehrere neue beitreten, ist der neue SDR immer noch eine gute Idee für die Katze, da die aktiven Neuronen größtenteils gleich sind. Somit ist der SDR anstelle einer unzuverlässigen Darstellung fehler- und rauschresistent. Wenn wir Siliziumversionen des Gehirns erstellen, sind diese inhärent fehlertolerant.
Ich möchte zwei Funktionen von SDR erwähnen. Erstens erleichtert das Überlappen den Vergleich zweier Dinge und ermöglicht es Ihnen zu verstehen, wie ähnlich sie sind und wie sie sich unterscheiden. Angenommen, ein SDR repräsentiert eine Katze und der andere einen Vogel. In beiden SDRs sind die gleichen Gruppen von Neuronen aktiv, die "Haustier" und "Krallen" darstellen, jedoch nicht "flauschig". Das Beispiel ist vereinfacht, aber die Überlagerungseigenschaft ist wichtig, da das Gehirn dank dieser Eigenschaft die Ähnlichkeit und den Unterschied von Objekten sofort versteht. Diese Eigenschaft gibt ihm die Möglichkeit, zu verallgemeinern, was Computern fehlt.
Die zweite Eigenschaft, die Assoziation, ermöglicht es dem Gehirn, mehrere Ideen gleichzeitig darzustellen. Stellen Sie sich vor, ich sehe ein Tier im Gebüsch laufen, aber ich konnte es nur kurz sehen, also bin ich mir nicht sicher, was ich gesehen habe. Es könnte eine Katze, ein Hund oder ein Affe sein. Da der SDR verteilt ist, kann eine Reihe von Neuronen alle drei SDRs gleichzeitig aktivieren und nicht miteinander verwechseln, da sich die SDRs nicht gegenseitig stören. Die Fähigkeit von Neuronen, ständig SDR-Pools zu bilden, macht sie zu einem guten Werkzeug für den Umgang mit Unsicherheiten.
Diese SDR-Eigenschaften sind für das Verständnis, Denken und Planen im Gehirn von grundlegender Bedeutung. Ohne SDR können wir keine intelligenten Maschinen erstellen.
Ausführungsform: Der Neokortex erhält Eingaben von den Sinnen. Jedes Mal, wenn wir unsere Augen, Gliedmaßen oder den Oberkörper bewegen, ändert sich die Eingabe der Sinne. Diese sich ständig ändernde Eingabe ist der Hauptmechanismus, den das Gehirn zum Lernen verwendet. Stellen Sie sich vor, Sie geben Ihnen ein Objekt, das Sie zuvor noch nicht gesehen haben. Lass es ein Hefter sein. Wie wirst du es studieren? Sie können es umgehen, indem Sie es aus verschiedenen Blickwinkeln betrachten. Sie können heben, mit den Fingern halten, in den Händen drehen. Sie können drücken und ziehen, um zu sehen, wie er sich verhält. In diesem interaktiven Prozess untersuchen Sie die Form des Hefters, Ihre Gefühle dazu, wie er aussieht und wie er sich verhält. Sie machen Bewegungen, spüren die Veränderung der Eingabe, machen eine weitere, spüren die Veränderung erneut und so weiter. Lernen durch Bewegung ist der Hauptweg, um das Gehirn zu lernen. Dies wird die zentrale Komponente eines wirklich intelligenten Systems sein.
Ich möchte nicht sagen, dass eine intelligente Maschine einen physischen Körper braucht - nur dass sie Empfindungen durch Bewegung verändern kann. Beispielsweise kann sich eine virtuelle KI durch das Web „bewegen“, indem sie Links folgt und Dateien öffnet. Er kann die Struktur der virtuellen Welt durch virtuelle Bewegungen untersuchen, ähnlich wie wir um ein Gebäude herumgehen.
Dies bringt uns zu der wichtigen Entdeckung, die letztes Jahr in Numenta gemacht wurde. Im Neokortex werden Sensationsdaten durch eine Hierarchie von Plots verarbeitet. Wenn Daten von einer Hierarchieebene zu einer anderen übertragen werden, werden immer komplexere Merkmale daraus extrahiert, bis das Objekt irgendwann nicht mehr erkannt werden kann. Deep-Learning-Netzwerke verwenden ebenfalls Hierarchien, erfordern jedoch häufig 100 Verarbeitungsebenen für die Bilderkennung, und ein Neokortex, um das gleiche Ergebnis zu erzielen, kostet nur vier. Deep-Learning-Netzwerke erfordern auch Millionen von Trainingsbeispielen, und der Neocortex kann mit nur wenigen Bewegungen und Empfindungen neue Objekte lernen. Das Gehirn macht etwas grundlegend anderes als ein typisches künstliches neuronales Netzwerk - aber was?
Der deutsche Helmholtz , ein deutscher Physiker des 19. Jahrhunderts, war einer der ersten, der eine Antwort auf diese Frage gab. Er sah, dass unsere visuelle Wahrnehmung stabil bleibt, obwohl sich unsere Augen drei- bis viermal pro Sekunde bewegen. Er berechnete, dass das Gehirn Augenbewegungen berücksichtigt, sonst scheint es uns, dass die ganze Welt hier und da springt. Wenn Sie etwas berühren, wären Sie ebenfalls verblüfft, wenn Ihr Gehirn nur mit taktilen Empfindungen umgehen würde und nicht wüsste, dass sich Ihre Finger bewegen. Dieses Prinzip der Kombination von Bewegungen mit Änderungen der Empfindungen wird als
sensomotorische Integration bezeichnet . Wie und wo die sensomotorische Integration im Gehirn stattfindet, war ein Rätsel.
Wir entdeckten, dass die sensomotorische Integration in allen Teilen des Neokortex stattfindet. Dies ist kein separater Schritt, sondern ein wesentlicher Bestandteil der Verarbeitung von Empfindungen. Die sensomotorische Integration ist ein wesentlicher Bestandteil des „intelligenten Algorithmus“ des Neokortex. Wir haben eine Theorie und ein Modell, wie Neuronen dies tun können, und sie überschneiden sich gut mit der komplexen Anatomie der Neocortex-Region.
Welche Auswirkungen hat diese Entdeckung auf die Maschinenintelligenz? Betrachten Sie zwei Arten von Dateien, die Sie auf einem Computer finden können. Eines ist das von der Kamera aufgenommene Bild, und das andere ist ein Design, das auf einem Computer entwickelt wurde, beispielsweise eine Autodesk-Datei. Ein Bild ist eine zweidimensionale Anordnung visueller Details. Eine CAD-Datei besteht ebenfalls aus einer Reihe von Teilen, die jedoch jeweils einer Anordnung im dreidimensionalen Raum zugeordnet sind. Eine CAD-Datei simuliert dreidimensionale Objekte und nicht, wie das Objekt aus einer bestimmten Perspektive aussieht. Mit einer CAD-Datei können Sie vorhersagen, wie ein Objekt von jedem Standpunkt aus aussehen wird, und bestimmen, wie es mit anderen dreidimensionalen Objekten interagiert. Sie können dies nicht mit einem Bild tun. Wir haben festgestellt, dass jeder Abschnitt des Neokortex dreidimensionale Modelle von Objekten ähnlich wie ein CAD-Programm lernt. Jedes Mal, wenn sich Ihr Körper bewegt, nimmt der Neokortex den aktuellen Motilitätsbefehl wahr, wandelt ihn in eine Position im Koordinatensystem des Objekts um und kombiniert diese Position mit Daten, die von den Sinnen erhalten wurden, um dreidimensionale Modelle der Welt zu erstellen.
Rückblickend ist diese Beobachtung sinnvoll. Intelligente Systeme müssen mehrdimensionale Modelle der Welt lernen. Die sensomotorische Integration findet nicht in mehreren Teilen des Gehirns statt - dies ist das Hauptprinzip seiner Funktionsweise, Teil des Intelligenzalgorithmus. Intelligente Maschinen müssen genau das tun.
Diese drei Hauptaspekte des Neokortex - Zusammenbau-Training, verteilte Ansichten und sensomotorische Integration - werden die Eckpfeiler der Maschinenintelligenz sein. Denkmaschinen der Zukunft mögen viele Aspekte der Biologie ignorieren, aber nicht diese drei. Ohne Zweifel erwarten uns andere Entdeckungen auf dem Gebiet der Neurobiologie, die andere Merkmale des Bewusstseins beleuchten, die in Zukunft in solchen Maschinen enthalten sein müssen, aber Sie können mit dem beginnen, was wir heute wissen.
Von den frühesten Tagen der KI an lehnten Kritiker die Idee ab, das menschliche Gehirn zu emulieren, und argumentierten normalerweise, dass „Flugzeuge nicht mit den Flügeln schlagen“. Tatsächlich untersuchten
Wilbur und Orville Wright Vögel im Detail. Um Auftrieb zu schaffen, untersuchten sie die Form der Flügel von Vögeln und testeten sie in einem Windkanal. Als treibende Kraft wandten sie sich einem anderen Bereich als der Luftfahrt zu - einem Propeller und einem Motor. Um den Flug zu kontrollieren, beobachteten sie, wie die Vögel ihre Flügel drehten, um eine Rolle zu erzeugen, und ihre Schwänze verwendeten, um die Höhe aufrechtzuerhalten. Das haben sie getan. Bisher verwenden Flugzeuge diese Methode, obwohl wir nur eine Kante an den Flügeln drehen. Kurz gesagt, die Gebrüder Wright untersuchten Vögel und entschieden dann, welche Elemente des Fluges für den Flug von Menschen notwendig sind und welche ignoriert werden können. Genau das werden wir tun, um Denkmaschinen zu schaffen.
Wenn ich an die Zukunft denke, mache ich mir Sorgen darüber, dass unsere Ziele nicht ehrgeizig genug sind. Für heutige Computer ist es großartig, Bilder zu klassifizieren und Sprache zu erkennen, aber wir sind nicht nahe daran, wirklich intelligente Maschinen zu entwickeln. Ich glaube, dass es für uns wichtig ist, dies zu tun. Zukünftige Erfolge und sogar das Überleben der Menschheit können davon abhängen. Wenn wir zum Beispiel andere Planeten bevölkern wollen, brauchen wir Maschinen, die zu unseren Gunsten für Flüge im Weltraum, den Bau von Einrichtungen, die Gewinnung von Ressourcen und die unabhängige Lösung komplexer Probleme in einer Umgebung eingesetzt werden, in der Menschen nicht überleben können. Auf der Erde sind wir mit den Problemen von Krankheit, Klima und Energiemangel konfrontiert. Intelligente Autos können uns helfen. Zum Beispiel ist es möglich, intelligente Maschinen herzustellen, die empfindlich sind und im molekularen Maßstab arbeiten können.Sie könnten über die Faltung von Proteinen und die Genexpression genauso sprechen wie über Computer und Hefter. Sie konnten millionenfach schneller denken und handeln als Menschen. Solche Maschinen könnten Krankheiten behandeln und unsere Welt in einem bewohnbaren Zustand halten.In den 1940er Jahren waren Pioniere des Computerzeitalters der Ansicht, dass Computer weit gehen und sehr nützlich sein würden und dass sie wahrscheinlich die menschliche Gesellschaft verändern würden. Aber sie konnten nicht genau vorhersagen, wie Computer unser Leben verändern werden. Ebenso können wir sicher sein, dass wirklich intelligente Maschinen unsere Welt zum Besseren verändern werden, auch wenn wir heute nicht genau vorhersagen können, wie. Nach 20 Jahren blicken wir zurück und stellen fest, dass in unserer Zeit Durchbrüche in der Theorie des Gehirns und des maschinellen Lernens die Ära der realen maschinellen Intelligenz begannen.