Neue Wissenschaft, um die Ecke zu schauen

Forscher des Computer-Sehens haben eine verborgene Welt visueller Signale entdeckt, in der es unmerkliche Bewegungen gibt, die das Gesagte wiedergeben, und verschwommene Bilder von dem, was um die Ecke ist




Der Computer-Vision-Spezialist Antonio Torralba , der 2012 an der spanischen KĂŒste ruhte, bemerkte zufĂ€llige Schatten an der Wand seines Hotelzimmers, die von nichts abgeworfen zu werden schienen. Am Ende erkannte Torralba, dass die verfĂ€rbten Stellen an der Wand keine Schatten waren, sondern stumpfe, umgekehrte Bilder der Terrasse draußen. Das Fenster funktionierte wie eine Lochblende - die einfachste Art von Kamera, bei der Lichtstrahlen durch ein kleines Loch treten und auf der anderen Seite ein invertiertes Bild erzeugen. An der sonnenbeschienenen Wand war dieses Bild kaum zu erkennen. Aber Torralba erkannte, dass unsere Welt mit visuellen Informationen gefĂŒllt ist, die unsere Augen nicht wahrnehmen.

"Diese Bilder sind uns verborgen", sagte er, "aber sie umgeben uns stÀndig."

Die gesammelten Erfahrungen ermöglichten es ihm und seinem Kollegen Bill Freeman , ebenfalls Professor am Massachusetts Institute of Technology, zu erkennen, dass die Welt mit "zufĂ€lligen Kameras" gefĂŒllt ist, wie sie sie nennen: Fenster, Ecken, Zimmerpflanzen und andere gewöhnliche Objekte, die verborgene Bilder ihrer Umgebung erzeugen. Diese Bilder sind 1000-mal weniger lebendig als alles andere und normalerweise mit bloßem Auge nicht sichtbar. "Wir haben Wege gefunden, um diese Bilder zu isolieren und sichtbar zu machen", erklĂ€rte Freeman.

Sie erfuhren, wie viele visuelle Informationen direkt vor allen verborgen sind. In der ersten Arbeit haben sie gezeigt, dass bei Aufnahmen mit einem normalen iPhone Änderungen des Lichts an der Wand des Raums anhand des empfangenen Videos die Szene außerhalb des Fensters nachbilden können. Im vergangenen Herbst berichteten sie und ihre Kollegen , dass Sie eine Person finden können, die sich um eine Ecke bewegt, indem Sie Land in der NĂ€he der Ecke mit einer Kamera filmen. In diesem Sommer haben sie gezeigt, dass sie eine Heimpflanze auf Video aufnehmen und dann anhand der Schatten, die von den BlĂ€ttern der Pflanze geworfen werden, ein dreidimensionales Bild des gesamten Raums erstellen können. Oder sie können BlĂ€tter in ein „ visuelles Mikrofon “ verwandeln , ihre Vibrationen erhöhen und Sprache erkennen.


1) Die Terrasse vor dem Hotelzimmer, wo Antonio Torralba bemerkte, dass das Fenster wie ein Loch funktioniert. 2) Unscharfes Bild der Terrasse an der Wand; 3) Er kann geschĂ€rft werden, indem der grĂ¶ĂŸte Teil des Fensters mit Pappe abgedeckt wird, um die GrĂ¶ĂŸe des Lochs zu verringern. 4) Wenn Sie es auf den Kopf stellen, können Sie die Szene von außen sehen.

"Unsere Maria hatte einen Widder", sagt der Mann auf der Audioaufnahme, der aus den Bewegungen einer leeren TĂŒte Chips nachgebildet wurde, die Wissenschaftler 2014 durch ein schallisoliertes Fenster geschossen haben (dies sind die ersten Worte, die Thomas Edison 1877 auf einem Phonographen aufzeichnete).

Die Forschung, um Ecken zu schauen und Annahmen ĂŒber Objekte zu treffen, die nicht direkt sichtbar sind, oder „Bilder zu erstellen, die nicht in direkter Sichtlinie sind“, begann 2012 mit der Arbeit von Torralba und Freeman an einer zufĂ€lligen Kamera und mit einer weiteren wichtigen Arbeit , die von einer separaten Gruppe von Wissenschaftlern durchgefĂŒhrt wurde vom MIT unter der Leitung von Ramesh Raskar . Insbesondere im Jahr 2016 startete die Agentur fĂŒr fortgeschrittene Forschungsprojekte des US-Verteidigungsministeriums (DARPA) dank ihrer Ergebnisse das 27-Millionen-Dollar-REVEAL-Programm (RevolutionĂ€re Verbesserung der Sichtbarkeit durch Nutzung aktiver Lichtfelder - eine revolutionĂ€re Verbesserung der Sichtbarkeit mithilfe aktiver Lichtfelder). Das Programm finanziert bundesweit aufstrebende Laboratorien. Seitdem macht der Fluss neuer Ideen und mathematischer Tricks die Bildgebung ohne Sichtlinie immer leistungsfĂ€higer und praktischer.



Neben der offensichtlichen Verwendung fĂŒr MilitĂ€r- und AufklĂ€rungszwecke untersuchen Forscher die Anwendung von Technologie in Robomobilen, Robotersicht, medizinischer Fotografie, Astronomie, Weltraumforschung und Rettungsmissionen.

Torralba sagte, dass er und Freeman zu Beginn der Arbeit keine Ideen zur praktischen Anwendung der Technologie hatten. Sie verstanden einfach die Grundlagen der Bilderzeugung und was eine Kamera ist, woraus sich eine umfassendere Untersuchung des Verhaltens von Licht und seiner Wechselwirkung mit Objekten und OberflĂ€chen auf natĂŒrliche Weise entwickelte. Sie begannen Dinge zu sehen, an die niemand denken konnte. Laut Torralb zeigen psychologische Untersuchungen, dass „Menschen schrecklich schlecht darin sind, Schatten zu interpretieren. Vielleicht ist einer der GrĂŒnde dafĂŒr, dass viele der Dinge, die wir sehen, keine Schatten sind. Und am Ende warfen meine Augen Versuche, sie zu verstehen. "

ZufÀllige Kameras


Die Lichtstrahlen, die das Bild der Welt außerhalb unseres Sichtfeldes tragen, fallen stĂ€ndig auf WĂ€nde und andere OberflĂ€chen, danach werden sie reflektiert und fallen in unsere Augen. Aber warum sind diese visuellen RĂŒckstĂ€nde so schwach? Es ist nur so, dass zu viele Strahlen in zu viele Richtungen gehen und die Bilder verschwimmen.

Um ein Bild zu erzeugen, ist es notwendig, die auf die OberflĂ€che einfallenden Strahlen ernsthaft zu begrenzen und nur einen bestimmten Satz von ihnen zu sehen. Das macht die Lochkamera. Die ursprĂŒngliche Idee von Torralba und Freeman im Jahr 2012 war, dass es in unserer Umgebung einige Objekte und verschiedene Eigenschaften gibt, die die Lichtstrahlen auf natĂŒrliche Weise begrenzen und schwache Bilder erzeugen, die ein Computer erkennen kann.

Je kleiner die Lochblende ist, desto schĂ€rfer ist das Bild, da jeder Punkt des untersuchten Objekts nur einen Lichtstrahl im rechten Winkel aussendet, der durch das Loch hindurchtreten kann. Das Fenster im Torralba Hotel war zu groß, als dass das Bild scharf wĂ€re, und er und Freeman erkannten, dass allgemein nĂŒtzliche zufĂ€llige Lochkameras ziemlich selten waren. Sie stellten jedoch fest, dass Anti-Pinholes („Pin-Point“ -Kameras), die aus kleinen Objekten bestehen, die das Licht blockieren, reichlich Bilder bilden.


Bill Freeman


Antonio Torralba

Stellen Sie sich vor, Sie entfernen die Innenwand eines Raums durch eine LĂŒcke in den Jalousien. Sie werden nicht viel sehen. Plötzlich erscheint eine Hand in Ihrem Sichtfeld. Ein Vergleich der LichtintensitĂ€t an der Wand in Gegenwart und Abwesenheit einer Hand liefert nĂŒtzliche Informationen ĂŒber die Szene. Eine Reihe von Lichtstrahlen, die im ersten Bild auf eine Wand fallen, wird im nĂ€chsten Bild vorĂŒbergehend von der Hand blockiert. Subtrahieren Sie die Daten des zweiten Frames von den Daten des ersten, wie Freeman sagt: „Sie können berechnen, was die Hand blockiert hat“ - eine Reihe von Lichtstrahlen, die das Bild eines Teils des Raums darstellen. "Wenn Sie untersuchen, was Licht blockiert und was Licht durchlĂ€sst", sagte er, "können Sie die Anzahl der Stellen erweitern, an denen Sie Lochkameras finden."

Zusammen mit der Untersuchung von Zufallskameras, die kleine Änderungen der IntensitĂ€t wahrnehmen, entwickelten Freeman und Kollegen Algorithmen, die kleine FarbĂ€nderungen bestimmen und verstĂ€rken - beispielsweise eine Änderung der Gesichtsfarbe einer Person, wenn das Blut rauscht oder verebbt, und winzige Bewegungen - aus diesem Grund Sie können ein GesprĂ€ch aufzeichnen, indem Sie eine TĂŒte Chips nehmen. Jetzt können sie leicht die Bewegung eines Hundertstel Pixels bemerken, die unter normalen Bedingungen einfach im Rauschen ertrinken wĂŒrde. Ihre Methode konvertiert Bilder mathematisch in eine Sinuswellenkonfiguration. In dem resultierenden Raum dominiert das Rauschen das Signal nicht, da die Sinuskurven die ĂŒber viele Pixel aufgenommenen Durchschnittswerte darstellen, so dass das Rauschen ĂŒber sie verteilt wird. Dank dessen können Forscher die Verschiebungen von Sinuskurven von einem Bild des Videos zum anderen bestimmen, diese Verschiebungen verstĂ€rken und die Daten dann zurĂŒckkonvertieren.

Jetzt haben sie begonnen, all diese Tricks zu kombinieren, um versteckte visuelle Informationen zu extrahieren. Eine Studie, die im vergangenen Oktober von Katie Bowman (damals eine von Freeman geleitete Studentin und jetzt Wissenschaftlerin des Harvard-Smithsonian Astrophysical Center) beschrieben wurde, zeigte, dass GebÀudeecken wie Kameras funktionieren und ein grobes Bild von dem erzeugen, was sich um die Ecke befindet.


Wenn Sie Penumbra in der NĂ€he der Ecke auf den Boden nehmen (1), können Sie Informationen ĂŒber Objekte erhalten, die sich um die Ecke befinden (2). Wenn sich unsichtbare Objekte zu bewegen beginnen, bewegen sich das Licht und die Schatten von ihnen in unterschiedlichen Winkeln zur Wand. Kleine Änderungen in IntensitĂ€t und Farbe können normalerweise nicht mit bloßem Auge unterschieden werden (3), sondern können mithilfe von Algorithmen verbessert werden. Primitive Videos mit Licht in verschiedenen Winkeln zum Halbschatten zeigen die Anwesenheit einer sich bewegenden Person (4) und zwei (5) um die Ecke.

Facetten und Ecken behindern wie Nadellöcher mit Punktkameras den Durchgang von Sonnenlicht. Mit gewöhnlichen Kameras, demselben iPhone, schossen Bowman und seine Kollegen bei Tageslicht Halbschatten an der Ecke des GebĂ€udes - einem Bereich mit Schatten, die von einer Teilmenge von Lichtstrahlen beleuchtet werden, die aus einem verborgenen Bereich um die Ecke kommen. Wenn zum Beispiel ein Mann in einem roten Hemd dort vorbeikommt, sendet dieses Hemd eine kleine Menge rotes Licht in die Halbschatten, und dieses Licht bewegt sich entlang der Halbschatten, wĂ€hrend die Person geht, fĂŒr das normale Auge unsichtbar, aber nach der Nachbearbeitung erkannt.

In einer revolutionĂ€ren Arbeit, die im Juni veröffentlicht wurde, haben Freeman und Kollegen das „Lichtfeld“ des Raums - ein Bild der IntensitĂ€t und Richtung der Lichtstrahlen in einem Raum - aus Schatten nachgebildet, die von einer Laubpflanze neben der Wand geworfen wurden. Die BlĂ€tter fungierten als Punktkameras, von denen jede ihre eigenen Lichtstrahlen blockierte. Ein Vergleich des Schattens jedes Blattes mit dem Rest der Schatten erzeugte diesen fehlenden Satz von Strahlen und ermöglichte es, ein Bild eines Teils der verborgenen Szene zu erhalten. Angesichts der Parallaxe konnten die Forscher dann alle diese Bilder zusammenfĂŒhren.

Dieser Ansatz liefert viel schĂ€rfere Bilder als die frĂŒhere Arbeit mit zufĂ€lligen Kameras, da der Algorithmus bereits Kenntnisse ĂŒber die Welt erworben hat. Die Forscher kannten die Form der Pflanze, gingen davon aus, dass die natĂŒrlichen Bilder glatt sein sollten, und berĂŒcksichtigten mehrere andere Annahmen. Sie konnten bestimmte Schlussfolgerungen hinsichtlich der rauschhaltigen Signale ziehen, was dazu beitrug, das endgĂŒltige Bild schĂ€rfer zu machen. Die Technologie der Arbeit mit einem Lichtfeld "erfordert Kenntnisse der umgebenden Welt, um den Wiederaufbau zu ermöglichen, aber sie liefert Ihnen auch viele Informationen", sagte Torralba.

Streulicht


In der Zwischenzeit enthĂŒllen Freeman, Torralba und ihr SchĂŒtzling Bilder, die an anderer Stelle auf dem MIT-Campus versteckt waren. Ramesh Raskar, ein Computer-Vision-Spezialist, der bei TED sprach, beabsichtigt, „die Welt zu verĂ€ndern“ und einen Ansatz namens „Active Imaging“ zu wĂ€hlen. Es verwendet spezielle, teure Laserkamerasysteme, um hochauflösende Bilder zu erstellen, die anzeigen, was um die Ecke ist.


Ramesh Raskar

Im Jahr 2012 haben Raskar und sein Team im Rahmen der Umsetzung einer Idee, die ihn vor fĂŒnf Jahren besuchte, erstmals eine Technologie entwickelt, bei der Laserpulse in die Wand abgegeben werden mĂŒssen. Ein kleiner Teil des gestreuten Lichts kann das Hindernis umgehen. Und kurze Zeit nach jedem Impuls verwenden sie eine „Blitzkamera“, die einzelne Photonen mit einer Geschwindigkeit von Milliarden von Bildern pro Sekunde aufzeichnet, um Photonen zu erkennen, die von der Wand abprallen. Durch Messung der Zeit, die Photonen fĂŒr ihre RĂŒckkehr aufgewendet haben, können Forscher herausfinden, wie weit sie weggeflogen sind, und die dreidimensionale Geometrie der hinter dem Hindernis verborgenen Objekte, auf denen die Photonen verstreut sind, detailliert nachbilden. Eine der Schwierigkeiten besteht darin, dass zur Erzeugung eines dreidimensionalen Bildes ein Raster-Scan der Wand mit einem Laser durchgefĂŒhrt werden muss. Nehmen wir an, eine Person versteckt sich um die Ecke. "Dann kann das Licht, das von einem bestimmten Punkt auf dem Kopf, von einem bestimmten Punkt auf der Schulter und von einem bestimmten Punkt auf dem Knie reflektiert wird, gleichzeitig in die Kamera gelangen", sagte Raskar. Wenn Sie den Laser jedoch ein wenig an einen anderen Ort richten, gelangt das Licht dieser drei Punkte nicht mehr gleichzeitig zur Kamera. “ Es ist notwendig, alle Signale zu kombinieren und das "inverse Problem" zu lösen, um die verborgene dreidimensionale Geometrie wiederherzustellen.

Der ursprĂŒngliche Raskar-Algorithmus zur Lösung des inversen Problems erforderte zu viele Rechenressourcen, und das GerĂ€t selbst kostete eine halbe Million Dollar. Es wurden jedoch ernsthafte Anstrengungen unternommen, um die Mathematik zu vereinfachen und die Kosten zu senken. Im MĂ€rz veröffentlichte die Zeitschrift Nature eine Arbeit , die einen neuen Standard fĂŒr die effiziente und wirtschaftliche Konstruktion dreidimensionaler Bilder eines Objekts setzte - die Figur eines Kaninchens um die Ecke wurde in der Arbeit nachgebildet. Die Autoren Matthew O'Toole , David Lindel und Gordon Wetstein von der Stanford University haben einen neuen leistungsstarken Algorithmus zur Lösung des inversen Problems entwickelt und relativ kostengĂŒnstige SPAD-Kameras verwendet - Halbleiterbauelemente, deren Bildrate niedriger ist als die von Blitzkameras. Raskar, der zuvor als Kurator von zwei Autoren des Werkes gearbeitet hatte, nannte es "sehr genial" und "einen meiner Favoriten".





FrĂŒhere Algorithmen versanken im Detail: Die Forscher versuchten normalerweise, zurĂŒckkehrende Photonen zu erkennen, die nicht an dem Punkt an der Wand reflektiert wurden, an dem der Laser leuchtete, damit die Kamera das gestreute Laserlicht nicht sammeln konnte. Indem der Laser und die Kamera auf fast denselben Punkt gerichtet wurden, konnten die Forscher ausgehende und einfallende Photonen von einem „ Lichtkegel “ abbilden. Licht, das von der OberflĂ€che gestreut wird, bildet eine sich ausdehnende Photonenkugel, die einen Kegel bildet, der sich in der Raumzeit ausbreitet. O'Toole (der seitdem seinen Arbeitsplatz von Stanford zur Carnegie Mellon University gewechselt hat) ĂŒbersetzte die Physik der Lichtkegel - entwickelt von Albert Einsteins Lehrer German Minkowski zu Beginn des 20. Jahrhunderts - in einen lakonischen Ausdruck, der die Flugzeit des Photons mit dem Ort der StreuflĂ€chen verbindet. Er nannte seine Übersetzung "Transformation des Lichtkegels".

Robomobile verwenden bereits LIDAR-Systeme, um direkte Bilder zu erstellen, und Sie können sich vorstellen, dass sie eines Tages SPAD dazu bringen werden, um die Ecke zu schauen. „In naher Zukunft werden solche Sensoren auch in tragbaren Formaten erhĂ€ltlich sein“, prognostiziert Andreas Welten , der Erstautor der ersten Arbeit von Raskar aus dem Jahr 2012, der nun die Gruppe leitet, die sich an der University of Wisconsin mit der Erstellung aktiver Bilder befasst. Die Herausforderung besteht nun darin, „komplexere Szenen“ und realistische Szenarien zu handhaben, sagte Welten, „anstatt nur sorgfĂ€ltig eine Szene mit einem weißen Objekt und einem schwarzen Hintergrund zu erstellen. Wir brauchen Technologie, um das GerĂ€t zu steuern und den Knopf zu drĂŒcken. "

Wo sind die dinge


Forscher der Freeman-Gruppe begannen, passive und aktive AnsĂ€tze zu kombinieren. Die unter der Leitung des Forschers Christos Trumpulidis durchgefĂŒhrte Arbeit zeigte, dass bei der aktiven Konstruktion von Bildern mit einem Laser eine punktförmige Kamera mit bekannter Form, die sich um einen Winkel befindet, verwendet werden kann, um eine verborgene Szene ohne Verwendung von Informationen ĂŒber die Photonenflugzeit wiederherzustellen. "Und das sollte fĂŒr uns mit Hilfe einer herkömmlichen CCD-Matrix funktionieren", sagte Trampulidis.

Bilder außerhalb der Sichtlinie werden eines Tages helfen, Teams und autonome Roboter zu retten. Welten arbeitet mit dem Jet Propulsion Laboratory der NASA zusammen und arbeitet an einem Projekt, das darauf abzielt, Fernbilder von Objekten in den Mondhöhlen zu erstellen. Aber Raskar und das Unternehmen nutzen ihren Ansatz, um die ersten Seiten eines geschlossenen Buches zu lesen und im Nebel zu sehen.

Neben Audio-Rekonstruktionen kann der Bewegungsverbesserungsalgorithmus von Freeman dazu beitragen, medizinische GerĂ€te und Sicherheitssysteme sowie kleine astronomische Bewegungsmelder zu erstellen. Dieser Algorithmus ist "eine sehr gute Idee", sagte David Hogg, Astronom und Datenwissenschaftler an der New York University und am Flatiron Institute. "Ich dachte - wir mĂŒssen es nur in der Astronomie verwenden."

In Bezug auf Datenschutzprobleme, die durch jĂŒngste Entdeckungen aufgeworfen wurden, wendet sich Freeman seiner Erfahrung zu. "Ich habe wĂ€hrend meiner gesamten Karriere sehr, sehr viel ĂŒber dieses Problem nachgedacht", sagt er. Freeman, ein Mann mit Brille, ein Kamera-Enthusiast, der sein ganzes Leben lang mit Fotografie zu tun hatte, sagte, dass er zu Beginn seiner Karriere nicht an irgendetwas arbeiten wollte, das ein militĂ€risches oder Spionage-Potenzial hĂ€tte. Mit der Zeit begann er zu denken, dass „Technologie ein Werkzeug ist, das auf unterschiedliche Weise eingesetzt werden kann. Wenn Sie versuchen, alles zu vermeiden, was zumindest militĂ€risch genutzt werden kann, fĂ€llt Ihnen nichts NĂŒtzliches ein. " Er sagt, dass selbst im Fall des MilitĂ€rs „es sehr viele Möglichkeiten gibt, Dinge zu benutzen. Sie können jemandem helfen, zu ĂŒberleben. Und im Prinzip ist es nĂŒtzlich zu wissen, wo sich die Dinge befinden. “

Am meisten freute er sich jedoch nicht ĂŒber technologische FĂ€higkeiten, sondern lediglich ĂŒber die Entdeckung eines PhĂ€nomens, das in der Öffentlichkeit verborgen war. "Es scheint mir, dass die Welt voll von allem ist, was noch entdeckt werden muss", sagte er.

Source: https://habr.com/ru/post/de424389/


All Articles