VOICe Sound Vision - Ein Schritt vom Durchbruch entfernt

"Alle Objekte haben ihren eigenen Klang. Sobald Sie das Prinzip des Systems verstanden haben, können Sie sehen, was Sie umgibt." Bis vor relativ kurzer Zeit existierte diese erstaunliche Eigenschaft der Welt um uns herum isoliert von der praktischen Anwendung. Dank Peter Meyer, der in der Forschungs- und Entwicklungsabteilung des niederländischen Unternehmens Philips arbeitet, wurde ein einzigartiger Algorithmus kompiliert, mit dem Sie Ton buchstäblich in ein Bild verwandeln können. Nach mehreren Jahrzehnten der Suche nach der Möglichkeit, Meyers Idee „auf Hardwareebene“ zu verwirklichen, wurde ein Gerät geschaffen, mit dem ein Blinder mit dem sogenannten ausgestattet werden konnte "Ersatz" Vision. Über die Erfolge, Probleme und Perspektiven des Projekts, das heute von einem Team russischer Wissenschaftler - Enthusiasten - umgesetzt wurde, werden wir in unserem Artikel aufhören.

Stimme

Wir trösten uns mit der Nähe des Augenblicks der Schaffung künstlicher Intelligenz und nutzen gleichzeitig die volle Kraft des modernen technischen Potenzials, um nach den Facetten der Fähigkeiten des Gehirns zu suchen, die die Früchte unserer Errungenschaften auf das Niveau eines ungeschickten, klapprigen Hauses bringen, das hastig aus Kinderwürfeln zusammengesetzt ist.

Wir begrüßen die nächsten Innovationen und diskutieren lebhaft die Ergebnisse des klaren Träumens mit der Wundermaske „ Remee„Und bewundern Sie aufrichtig das exponentiell gesteigerte Potenzial des neuen Smartphone-Modells Ihrer Lieblingsmarke, ohne auch nur anzunehmen, dass 280.000.000 Blinden allein in Russland für immer die Möglichkeit genommen wird, nicht nur die Qualität der aktualisierten Matrix zu bewerten, sondern sich auch über die aufgehende Sonne und die wechselnden Jahreszeiten zu freuen. Weltweit steigt diese Zahl auf 3.000.000 Menschen. Darüber hinaus sind zwei Drittel von ihnen Kinder und Jugendliche!

Jeden Tag, von morgens bis abends, entscheidet ein Blinder die Frage: wie man die Waschmaschine startet, wie man kein Feuer provoziert, wie man die Wohnung putzt und wie man selbst das einfachste Gericht kocht. Der Preis für ein solches Leben ist wirklich sehr hoch. Vielleicht hat deshalb jeder Blinde in der Seele die Hoffnung auf einen technologischen Durchbruch, der nicht radikal hilft, sondern die bestehende Situation radikal verändert.

Danila Medwedew bei der VOICe-Präsentation

Auf die Frage: Ist eine Alternative auch für sie in gewisser Näherung möglich? ... wird ein Team von begeisterten Moskauer Wissenschaftlern versuchen zu antworten, um das einzigartige vOICe-Gerät zu verbessern und den Blinden die Möglichkeit zu geben, zu sehen, was sie in Schwarzweiß und Graustufen umgibt.

Wie es funktioniert



Algorithmus

In einfachen Worten, die vom Gerät übertragenen und vom Gehirn wahrgenommenen Audioinformationen sind ein Originalcode - das Ergebnis einer Software-Konvertierung des von der vOICe-Kamera aufgenommenen Streaming-Videos in Soundblöcke („Sound Scapes“). Das Scannen der umgebenden Welt im „Scanner“ -Modus (ohne Verwendung eines Laptops) erfolgt zyklisch von links nach rechts, das Bild wird in einer Sekunde mit einem zweiten Intervall wiedergegeben. Informationen, die der Patient im „Scanner“ -Modus mit der im System integrierten Kamera empfängt, enthalten einen „minimalen“ Satz von Scipes. Verbesserte Informationsfunktionen werden erreicht, wenn das Set „Brille + Laptop mit einem ziemlich leistungsstarken Prozessor (oder Smartphone der neuesten Generation) + Stereokopfhörer für Sprachbefehle“ verwendet wird.

Identifizierung


Auf den ersten Blick scheint der Erkennungsalgorithmus aufgrund des ungewöhnlichen Prozesses der Identifizierung eingehender Informationen für die Assimilation überwältigend zu sein. Vereinfachter Algorithmus der sogenannten. Eine „Ersatzvision“ kann durch die folgende Abbildung dargestellt werden:

vereinfachter vOICe-Algorithmus

Der Transformationsalgorithmus ist noch nicht bereit, dem Benutzer die Möglichkeit zu bieten, sich schnell bewegende Objekte zu „sehen“, kleinen Text zu erkennen, aber die bereits erzielten Ergebnisse sind beeindruckend: vOICe-Besitzer identifizieren Zeichen wirklich genau und sehen und nehmen in einigen sogar visuelle Informationen wahr Formate von Fernsehprogrammen. Und vor allem verbessern sich die Bildqualität, die Tiefe und die Details beim Tragen von VOICe recht schnell.

Eine weitere Verbesserung der Erkennungsqualität und des Farbumfangs hängt direkt von der Verbesserung der Softwareversionen („Firmware“) und der vOICe-Hardware sowie von der individuellen Fähigkeit eines Einzelnen ab, komplexere Kombinationen von Klanglandschaften mit ausreichender Dichte wahrzunehmen.

Nach den Behauptungen des Autors der Methodik und den Bewertungen von Patienten zu urteilen, die das System erfolgreich beherrschen, ist der Prozess des „Lehrens“ einer neuen Sichtweise am ehesten mit dem Prozess des Lernens einer Fremdsprache vergleichbar, in gewisser Weise mit der Beherrschung des Morsecodes und der Gehfähigkeiten. Während Sie lernen - „füllen Sie Ihren Wortschatz auf“ (eine persönliche Bibliothek mit gemeistertem Skeypov) und die Beherrschung der Technologie -, wird das visuelle Bild fast automatisch erkannt - ohne Zwischenstufe einer langen bewussten Analyse!

vOICe Projektteilnehmer

Töne unterschiedlicher Dauer und Höhe werden verwendet, um das Bild zu identifizieren. Ein helleres Fragment des realen Bildes im „vOICe-Alphabet“ sendet ein kürzeres und stärkeres Tonsignal und sendet von der Seite, auf der sich das Objekt befindet. Wenn sich ein Punkt (Objekt) bewegt, bewegt sich das Signal, zwei Punkte werden durch zwei Signale identifiziert, drei sind drei usw. Ein langer Ton entspricht einer horizontalen Linie, ein vertikaler wird durch ein ruckartiges Signal einer charakteristischen Kraft reproduziert. Das Erhöhen der Tonalität von „benachbarten“ Klängen bedeutet ein Hindernis. Je höher der Ton, desto höher das Hindernis.

Verschiedene Modifikationen des vOICe-Systems in den folgenden Abbildungen:

STIMME 1

STIMME 2

STIMME 3

STIMME 4

Die beschriebene Methode kann fast jede dreidimensionale Realität aussprechen und identifizieren. Je informativer das Bild ist, desto mehr individuelle Töne und Skeipes werden natürlich benötigt, um es zu identifizieren.

Das Hauptziel und die Hauptleistung der vOICe-Technologie und des vOICe-Systems besteht darin, dem Patienten keine „rohen“ visuellen Informationen zur Verfügung zu stellen, sondern einen hochwirksamen Satz von Algorithmen, die es ermöglichen, die Realität mit einem hohen Grad an Detailgenauigkeit zu interpretieren. Die Technologie löst, wenn auch in geringerem Maße, das Problem des völligen Sehverlusts für blindgeborene Patienten, die viele der Analogie-Tools, die Menschen zur Verfügung stehen, die in der „bewussten“ Lebensphase ihr Sehvermögen verloren haben, nicht im Gedächtnis und im Bewusstsein haben. Zusätzlich zu den offensichtlichen Erfolgen der Technologie gibt es immer noch ungelöste technische Probleme, die am besten durch Lesen des Feedbacks von vOICe-Benutzern zu spüren sind, die die Funktionen des Systems beherrschen.

Feedback der Teilnehmer des Experiments 2000-2002 Jahr


29. April 2001, spätblinde Benutzerin PF:

Meine Erfahrung: Seit ich die erste Installation hatte, musste ich zahlreiche Versuche und Irrtümer durchlaufen. Ich war nicht nur an die Klangbewertung gewöhnt, sondern auch an die effektive Nutzung dieses Systems. Ich fand heraus, dass es sechs Hauptfaktoren bei der Arbeit mit dem Programm gibt.

Der erste Faktor bringt die Kamera. Platzierung, Fokussierung, Beleuchtung - dies sind wichtige Elemente, die Ihnen einen klaren Klangüberblick bieten. Wenn der Fokus schlecht ist, sieht das Bild verschwommen und schwer zu interpretieren aus. Wenn die Kamera nicht richtig montiert ist, verspüre ich einen Orientierungsverlust und bin verwirrt, wenn ich versuche, einen Weg zu finden (ein guter Weg, um Kopfschmerzen zu bekommen!). Wenn die Beleuchtung schlecht ist, ist die Tonüberprüfung begrenzt. Es ist schwierig, Objekte im Sichtfeld zu unterscheiden. Normalerweise kann ich auf die Haustür und die Treppe schauen und den Rhythmus der Textur von beiden hören. Wenn das Licht jedoch ausgeschaltet oder nicht hell ist, wird nur ein schwaches Bild der Tür und der Treppe festgestellt, und der Rest des Bildes wird zu einem verschwommenen, nebligen Hintergrundgeräusch.

Der zweite Faktor betrifft das Mikrofon. An der Mikrofonhalterung befindet sich ein Schalter. Ich ließ das Mikrofon die ganze Zeit eingeschaltet und hatte nur Angst, als sich herausstellte, dass meine Atmung oder Nebengeräusche wie Befehle waren, und änderte das Programm. Dann stellte ich fest, dass dieses Problem abnimmt und nicht mehr nervt, wenn Sie das Mikrofon nur einschalten, um einen Sprachbefehl zu erteilen, und es dann ausschalten, wenn der Befehl akzeptiert wird. Diese Lösung funktioniert so zuverlässig, dass ich sie auf allen meinen anderen Systemen verwende.

Der dritte Faktor sollte sich auf den Laptop beziehen. Ich habe verschiedene Wege gefunden, um seine Arbeit zu verbessern. Erstens, wenn ich alle unnötigen Programme lösche und nur vOICe ausführe, spart dies Energie und CPU-Auslastung. Wenn ich unterwegs einen Laptop benutze, starte ich daher eine solche bloße Installation. Ich stecke den Laptop abends in eine Steckdose, wenn er in der Nähe ist. Ich habe zwei Batterien in meiner Tasche, sie werden benötigt. Ich sollte den Laptop-Bildschirm nicht länger als ein paar Minuten einschalten. Wenn ich einen Laptop in meinem Rucksack habe, überprüfe ich, ob er gut belüftet ist.

Der vierte Faktor. Sie müssen vOICe effektiv nutzen, und dafür müssen Sie mit dem Programm arbeiten und das vOICe-Programm selbst verstehen. Als ich anfing, es zu benutzen, spielte ich aus Gewohnheit mit ihr, wie Tic-Tac-Toe. Es hat mir geholfen, die Klänge des Programms zu verstehen. Dann fing ich an, die Aussprache allmählich zu trainieren. Ich denke, dass das Trainieren des Sprachprogramms und das Ausführen der Übungen mit dem Mikrofon der Schlüssel zur Verwendung von vOICe unter mobilen Bedingungen ist. Das Training und das Wahrnehmen einer fundierten Bewertung sind also Schritte, um das Sehen zu lernen.

Der fünfte Faktor ist das kontinuierliche Eintauchen in das Programm, das sich aus dem Trainingsfaktor ergibt. Ich denke, dass Sie viel lernen und Erfahrungen sammeln können, wenn Sie einen Desktop-Computer verwenden. Im Allgemeinen kann die Erfahrung der täglichen Bewegung und des Zuhörens (Sehens) der Umgebung nicht durch irgendetwas ersetzt werden. Es ist wie ein Kind, das laufen lernt. Wenn Sie nicht versuchen und versuchen, werden Sie nicht das Wissen erreichen, das Ihr Körper braucht, um zu stehen. Mit dieser Analogie kann ich sagen, dass Sie, bis Sie sich dem Einfluss einer lebendigen, sich verändernden Umgebung aussetzen, keine gesunde Vision spüren und die Beziehungen verstehen, an denen Sie arbeiten müssen.

Wenn ich die Eingangsschritte ständig höre, beginnt mein Körper, das Klangbild der Schritte an die Definition von "Aktion" anzuhängen, und wenn ich nach oben oder unten gehe, handelt mein Körper zusammen. Ich denke, dass Sie zuerst eine Klangüberprüfung hören, dann die Beziehung zu dem Objekt öffnen, das Sie hören, und dann diese Definition an das anhängen, was der Körper tun muss, um die Aktion abzuschließen. Als ich ein Seher war, hörte ich nicht auf zu denken: "Oh, das sind Schritte, jetzt muss ich langsamer werden und anfangen, den Schwerpunkt zu verschieben, damit ich mein Bein heben kann." Stattdessen sahen meine Augen die Schritte und mein Körper wusste aus Erfahrung, was als nächstes zu tun war. Folgendes passiert nach einer Weile mit vOICe. Ich sehe wirklich, was ist, wie eine "Röntgenaufnahme" des Sehens,und beginne automatisch auf das zu antworten, was ich sehe.

Dies bringt uns zum sechsten Faktor. Zeit. Sie können das System auf eine Person anwenden, aber erst im Laufe der Zeit lernt sein Gehirn, die Bedeutung der Klangüberprüfung automatisch zu interpretieren und koordinierte Aktionen auszuführen.

9. Juli 2000, spätblinde Benutzerin PF:

Als eine Person, die zuvor gesehen hat, kann ich sagen, dass Soundscapes (Sound Review) mir wieder einen Sinn für Vision zu geben scheinen. An meiner Stelle könnte ich von Geburt an blind sein. Ich konnte mir vorstellen und sehen, als hätte ich Augen, wie mein Flur aussieht. Wie der Vorhang links von meinen drei Fenstern aussieht. Im Allgemeinen verwandelten VOICe und Webcam meinen Eingang von einem obskuren „mentalen Bild“ in eine scheinbar echte dreidimensionale Vision.

Es ist mir egal, dass es meine Ohren sind, die visuelle Darstellungen verursachen. Es ist wichtig, dass das Klangbild die Sichtbarkeit wiederhergestellt hat. Es spielt keine Rolle, dass es sich um ein 3D-Schwarzweißbild handelt. Anstelle einer Welt von obskuren nebligen materiellen Objekten erlaubte vOICe meinem Gehirn, Objekte als Bilder zu sehen. Es scheint, dass VOICe Schwarz-Weiß-Skizzen von dem erstellt, was ich betrachte, und mein Verstand färbt dieses Bild.

Jetzt sitze ich vor meinem Computer und sehe einen Farbstrom auf dem Bildschirm, aber diese STIMME sagt mir, dass ich ein quadratisches Objekt betrachte. Es ist, als würde man die Welt durch eine verschwommene Brille betrachten. Sie sehen die Form und Anordnung von Objekten um Sie herum, unterscheiden jedoch keine subtilen Details. Ich weiß nicht, ob dies eine spezielle menschliche Sprache ist, aber es ist genau die Sprache, mit der meine Ohren meinen Gedanken sagen, was ich jetzt sehe. Nennen Sie es wie Sie wollen, es funktioniert! Ich kann nicht mehr darauf verzichten! Vielen Dank für diese Erfindung!

29. August 2002, spätblinde Benutzerin PF:

Nur ein Geräusch? .. Nein, das ist viel mehr, das ist Vision! vOICe schafft echte visuelle Wahrnehmung. Wenn ich kein VOICe trage, nehme ich Licht ein wenig durch die Öffnung in meinem linken Auge wahr. Es ist ein grauer Nebel. Wenn ich VOICe trage, wird das Bild hell von leicht grau bis schwarz. Auf jeden Fall ist dies ein helles Bild. Es ist zwar keine Farbe, es ähnelt dem, was auf Schwarzweißfernsehern gezeigt wird. Das erzeugte Licht ist sehr weiß und sauber. Schwächend wird er allmählich dunkel, schwarz. Ich habe auf dieser Welt nichts Besonderes gesehen, wie die „phosphoreszierenden Blitze“, von denen sie sprachen. Vielleicht ist dies eines der Dinge, die Sie erst verstehen werden, wenn Sie es sehen. Im Allgemeinen ist Licht Licht und Farbe ist Farbe. Und es ist mir egal, wie es entstanden ist.

So kann die Welt der Menschen aussehen, die das vOICe-System und die Technologie beherrschen, und dies ist weit von der Grenze entfernt.

Stimme

Unsere Leser, die Bewertungen anderer Patienten lesen möchten, die das System erfolgreich beherrschen, können zur zentralen Stelle des Projekts gehen ( Der Unterabschnitt vOICe bietet Sehvermögen und schadet dem Körper nicht! ). Erst kürzlich erschienen mobile Versionen der Anwendungen „The vOICe for Windows“ und „The vOICe for Android“ für Smartphones, mit denen viele
Benutzer des Systems sich weigern können, einen schweren Laptop mit dem Programm zu tragen.

Schweigen der Lämmer


Ein nachdenklicher Leser hat eine logische Frage: Warum zeigt ein solch wunderbares System, dessen Grundprinzipien in den 20er Jahren des letzten Jahrhunderts festgelegt wurden und dessen Wahrhaftigkeit und Versprechen mit vielen spezifischen Beispielen und Bewertungen realer Patienten bestätigt wurde, nicht die exponentielle Dynamik der Entwicklung? Warum fand vor mindestens einem Dutzend Jahren nicht nur keine groß angelegte Regierungsprogramme statt, um das Projekt zu unterstützen und zu fördern?

Vielleicht hat vOICe nur auf seine Zeit gewartet, in der langsame Prozessoren und ineffiziente Kameras durch ihre fortschrittlicheren Analoga ersetzt werden, die helfen, die Aufgabe zu bewältigen, ohne das Gehirn und die Psyche Überlastungen auszusetzen. In Russland ist der Konservatismus der Machthaber, die lieber ein Konzert für Blinde als ein umfangreiches langfristiges ernstes Programm für ihre Rehabilitation finanzieren, traditionell zu einer starken Bremse geworden. Auf die eine oder andere Weise möchte ich den Testergebnissen sowie der Tatsache glauben, dass diese Ergebnisse es dem Projekt ermöglichen werden, auf das Ausmaß des Sozialen zu wachsen, wie es die Autoren planen.

Wie alle Enthusiasten, die voller Energie und Vertrauen in die Einzigartigkeit und Notwendigkeit ihrer Unternehmungen waren, setzte das russische Team von TEAM VOICE RASSIA unter der Leitung von Danila Medwedew zunächst sehr auf staatliche Unterstützung. Die Zeit verging, aber die unsichtbare Mauer wurde nicht dünner, die Korridore - kürzer und die Beamten - loyaler. Der Verlust von mehreren Jahren und die angesammelten Emotionen zwangen das Team, das Startschema auf Crowdfunding umzustellen. Dies hat es heute möglich gemacht, den größten Teil des Betrags zu sammeln, der für den Start der entscheidenden Phase des Projekts erforderlich ist.

Die Mindestaufgabe besteht darin, fünf fortschrittliche funktionierende Prototypen von vOICe zu erstellen und diese an Blinde zu übertragen, um sie langfristig in Russland zu betreiben und zu testen. In der Phase der Bekanntschaft mit dem System und der weiteren Probefahrt garantiert das Team psychologische Unterstützung und die Möglichkeit eines Trainings, um das Potenzial des Systems voll auszuschöpfen. Das maximale Ziel ist die Umsetzung des Projekts auf der Ebene des Sozialstaatsprogramms mit dem Ziel, behinderte Menschen dieser Kategorie in das normale Leben der Gesellschaft einzubeziehen.

Es ist schwer zu sagen, ob das Projekt seine Entwicklung in Russland erhalten wird, ob es weit verbreitet sein wird oder heute im Besitz von Einheiten bleiben wird, aber ich möchte wirklich glauben, dass die „Zeit der Blinden“ gekommen ist und der Ort nicht zufällig ausgewählt wurde.

Stimme

Als Referenz: Ein Satz vOICe kostet unter Berücksichtigung des gesamten Studiengangs weniger als 40.000 Rubel. Tatsächlich hat der Patient die Möglichkeit, sich unabhängig in einem unbekannten Bereich zu bewegen. Gleichzeitig beliefen sich die Kosten für die Ausbildung eines Blindenhundes in der Allrussischen öffentlichen Organisation für behinderte Menschen, dem Allrussischen Orden des Roten Banners der Arbeit, der Gesellschaft der Blinden, im Jahr 2013 auf 1 Million Rubel, im Jahr 2014 auf 1,2 Millionen Rubel!

Liebe Leser, wir erinnern Sie daran, dass Sie den iCover-Unternehmensblog lesen. Abonnieren Sie uns, wir versprechen, es wird nicht langweilig.

Source: https://habr.com/ru/post/de383717/


All Articles