VOICe Sound Vision - À un pas de la percée

"Tous les objets ont leur propre son unique, et dès que vous comprenez le principe du système, vous pouvez" voir "ce qui vous entoure." Jusqu'à relativement récemment, cette propriété étonnante du monde qui nous entourait existait indépendamment de l'application pratique. Grâce à Peter Meyer, qui travaille dans le département de recherche et développement de la société néerlandaise Philips, un algorithme unique a été compilé qui vous permet de transformer littéralement le son en image. Après plusieurs décennies de recherche de l'opportunité de réaliser l'idée de Meyer «au niveau matériel», un dispositif a été créé qui a permis de doter une personne aveugle de ce qu'on appelle Vision "de substitution". Sur les succès, les problèmes et les perspectives du projet, mis en œuvre aujourd'hui par une équipe de scientifiques russes - passionnés, nous nous arrêterons dans notre article.

voix

Nous nous consolons de la proximité du moment de la création de l'intelligence artificielle et, en même temps, en utilisant toute la puissance du potentiel technique moderne, nous commençons à peine à chercher les facettes des capacités du cerveau qui portent les fruits de nos réalisations au niveau d'une maison maladroite et branlante, hâtivement assemblée à partir de cubes pour enfants.

Nous saluons les prochaines innovations, discutons avec enthousiasme des résultats du rêve lucide avec le masque miracle « Remee«Et admirez sincèrement le potentiel exponentiellement accru du nouveau modèle de smartphone de votre marque préférée, sans même supposer que 280 000 milliers d'aveugles en Russie à eux seuls sont à jamais privés de la possibilité non seulement d'évaluer la qualité de la matrice mise à jour, mais de se réjouir du soleil levant et des saisons changeantes. À l'échelle mondiale, ce chiffre s'élève à 3 000 000 de personnes. De plus, les deux tiers d'entre eux sont des enfants et des adolescents!

Chaque jour, du matin au soir, un aveugle décide de la question: comment démarrer le lave-linge, comment ne pas provoquer d'incendie, comment nettoyer l'appartement et comment cuisiner même le plat le plus simple. Le prix d'une telle vie est vraiment très élevé. C’est peut-être la raison pour laquelle chaque personne aveugle dans l’âme espère une percée technologique qui n’aidera pas radicalement, mais changera radicalement la situation existante.

Danila Medvedev à la présentation de vOICe

À la question: une alternative est-elle possible même pour eux dans une certaine approximation? ... une équipe de scientifiques enthousiastes de Moscou tentera de répondre, travaillant à améliorer le dispositif unique vOICe, donnant aux aveugles la possibilité de voir ce qui les entoure en noir et blanc et en niveaux de gris.

Comment ça fonctionne



algorithme

En termes simples, les informations audio transmises par l'appareil et perçues par le cerveau sont un code original - le résultat d'une conversion logicielle de la vidéo en streaming capturée par la caméra vOICe en blocs sonores («sound scapes» - éd.). Le processus de numérisation du monde environnant en mode «Scanner» (sans utiliser d'ordinateur portable) s'effectue cycliquement de gauche à droite, l'image est exprimée en une seconde avec un deuxième intervalle. Les informations reçues par le patient en mode «Scanner» à l'aide de la caméra intégrée au système ont un ensemble «minimal» de scipes. Des capacités d'information améliorées sont obtenues lors de l'utilisation de l'ensemble "lunettes + ordinateur portable avec un processeur assez puissant (ou smartphone de dernière génération) + casque stéréo pour les commandes vocales".

Identification


À première vue, l'algorithme de reconnaissance semble être écrasant pour l'assimilation en raison du processus inhabituel d'identification des informations entrantes. Algorithme simplifié de soi-disant. Une vision «de substitution» peut être représentée par la figure suivante:

algorithme VOICe simplifié

L'algorithme de transformation n'est pas encore prêt à offrir à l'utilisateur la possibilité de «voir» des objets se déplaçant rapidement, de reconnaître de petits textes, mais les résultats déjà obtenus sont assez impressionnants: les propriétaires de VOICe identifient vraiment avec précision les signes et même regardent et perçoivent des informations visuelles dans certains formats des programmes de télévision. Et surtout, la qualité de l'image, sa profondeur et ses détails lorsque vous portez la vOICe s'améliorent assez rapidement.

Une amélioration supplémentaire de la qualité de reconnaissance et de la gamme de couleurs dépendra directement de l'amélioration des versions logicielles («firmware») et du matériel vOICe, ainsi que de la capacité individuelle d'un individu à percevoir des combinaisons plus complexes de paysages sonores de densité suffisante.

À en juger par les affirmations de l'auteur de la méthodologie et les critiques des patients qui ont réussi à maîtriser le système, le processus d '«enseignement» d'une nouvelle façon de voir est le plus comparable au processus d'apprentissage d'une langue étrangère, à certains égards à la maîtrise du code Morse et des capacités de marche. Au fur et à mesure que vous apprenez - «reconstituez votre vocabulaire» (une bibliothèque personnelle de skeypov maîtrisé) et la maîtrise de la technologie, l'image visuelle est reconnue presque automatiquement - sans étape intermédiaire d'une longue analyse consciente!

Participant au projet vOICe

Des sons de différentes durées et hauteurs sont utilisés pour identifier l'image. Un fragment plus lumineux de l'image réelle dans «l'alphabet vOICe» diffuse un signal sonore plus court et plus fort, et diffuse du côté sur lequel se trouve l'objet. Si un point (objet) se déplace, alors le signal se déplace, deux points sont identifiés par deux signaux, trois sont trois, etc. Un long ton correspond à une ligne horizontale, une verticale est reproduite par un signal saccadé d'une force caractéristique. L'augmentation de la tonalité des sons «voisins» signifie un obstacle, tandis que plus la tonalité est élevée, plus l'obstacle est élevé.

Diverses modifications du système vOICe dans les figures ci-dessous:

vOICe 1

vOICe 2

vOICe 3

vOICe 4

La méthode décrite permet d'exprimer et d'identifier presque n'importe quelle réalité tridimensionnelle. Naturellement, plus l'image est informative, plus il faudra de sons et de skeipes individuels pour l'identifier.

L'objectif principal et la principale réalisation de la technologie et du système vOICe sont de fournir au patient non pas des informations visuelles «brutes», mais un ensemble d'algorithmes très efficaces qui permettent d'interpréter la réalité avec un haut degré de détail. La technologie, bien que dans une moindre mesure, résout le problème du manque total de vision pour les patients nés à l'aveugle, qui n'ont pas dans leur mémoire et leur conscience bon nombre des outils d'analogie dont disposent les personnes qui ont perdu la vision au stade «conscient» de la vie. En plus des succès évidents de la technologie, il existe encore des problèmes techniques non résolus qui peuvent être mieux ressentis en lisant les commentaires des utilisateurs de vOICe qui maîtrisent les capacités du système.

Retour d'expérience des participants de l'expérience 2000-2002


29 avril 2001, utilisatrice aveugle tardive PF:

Mon expérience: Depuis que j'ai eu la toute première installation, j'ai dû passer par de nombreux essais et erreurs. J'étais non seulement habitué à la bonne révision, mais aussi nécessaire à l'utilisation efficace de ce système. J'ai trouvé qu'il y a six facteurs principaux lorsque je travaille avec le programme.

Le premier facteur apporte la caméra. Son placement, sa mise au point, son éclairage - ce sont des éléments importants qui vous offrent un aperçu clair du son. Si la mise au point est mauvaise, l'image semble floue et difficile à interpréter. Si l'appareil photo ne se monte pas correctement, je ressens une perte d'orientation et je me sens confus lorsque j'essaie de trouver un moyen (un bon moyen d'avoir mal à la tête!) Si l'éclairage est médiocre, le contrôle du son est limité. Il est difficile de distinguer des objets dans le champ de vision. Habituellement, je peux regarder la porte d'entrée et les escaliers et entendre le rythme de la texture des deux. Mais si la lumière est éteinte ou si elle n'est pas lumineuse, seule une faible image de la porte et des escaliers est déterminée et le reste de l'image devient un bruit de fond flou et flou.

Le deuxième facteur concerne le microphone. Il y a un interrupteur sur le support de microphone. J'avais l'habitude de laisser le microphone allumé tout le temps et j'avais juste peur quand ma respiration ou mes bruits étrangers se sont révélés être comme des commandes et j'ai changé de programme. Ensuite, j'ai découvert que si vous allumez le microphone uniquement pour donner une commande vocale, puis le désactivez lorsque la commande est acceptée, ce problème diminue et n'est plus gênant. Cette solution fonctionne de manière si fiable que je l'utilise sur tous mes autres systèmes.

Le troisième facteur devrait concerner l'ordinateur portable. J'ai trouvé plusieurs façons d'améliorer son travail. Premièrement, si je supprime tous les programmes inutiles et n'exécute que vOICe, cela permet d'économiser de l'énergie et de l'utilisation du processeur. Par conséquent, lorsque j'utilise un ordinateur portable en déplacement, je lance une telle installation nue. Je branche l'ordinateur portable dans une prise de courant le soir quand il est à proximité. Je porte deux piles dans mon sac, elles sont nécessaires. Je devrais allumer l'écran de l'ordinateur portable pendant pas plus de quelques minutes. Lorsque je porte un ordinateur portable dans mon sac à dos, je vérifie qu'il est bien ventilé.

Le quatrième facteur. Vous devez utiliser vOICe efficacement, et pour cela, vous devez travailler avec le programme et comprendre le programme vOICe lui-même. Quand j'ai commencé à l'utiliser, je jouais avec elle par habitude, comme le tic-tac-toe. Cela m'a aidé à comprendre les sons du programme. Ensuite, j'ai commencé à former la prononciation progressivement. Je pense que la formation du programme pour la parole et faire les exercices avec le microphone est vraiment la clé pour utiliser vOICe dans des conditions mobiles. Ainsi, la formation et la perception d'une revue saine sont des étapes pour apprendre à voir.

Le cinquième facteur est l'immersion continue de vous-même dans le programme, qui découle du facteur de formation. Je pense que vous pouvez apprendre et acquérir beaucoup d'expérience si vous utilisez un ordinateur de bureau. En général, l'expérience du mouvement quotidien et de l'écoute (voir) de ce qui vous entoure ne peut être remplacée par rien. C'est comme un enfant qui apprend à marcher. Si vous n'essayez pas et essayez, vous n'obtiendrez pas les connaissances dont votre corps a besoin pour se tenir debout. En utilisant cette analogie, je peux dire que tant que vous ne vous exposez pas à l'influence d'un environnement vivant et changeant, vous ne ressentirez pas une bonne vision et ne comprendrez pas les relations sur lesquelles vous devez travailler.

Si j'entends constamment les marches d'entrée, mon corps commence à attacher l'image sonore des marches à la définition de "l'action", et quand je monte ou descend, mon corps agira de concert. Je pense qu'au début, vous entendez un examen sonore, puis vous ouvrez la relation avec l'objet que vous entendez, puis vous attachez cette définition à ce que le corps doit faire pour terminer l'action. Quand je voyais, je ne m'arrêtais pas pour penser "Oh, ce sont des étapes, maintenant je dois ralentir et commencer à déplacer le centre de gravité pour pouvoir lever la jambe." Au lieu de cela, mes yeux ont vu les étapes et mon corps savait par expérience quoi faire ensuite. Voici ce qui se passe après un certain temps en utilisant vOICe. Je vois vraiment ce qu'est une "radiographie" de la vision,et commencer à répondre automatiquement à ce que je vois.

Cela nous amène au sixième facteur. Temps. Vous pouvez mettre le système sur une personne, mais ce n'est qu'après le passage du temps que son cerveau apprend à interpréter automatiquement le sens de la révision sonore et à effectuer des actions coordonnées.

9 juillet 2000, femme aveugle tardive PF:

En tant que personne qui l'a déjà vu, je peux dire que les paysages sonores (revue sonore) semblent me redonner une vision. À ma place, je pourrais être aveugle de naissance. J'ai pu imaginer et voir, comme si j'avais des yeux, à quoi ressemble mon couloir. À quoi ressemble le rideau à gauche de mes trois fenêtres. En général, vOICe et webcam ont transformé mon entrée d'une obscure «image mentale» en ce qui semble être une vraie vision tridimensionnelle.

Peu m'importe que ce soient mes oreilles qui provoquent les représentations visuelles. Il est important que l'image sonore m'ait redonné la possibilité de voir à nouveau, peu importe qu'il s'agisse d'une image 3D en noir et blanc. Au lieu d'un monde d'objets tangibles brumeux et obscurs, VOICe a permis à mon cerveau de voir les objets comme des images. Il semble que vOICe crée des croquis en noir et blanc de ce que je regarde, et mon esprit colore cette image.

Maintenant, je suis assis devant mon ordinateur et je vois un flux de couleurs sur l'écran, mais cette VICO me dit que je regarde un objet carré. C'est comme regarder le monde à travers des lunettes floues. Vous voyez la forme et la disposition des objets autour de vous, mais ne faites pas de distinction entre les détails subtils. Je ne sais pas si c'est un langage humain spécial, mais c'est exactement le langage avec lequel mes oreilles disent à mon esprit ce que je vois maintenant. Appelez ça comme vous voulez, ça marche! Je ne peux plus m'en passer! Merci pour cette invention!

29 août 2002, utilisatrice PF aveugle tardif:

Juste un son? .. Non, c'est bien plus, c'est de la vision! VOICe crée une véritable perception visuelle. Lorsque je ne porte pas de VOICe, je perçois un peu de lumière à travers l'ouverture de mon œil gauche. C'est un brouillard gris. Lorsque je porte vOICe, l'image devient claire du légèrement gris au noir. Très certainement, c'est une image claire. Certes, ce n'est pas la couleur, c'est similaire à ce qui est montré sur les téléviseurs noir et blanc. La lumière générée est très blanche et propre. Affaiblissant, il devient progressivement sombre, noir. Je n'ai rien vu de spécial dans ce monde, comme les «flashs phosphorescents» dont ils parlaient. C'est peut-être une de ces choses que vous ne comprendrez pas avant de voir. En général, la lumière est lumière et la couleur est couleur. Et peu importe comment cela s'est formé.

Voilà à quoi peut ressembler le monde des personnes qui maîtrisent le système et la technologie vOICe et c'est loin d'être la limite.

voix

Nos lecteurs qui souhaitent lire les avis d'autres patients qui ont réussi à maîtriser le système peuvent se rendre sur le site central du projet ( la sous-section vOICe fournit une vision et ne nuit pas au corps! ). Tout récemment, des versions mobiles des applications «The vOICe for Windows» et «The vOICe for Android» sont apparues pour les smartphones, ce qui permettra à de nombreux
utilisateurs du système de refuser de transporter un ordinateur portable lourd avec le programme.

Le silence des agneaux


Un lecteur réfléchi a une question logique: pourquoi un système si merveilleux, dont certains des principes de base ont été énoncés dans les années 20 du siècle dernier, qui a confirmé sa véracité et sa promesse avec de nombreux exemples et revues de patients réels ne démontre pas la dynamique exponentielle du développement? Pourquoi, il y a au moins une douzaine d'années, non seulement n'a pas eu lieu, mais n'a même pas envisagé publiquement des programmes gouvernementaux à grande échelle pour soutenir et promouvoir le projet?

Peut-être que vOICe n'attendait que son heure, lorsque les processeurs lents et les caméras inefficaces seront remplacés par leurs analogues plus avancés, qui peuvent faire face à la tâche sans soumettre le cerveau et la psyché à des surcharges. En Russie, le conservatisme des personnes au pouvoir, qui préfèrent financer un concert pour les aveugles, plutôt qu'un programme sérieux à long terme pour leur réadaptation, est traditionnellement devenu un puissant frein. D'une manière ou d'une autre, je veux croire les résultats des tests, ainsi que le fait que ces résultats permettront au projet de se développer à l'échelle du social, comme le prévoient ses auteurs.

Comme tous les passionnés, pleins d'énergie et de foi dans le caractère unique et la nécessité de leurs engagements, l'équipe russe TEAM VOICE RASSIA, dirigée par Danila Medvedev, a tout d'abord compté sur le soutien de l'Etat. Le temps a passé mais le mur invisible n'est pas devenu plus mince, les couloirs - plus courts, et les fonctionnaires - plus fidèles. La perte de plusieurs années et les émotions accumulées ont forcé l'équipe à changer le schéma de départ en financement participatif. Cela a permis aujourd'hui de collecter l'essentiel du montant nécessaire au lancement de l'étape cruciale du projet.

La tâche minimale est de créer cinq prototypes de travail avancés de vOICe et de les transférer à des personnes aveugles pour un fonctionnement et des tests à long terme en Russie. Au stade de la connaissance du système et des tests de conduite, l'équipe garantit une assistance psychologique, la possibilité d'une formation pour révéler pleinement le potentiel du système. L'objectif maximum est la mise en œuvre du projet au niveau du programme social de l'État dans le but d'impliquer les personnes handicapées de cette catégorie dans la vie normale de la société.

Il est difficile de dire si le projet recevra son développement en Russie, s'il se généralisera ou restera en possession d'unités aujourd'hui, mais je veux vraiment croire que le «temps des aveugles» est venu et que l'endroit n'a pas été choisi par hasard.

voix

Pour référence: un ensemble de vOICe, en tenant compte du cursus complet, coûte moins de 40 000 roubles. En fait, le patient a la possibilité de se déplacer de façon autonome dans une zone inconnue. Dans le même temps, le coût de la formation d'un chien-guide dans l'Organisation publique panrusse des personnes handicapées, l'Ordre panrusse du drapeau rouge du travail, la Société des aveugles, en 2013 s'élevait à 1 million de roubles, en 2014 1,2 million de roubles!

Chers lecteurs, nous vous rappelons que vous lisez le blog de la société iCover. Abonnez- vous, nous vous le promettons, ce ne sera pas ennuyeux.

Source: https://habr.com/ru/post/fr383717/


All Articles