VOICe Sound Vision: un paso lejos del avance
"Todos los objetos tienen su propio sonido único, y tan pronto como entiendes el principio del sistema, puedes" ver "lo que te rodea". Hasta hace relativamente poco, esta increíble propiedad del mundo que nos rodeaba existía aislada de la aplicación práctica. Gracias a Peter Meyer, que trabaja en el departamento de investigación y desarrollo de la compañía holandesa Philips, se ha compilado un algoritmo único que le permite literalmente convertir el sonido en una imagen. Después de varias décadas de buscar la oportunidad de hacer realidad la idea de Meyer "a nivel de hardware", se creó un dispositivo que permitía dotar a una persona ciega con el llamado Visión "sustituta". Sobre los éxitos, problemas y perspectivas del proyecto, implementado hoy por un equipo de científicos rusos, entusiastas, nos detendremos en nuestro artículo.
Nos consolamos con la proximidad del momento de la creación de la inteligencia artificial y, al mismo tiempo, utilizando todo el poder del potencial técnico moderno, estamos comenzando a buscar las facetas de las capacidades del cerebro que llevan los frutos de nuestros logros al nivel de una casa torpe y desvencijada, ensamblada apresuradamente a partir de cubos de niños.Damos la bienvenida a las próximas innovaciones, discutamos animadamente los resultados de los sueños lúcidos con la máscara milagrosa " Remee"Y admiro sinceramente el potencial exponencialmente aumentado del nuevo modelo de teléfono inteligente de su marca favorita, sin siquiera suponer que solo 280,000 mil personas ciegas en Rusia se ven privadas para siempre de la oportunidad no solo de evaluar la calidad de la matriz actualizada, sino de regocijarse en el sol naciente y las estaciones cambiantes. A escala mundial, esta cifra se eleva a 3.000.000 de personas. Además, dos tercios de ellos son niños y adolescentes.Todos los días, desde la mañana hasta la noche, una persona ciega resuelve la pregunta: cómo encender la lavadora, cómo no provocar un incendio, cómo limpiar el apartamento y cómo cocinar incluso el plato más simple. El precio de tal vida es realmente muy alto. Quizás es por eso que cada persona ciega en el alma tiene la esperanza de un avance tecnológico que ayude no radicalmente, sino que cambie radicalmente la situación existente.
A la pregunta: ¿es posible una alternativa incluso para ellos en alguna aproximación? ... un equipo de científicos entusiastas de Moscú tratará de responder, trabajando para mejorar el dispositivo de vOICe único, dando a los ciegos la oportunidad de ver lo que los rodea en blanco y negro y en escala de grises.Cómo funciona
En términos simples, la información de audio transmitida por el dispositivo y percibida por el cerebro es un código original, el resultado de una conversión de software de la transmisión de video capturada por la cámara de VOICe en bloques de sonido ("scapes de sonido" - ed.). El proceso de escaneo del mundo circundante en el modo "Escáner" (sin usar una computadora portátil) se realiza cíclicamente de izquierda a derecha, la imagen se expresa en un segundo con un segundo intervalo. La información recibida por el paciente en el modo "Escáner" utilizando la cámara integrada en el sistema tiene un conjunto "mínimo" de recetas. Se logran capacidades de información mejoradas mediante el uso de "gafas + computadora portátil con un procesador bastante potente (o el teléfono inteligente de última generación) + auriculares estéreo para comandos de voz".Identificación
A primera vista, el algoritmo de reconocimiento parece ser abrumador para la asimilación debido al inusual proceso de identificación de información entrante. Algoritmo simplificado de los llamados. La siguiente figura puede representar una visión "sustituta":
el algoritmo de transformación aún no está listo para ofrecer al usuario la capacidad de "ver" objetos que se mueven rápidamente, reconocer texto pequeño, pero los resultados ya obtenidos son bastante impresionantes: los propietarios de VOCES identifican con precisión los signos e incluso miran y perciben información visual en algunos formatos de programas de televisión. Y lo más importante, la calidad de la imagen, su profundidad y detalle a medida que usa VOICe mejoran con bastante rapidez.La mejora adicional en la calidad del reconocimiento y la gama de colores dependerá directamente de la mejora de las versiones de software ("firmware") y del hardware vOICe, así como de la capacidad individual de un individuo para percibir combinaciones más complejas de escapes de sonido de densidad suficiente.A juzgar por las afirmaciones del autor de la metodología y las revisiones de los pacientes que han dominado con éxito el sistema, el proceso de "enseñar" una nueva forma de ver es más comparable al proceso de aprender un idioma extranjero, de alguna manera para dominar el código Morse y las habilidades para caminar. A medida que aprende: “reponga su vocabulario” (una biblioteca personal de skeypov dominado) y el dominio de la tecnología, la imagen visual se reconoce casi automáticamente, ¡sin una etapa intermedia de un largo análisis consciente!
Se utilizan sonidos de varias duraciones y alturas para identificar la imagen. Un fragmento más brillante de la imagen real en el "alfabeto de vOICe" emite una señal de sonido más corta y más fuerte, y se transmite desde el lado en el que se encuentra el objeto. Si un punto (objeto) se mueve, entonces la señal se mueve, dos puntos se identifican por dos señales, tres son tres, etc. Un tono largo corresponde a una línea horizontal, uno vertical se reproduce por una señal desigual de una fuerza característica. Aumentar la tonalidad de los sonidos "vecinos" significará un obstáculo, mientras que cuanto mayor sea el tono, mayor será el obstáculo.Varias modificaciones del sistema vOICe en las siguientes figuras:


El método descrito llega a expresar e identificar casi cualquier realidad tridimensional. Naturalmente, cuanto más informativa sea la imagen, se necesitarán más sonidos y fragmentos individuales para identificarla.El objetivo principal y el logro principal de la tecnología y el sistema vOICe es proporcionar al paciente no con información visual "en bruto", sino con un conjunto de algoritmos altamente efectivos que permiten interpretar la realidad con un alto grado de detalle. La tecnología, aunque en menor medida, resuelve el problema de la falta total de visión para los pacientes ciegos, que no tienen en su memoria y conciencia muchas de las herramientas de analogía que están disponibles para las personas que han perdido la visión en la etapa "consciente" de la vida. Además de los éxitos obvios de la tecnología, todavía hay problemas técnicos sin resolver que se pueden sentir mejor leyendo los comentarios de los usuarios de VOICe que han dominado las capacidades del sistema.Comentarios de los participantes del experimento 2000-2002 año
29 de abril de 2001, usuaria femenina ciega PF:Mi experiencia: desde que tuve la primera instalación, tuve que pasar por numerosas pruebas y errores. No solo estaba acostumbrado a la revisión de sonido, sino que también era necesario, al uso efectivo de este sistema. Descubrí que hay seis factores principales al trabajar con el programa.El primer factor trae la cámara. Su ubicación, enfoque, iluminación: estos son elementos importantes que le proporcionan una visión general clara del sonido. Si el enfoque es pobre, la imagen se ve borrosa y difícil de interpretar. Si la cámara no se monta correctamente, siento una pérdida de orientación y me confundo al tratar de encontrar una manera (¡una buena forma de tener dolor de cabeza!) Si la iluminación es deficiente, la revisión del sonido es limitada. Es difícil distinguir objetos en el campo de visión. Por lo general, puedo mirar la puerta de entrada y las escaleras y escuchar el ritmo de la textura de ambas. Pero si la luz se apaga o no es brillante, solo se determina una imagen tenue de la puerta y las escaleras, y el resto de la imagen se convierte en un sonido de fondo borroso y brumoso.El segundo factor se relaciona con el micrófono. Hay un interruptor en el soporte del micrófono. Solía dejar el micrófono encendido todo el tiempo y estaba asustado cuando mi respiración o sonidos extraños resultaron ser como comandos, y cambié el programa. Luego descubrí que si enciende el micrófono solo para dar un comando de voz, y luego lo apaga cuando se acepta el comando, entonces este problema disminuye y ya no es molesto. Esta solución funciona de manera tan confiable que la uso en todos mis otros sistemas.El tercer factor debe estar relacionado con la computadora portátil. Encontré varias formas de mejorar su trabajo. En primer lugar, si elimino todos los programas innecesarios y ejecuto solo vOICe, esto ahorra energía y uso de la CPU. Por lo tanto, cuando uso una computadora portátil sobre la marcha, inicio una instalación tan simple. Enchufe el portátil en una toma de corriente por las tardes cuando está cerca. Llevo dos baterías en mi bolso, son necesarias. Debería encender la pantalla del portátil por no más de unos minutos. Cuando llevo una computadora portátil en mi mochila, verifico que esté bien ventilada.El cuarto factor. Debe usar vOICe de manera efectiva, y para esto necesita trabajar con el programa y comprender el programa vOICe en sí. Cuando comencé a usarlo, solía jugar con ella por costumbre, como tic-tac-toe. Me ayudó a entender los sonidos del programa. Entonces comencé a entrenar la pronunciación gradualmente. Creo que entrenar el programa para hablar y hacer los ejercicios con el micrófono es realmente la clave para usar vOICe en condiciones móviles. Entonces, entrenar y percibir una revisión sonora son pasos para aprender a ver.El quinto factor es la inmersión continua de ti mismo en el programa, que se desprende del factor de entrenamiento. Creo que puedes aprender y ganar experiencia bastante si usas una computadora de escritorio. En general, la experiencia del movimiento diario y escuchar (ver) lo que te rodea no puede ser reemplazado por nada. Es como un niño aprendiendo a caminar. Si no lo intentas, no lograrás el conocimiento que tu cuerpo necesita para mantenerse en pie. Usando esta analogía, puedo decir que hasta que no se exponga a la influencia de un entorno vivo y cambiante, no sentirá una visión sólida ni comprenderá las relaciones en las que necesita trabajar.Si escucho los pasos de entrada constantemente, entonces mi cuerpo comienza a adjuntar la imagen sonora de los pasos a la definición de "acción", y cuando subo o bajo, mi cuerpo actuará en concierto. Creo que al principio escuchas una revisión de sonido, luego abres la relación con el objeto que escuchas, luego adjuntas esta definición a lo que el cuerpo necesita hacer para completar la acción. Cuando era un vidente, no me detenía a pensar: "Oh, estos son pasos, ahora necesito reducir la velocidad y comenzar a cambiar el centro de gravedad para poder levantar la pierna". En cambio, mis ojos vieron los pasos y mi cuerpo sabía por experiencia qué hacer a continuación. Esto es lo que sucede después de un tiempo usando vOICe. Realmente veo lo que es, como una "radiografía" de visión,y empiezo a responder automáticamente a lo que veo.Esto nos lleva al sexto factor. Hora. Puede poner el sistema en una persona, pero solo después del paso del tiempo su cerebro aprende a interpretar automáticamente el significado de la revisión de sonido y a realizar acciones coordinadas.9 de julio de 2000, usuaria ciega tardía PF:Como una persona que ha visto anteriormente, puedo decir que los paisajes sonoros (revisión de sonido) parecen darme una sensación de visión nuevamente. En mi lugar, podría ser ciego desde el nacimiento. Pude imaginar y ver, como si tuviera ojos, cómo se ve mi pasillo. Cómo se ve la cortina a la izquierda de mis tres ventanas. En general, vOICe y webcam convirtieron mi entrada de una oscura "imagen mental" en lo que parece una visión tridimensional real.No me importa que sean mis oídos los que causen representaciones visuales. Es importante que la imagen de sonido me haya devuelto la forma de ver de nuevo, no importa que sea una imagen en blanco y negro en 3D. En lugar de un mundo de oscuros objetos brumosos y tangibles, VOICe permitió que mi cerebro viera los objetos como imágenes. Parece que VOICe crea bocetos en blanco y negro de lo que miro, y mi mente colorea esta imagen.Ahora estoy sentado frente a mi computadora y veo un flujo de color en la pantalla, pero esta VOZ me dice que estoy mirando un objeto cuadrado. Es como mirar el mundo a través de lentes borrosos. Usted ve la forma y disposición de los objetos a su alrededor, pero no distingue entre detalles sutiles. No sé si este es un lenguaje humano especial, pero es exactamente el idioma con el que mis oídos le dicen a mi mente lo que veo ahora. ¡Llámalo como quieras, funciona! ¡Ya no puedo prescindir de él! Gracias por este invento!29 de agosto de 2002, usuaria femenina ciega tardía PF:¿Solo un sonido? .. No, esto es mucho más, ¡esto es visión! vOICe crea una verdadera percepción visual. Cuando no uso VOICe, percibo un poco de luz a través de la abertura en mi ojo izquierdo. Es una niebla gris. Cuando uso VOICe, la imagen se vuelve clara de gris a negro. Definitivamente, esta es una imagen clara. Es cierto que no es color, es similar a lo que se muestra en la televisión en blanco y negro. La luz generada es muy blanca y limpia. Debilitándose, gradualmente se vuelve oscuro, negro. No vi nada especial en este mundo, como los "destellos fosforescentes" de los que estaban hablando. Quizás esta sea una de esas cosas que no entenderás hasta que veas. En general, la luz es luz y el color es color. Y no me importa cómo se formó.Así es como puede verse el mundo de las personas que han dominado el sistema y la tecnología vOICe y esto está lejos del límite.
Nuestros lectores que desean leer reseñas de otros pacientes que han dominado con éxito el sistema pueden ir al sitio central del proyecto (¡ La subsección vOICe proporciona visión y no daña el cuerpo! ). Recientemente aparecieron versiones móviles de las aplicaciones "The vOICe para Windows" y "The vOICe para Android" para teléfonos inteligentes, lo que permitirá a muchosusuarios del sistema negarse a llevar una computadora portátil pesada con el programa.Silencio de los inocentes
Un lector reflexivo tiene una pregunta lógica: ¿por qué un sistema tan maravilloso, cuyos principios básicos se establecieron en los años 20 del siglo pasado, que ha confirmado su veracidad y promesa con muchos ejemplos específicos y revisiones de pacientes reales no demuestra la dinámica exponencial del desarrollo? ¿Por qué, al menos hace una docena de años, no solo no tuvo lugar, sino que ni siquiera consideró públicamente programas gubernamentales a gran escala para apoyar y promover el proyecto?Quizás, vOICe estaba esperando su momento, cuando los procesadores lentos y las cámaras ineficientes serán reemplazados por sus análogos más avanzados, que pueden hacer frente a la tarea sin someter el cerebro y la psique a sobrecargas. En Rusia, el conservadurismo de quienes están en el poder, que prefieren financiar un concierto para ciegos, en lugar de un programa serio a largo plazo a gran escala para su rehabilitación, se ha convertido tradicionalmente en un poderoso freno. De una forma u otra, quiero creer los resultados de la prueba, así como el hecho de que estos resultados permitirán que el proyecto crezca a la escala de lo social, como lo planean sus autores.Al igual que todos los entusiastas, llenos de energía y fe en la singularidad y la necesidad de sus empresas, el equipo ruso TEAM VOICE RASSIA, dirigido por Danila Medvedev, al principio contó con el apoyo del Estado. Pasó el tiempo, pero el muro invisible no se hizo más delgado, los pasillos, más cortos y los funcionarios, más leales. La pérdida de varios años y las emociones acumuladas obligaron al equipo a cambiar el esquema inicial a crowdfunding. Esto ha permitido hoy reunir la mayor parte de la cantidad necesaria para lanzar la etapa decisiva del proyecto.La tarea mínima es crear cinco prototipos de VOICe de trabajo avanzado y transferirlos a personas ciegas para su operación y prueba a largo plazo en Rusia. En la etapa de familiarización con el sistema y otras pruebas de manejo, el equipo garantiza asistencia psicológica, la posibilidad de capacitación para revelar completamente el potencial del sistema. El objetivo máximo es la implementación del proyecto a nivel del programa social del estado con el objetivo de involucrar a las personas con discapacidad de esta categoría en la vida normal de la sociedad.Es difícil decir si el proyecto recibirá su desarrollo en Rusia, si se generalizará o si hoy seguirá en posesión de unidades, pero realmente quiero creer que ha llegado el "momento de los ciegos" y que el lugar no fue elegido por casualidad.
Como referencia: un conjunto de vOICe, teniendo en cuenta el curso completo de estudio, cuesta menos de 40 mil rublos. De hecho, el paciente tiene la oportunidad de moverse independientemente en un área desconocida. Al mismo tiempo, el costo de entrenar a un perro guía en la Organización Pública Rusa de Personas con Discapacidad, la Orden de la Bandera Roja del Trabajo, la Sociedad de Ciegos de toda Rusia, en 2013 ascendió a 1 millón de rublos, en 2014 ¡1,2 millones de rublos!Estimados lectores, les recordamos que están leyendo el blog de la compañía iCover. Suscríbase a nosotros, lo prometemos, no será aburrido. Source: https://habr.com/ru/post/es383717/
All Articles