VOICe Sound Vision - a um passo da inovação
"Todos os objetos têm um som único e, assim que você entende o princípio do sistema, pode" ver "o que o rodeia". Até relativamente recentemente, essa incrível propriedade do mundo ao nosso redor existia isoladamente da aplicação prática. Obrigado a Peter Meyer, que trabalha no departamento de pesquisa e desenvolvimento da empresa holandesa Philips, um algoritmo exclusivo foi compilado que permite transformar literalmente o som em uma imagem. Após várias décadas de busca pela oportunidade de concretizar a ideia de Meyer "no hardware", foi criado um dispositivo que permitia dotar uma pessoa cega dos chamados Visão "substituta". Sobre os sucessos, problemas e perspectivas do projeto, implementado hoje por uma equipe de cientistas russos - entusiastas, pararemos em nosso artigo.
Nós nos consolamos com a proximidade do momento da criação da inteligência artificial e, ao mesmo tempo, usando todo o poder do potencial técnico moderno, estamos apenas começando a procurar as facetas das capacidades do cérebro que trazem os frutos de nossas realizações ao nível de uma casa desajeitada e desajeitada, montada às pressas a partir de cubos de crianças.Congratulamo-nos com as próximas inovações, discuta animadamente os resultados de sonhos lúcidos com a máscara de milagre “ Remee”E admire sinceramente o potencial exponencialmente aumentado do novo modelo de smartphone de sua marca favorita, sem nem mesmo presumir que 280.000 mil cegos na Rússia sejam privados para sempre da oportunidade não apenas de avaliar a qualidade da matriz atualizada, mas de se alegrar com o sol nascente e as estações do ano. Em escala global, esse número sobe para 3.000.000 de pessoas. Além disso, dois terços deles são crianças e adolescentes!Todos os dias, de manhã à noite, uma pessoa cega decide a questão: como ligar a máquina de lavar, como não provocar um incêndio, como limpar o apartamento e como cozinhar até o prato mais simples. O preço dessa vida é realmente muito alto. Talvez seja por isso que toda pessoa cega na alma tenha esperança de uma inovação tecnológica que ajude não radicalmente, mas mude radicalmente a situação existente.
Para a pergunta: é uma alternativa possível mesmo para eles em alguma aproximação? ... uma equipe de cientistas entusiasmados de Moscou tentará responder, trabalhando para melhorar o dispositivo único de vídeo, dando aos cegos a oportunidade de ver o que os rodeia em preto e branco e em escala de cinza.Como funciona
Em termos simples, as informações de áudio transmitidas pelo dispositivo e percebidas pelo cérebro são um código original - o resultado de uma conversão por software do streaming de vídeo capturado pela câmera vOICe em blocos de som (“sound scapes” - ed.). O processo de digitalização do mundo ao redor no modo “Scanner” (sem usar um laptop) é realizado ciclicamente da esquerda para a direita, a imagem é dublada em um segundo com um segundo intervalo. As informações recebidas pelo paciente no modo "Scanner", usando a câmera embutida no sistema, têm um conjunto "mínimo" de rasuras. Recursos aprimorados de informações são alcançados ao usar o conjunto "óculos + laptop com um processador bastante poderoso (ou smartphone de última geração) + fones de ouvido estéreo para comandos de voz".Identificação
À primeira vista, o algoritmo de reconhecimento parece esmagador para a assimilação devido ao processo incomum de identificar informações recebidas. Algoritmo simplificado dos chamados. Uma visão "substituta" pode ser representada pela figura a seguir:
O algoritmo de transformação ainda não está pronto para oferecer ao usuário a capacidade de "ver" objetos em movimento rápido, reconhecer textos pequenos, mas os resultados já obtidos são bastante impressionantes: os proprietários de vídeos realmente identificam sinais com precisão e até mesmo veem e percebem informações visuais em alguns formatos de programas de televisão. E o mais importante, a qualidade da imagem, a profundidade e os detalhes à medida que você veste o vOICe melhoram rapidamente.Melhorias adicionais na qualidade do reconhecimento e na gama de cores dependerão diretamente do aprimoramento das versões de software ("firmware") e do hardware do vOICe, bem como da capacidade individual de uma pessoa de perceber combinações mais complexas de capturas sonoras de densidade suficiente.A julgar pelas reivindicações do autor da metodologia e pelas revisões de pacientes que dominaram com sucesso o sistema, o processo de "ensinar" uma nova maneira de ver é mais comparável ao processo de aprender uma língua estrangeira, de algumas maneiras para dominar o código Morse e as habilidades de caminhada. Enquanto você aprende - “reabasteça seu vocabulário” (uma biblioteca pessoal de skeypov) e o domínio da tecnologia, a imagem visual é reconhecida quase automaticamente - sem um estágio intermediário de uma longa análise consciente!
Sons de várias durações e alturas são usados para identificar a imagem. Um fragmento mais brilhante da imagem real no “alfabeto da VOZ” transmite um sinal sonoro mais curto e mais forte e transmite pelo lado em que o objeto está localizado. Se um ponto (objeto) se move, então o sinal se move, dois pontos são identificados por dois sinais, três são três, etc. Um tom longo corresponde a uma linha horizontal, um vertical é reproduzido por um sinal irregular de uma força característica. Aumentar a tonalidade dos sons “vizinhos” significará um obstáculo, enquanto quanto mais alto o tom, maior o obstáculo.Várias modificações do sistema vOICe nas figuras abaixo:


O método descrito chega à voz e identifica quase qualquer realidade tridimensional. Naturalmente, quanto mais informativa a imagem, mais sons e skeipes individuais serão necessários para identificá-la.O principal objetivo e a principal conquista da tecnologia e do sistema vOICe é fornecer ao paciente não informações visuais "brutas", mas um conjunto de algoritmos altamente eficazes que permitem interpretar a realidade com um alto grau de detalhe. A tecnologia, embora em menor grau, resolve o problema da completa falta de visão para pacientes nascidos cegos, que não têm em sua memória e consciência muitas das ferramentas de analogia disponíveis para pessoas que perderam a visão no estágio "consciente" da vida. Além dos sucessos óbvios da tecnologia, ainda existem problemas técnicos não resolvidos que podem ser sentidos melhor lendo o feedback dos usuários do vOICe que dominaram os recursos do sistema.Feedback dos participantes do experimento 2000-2002 ano
Em 29 de abril de 2001, a usuária PF cega:Minha experiência: desde a primeira instalação, tive que passar por inúmeras tentativas e erros. Eu não estava acostumado apenas à revisão sonora, mas também necessária ao uso efetivo desse sistema. Eu descobri que existem seis fatores principais ao trabalhar com o programa.O primeiro fator traz a câmera. Sua colocação, foco, iluminação - esses são elementos importantes que fornecem uma visão geral clara do som. Se o foco for ruim, a imagem parecer embaçada e difícil de interpretar. Se a câmera não montar corretamente, sinto uma perda de orientação e fico confuso ao tentar encontrar uma maneira (uma boa maneira de sentir dor de cabeça!) Se a iluminação é fraca, a revisão do som é limitada. É difícil distinguir objetos no campo de visão. Normalmente, posso olhar para a porta da frente e as escadas e ouvir o ritmo da textura de ambos. Mas se a luz estiver apagada ou não estiver clara, apenas uma imagem fraca da porta e da escada é determinada e o restante da imagem se torna um som de fundo embaçado e nebuloso.O segundo fator está relacionado ao microfone. Há um interruptor no suporte do microfone. Eu costumava deixar o microfone ligado o tempo todo e fiquei com medo quando minha respiração ou sons estranhos pareciam comandos, e mudou o programa. Descobri que se você ligar o microfone apenas para dar um comando de voz e depois o desligar quando o comando for aceito, esse problema diminui e não é mais irritante. Essa solução funciona com tanta confiabilidade que eu a uso em todos os meus outros sistemas.O terceiro fator deve estar relacionado ao laptop. Encontrei várias maneiras de melhorar seu trabalho. Em primeiro lugar, se eu excluir todos os programas desnecessários e executar apenas o vOICe, isso economizará energia e uso da CPU. Portanto, quando uso um laptop em qualquer lugar, inicio uma instalação simples. Eu conecto o laptop a uma tomada elétrica à noite, quando estiver próximo. Eu carrego duas baterias na minha bolsa, elas são necessárias. Devo ligar a tela do laptop por não mais do que alguns minutos. Quando carrego um laptop na mochila, verifico se ele está bem ventilado.O quarto fator. Você precisa usar o vOICe de forma eficaz e, para isso, precisa trabalhar com o programa e entender o próprio programa do vOICe. Quando eu comecei a usá-lo, eu costumava brincar com ela por hábito, como tic-tac-toe. Isso me ajudou a entender os sons do programa. Então comecei a treinar a pronúncia gradualmente. Eu acho que treinar o programa de fala e fazer os exercícios com o microfone é realmente a chave para usar o vOICe em condições móveis. Portanto, treinar e perceber uma boa revisão são etapas para aprender a ver.O quinto fator é a imersão contínua de si mesmo no programa, que segue o fator de treinamento. Eu acho que você pode aprender e ganhar bastante experiência se usar um computador de mesa. Em geral, a experiência do movimento diário e da escuta (vendo) o que o rodeia não pode ser substituída por nada. É como uma criança aprendendo a andar. Se você não tentar, não alcançará o conhecimento de que seu corpo precisa permanecer. Usando essa analogia, posso dizer que até que você se exponha à influência de um ambiente em constante mudança, não sentirá uma visão sólida e entenderá os relacionamentos em que precisa trabalhar.Se eu ouvir os degraus da entrada constantemente, meu corpo começará a anexar a imagem sonora dos degraus à definição de "ação" e, quando eu subir ou descer, meu corpo atuará em conjunto. Penso que, a princípio, você ouve uma revisão sonora, depois abre o relacionamento com o objeto que ouve e anexa essa definição ao que o corpo precisa fazer para concluir a ação. Quando eu estava vendo, não parei para pensar: "Oh, esses são os passos, agora preciso desacelerar e começar a mudar o centro de gravidade para poder levantar minha perna". Em vez disso, meus olhos viram os degraus e meu corpo sabia por experiência própria o que fazer a seguir. Veja o que acontece depois de um tempo usando o vOICe. Eu realmente vejo o que é, como um "raio-x" da visão,e começar a responder automaticamente ao que vejo.Isso nos leva ao sexto fator. Tempo. Você pode colocar o sistema em uma pessoa, mas somente após a passagem do tempo seu cérebro aprende a interpretar automaticamente o significado da revisão sonora e a executar ações coordenadas.9 de julho de 2000, usuária cega PF:como uma pessoa que já viu anteriormente, posso dizer que as paisagens sonoras (revisão de som) parecem me dar um senso de visão novamente. Em meu lugar, eu poderia ser cego de nascença. Eu era capaz de imaginar e ver, como se eu tivesse olhos, como é o meu corredor. Como é a cortina à esquerda das minhas três janelas. Em geral, o vOICe e a webcam transformaram minha entrada de uma "imagem mental" obscura no que parece ser uma visão tridimensional real.Não importa para mim que são meus ouvidos que causam representações visuais. É importante que a imagem do som tenha restaurado o caminho para que eu possa ver novamente, não importa que seja uma imagem em preto e branco 3D. Em vez de um mundo de objetos obscuros, tangíveis e tangíveis, a voz permitiu que meu cérebro visse objetos como figuras. Parece que o vOICe cria esboços em preto e branco do que estou vendo, e minha mente colore essa imagem.Agora estou sentado em frente ao meu computador e vejo um fluxo de cores na tela, mas essa voz diz que estou olhando para um objeto quadrado. É como olhar o mundo através de óculos embaçados. Você vê a forma e a disposição dos objetos ao seu redor, mas não distingue entre detalhes sutis. Não sei se essa é uma linguagem humana especial, mas é exatamente a linguagem com a qual meus ouvidos dizem à minha mente o que vejo agora. Chame como quiser, funciona! Não aguento mais! Obrigado por esta invenção!29 de agosto de 2002, a usuária PF cega:Apenas um som? .. Não, isso é muito mais, isso é visão! A vOICE cria uma verdadeira percepção visual. Quando não uso a voz, percebo a luz um pouco através da abertura no meu olho esquerdo. É uma névoa cinza. Quando uso o vOICe, a imagem fica clara de levemente cinza a preto. Definitivamente, esta é uma imagem clara. É verdade que não é colorido, é semelhante ao que é mostrado na TV em preto e branco. A luz gerada é muito branca e limpa. Enfraquecendo, ele gradualmente se torna escuro, preto. Não vi nada de especial neste mundo, como os "flashes fosforescentes" sobre os quais eles estavam falando. Talvez essa seja uma daquelas coisas que você não entenderá até ver. Em geral, luz é luz e cor é cor. E não importa para mim como se formou.É assim que o mundo das pessoas que dominam o sistema e a tecnologia do vOICe pode parecer e isso está longe do limite.
Nossos leitores que desejam ler resenhas de outros pacientes que dominaram o sistema com sucesso podem acessar o site central do projeto ( a subseção vOICe fornece visão e não agride o corpo! ). Recentemente, surgiram versões móveis dos aplicativos “The vOICe for Windows” e “The vOICe for Android” para smartphones, o que permitirá que muitosusuários do sistema se recusem a carregar um laptop pesado com o programa.Silêncio dos Inocentes
Um leitor atencioso tem uma pergunta lógica: por que um sistema tão maravilhoso, alguns dos princípios básicos estabelecidos na década de 20 do século passado, que confirmou sua veracidade e promessa com muitos exemplos e análises específicos de pacientes reais, não demonstra a dinâmica exponencial do desenvolvimento? Por que, pelo menos uma dúzia de anos atrás, não apenas não ocorreu, mas sequer considerou publicamente programas governamentais de larga escala para apoiar e promover o projeto?Talvez o vOICe estivesse apenas aguardando seu tempo, quando processadores lentos e câmeras ineficientes serão substituídos por seus análogos mais avançados, que podem lidar com a tarefa sem sujeitar o cérebro e a psique a sobrecargas. Na Rússia, o conservadorismo dos que estão no poder, que preferem financiar um concerto para cegos, em vez de um programa sério e de longo prazo para sua reabilitação, tradicionalmente se tornou um freio poderoso. De uma forma ou de outra, quero acreditar nos resultados dos testes, bem como no fato de que esses resultados permitirão que o projeto cresça na escala social, conforme planejado por seus autores.Como todos os entusiastas, cheios de energia e fé na singularidade e necessidade de seus empreendimentos, a equipe russa do TEAM VOICE RASSIA, liderada por Danila Medvedev, contou inicialmente com o apoio do Estado. O tempo passou, mas a parede invisível não se tornou mais fina, os corredores - mais curtos e os oficiais - mais leais. A perda de vários anos e as emoções acumuladas obrigaram a equipe a mudar o esquema inicial para o crowdfunding. Isso tornou possível hoje coletar a maior parte do montante necessário para iniciar a etapa crucial do projeto.A tarefa mínima é criar cinco protótipos de trabalho avançados do vOICe e transferi-los para pessoas cegas para operações e testes de longo prazo na Rússia. No estágio de familiarização com o sistema e mais testes, a equipe garante assistência psicológica, a possibilidade de treinamento para revelar completamente o potencial do sistema. O objetivo máximo é a implementação do projeto no nível do programa do estado social, com o objetivo de envolver as pessoas com deficiência dessa categoria na vida normal da sociedade.É difícil dizer se o projeto receberá seu desenvolvimento na Rússia, se será difundido ou permanecerá na posse de unidades hoje, mas eu realmente quero acreditar que o “tempo dos cegos” chegou e o local não foi escolhido por acaso.
Para referência: um conjunto de VÍDEOS, levando em consideração o curso completo do estudo, custa menos de 40 mil rublos. De fato, o paciente tem a oportunidade de se mover independentemente em uma área desconhecida. Ao mesmo tempo, o custo de treinar um cão-guia na Organização Pública da Rússia para Pessoas com Deficiência, a Ordem da Bandeira Vermelha do Trabalho de toda a Rússia, a Sociedade dos Cegos, em 2013 totalizou 1 milhão de rublos, em 2014 1,2 milhão de rublos!Caros leitores, lembramos que você está lendo o blog da empresa iCover. Inscreva- se, prometemos, não será chato. Source: https://habr.com/ru/post/pt383717/
All Articles