Comunicação por vídeo olho no olho: tentativas de resolver o problema da falta de contato visual


Nossos computadores, smartphones e tablets possuem câmeras de vídeo embutidas destinadas aos usuários. O bate-papo por vídeo e a videoconferência - um a um, um com muitos, muitos com muitos - tornaram-se comuns tanto nos negócios quanto entre as pessoas comuns, e acho que a maioria de nós concorda que essa conexão é muito melhor do que a conversa comum usando apenas som. . Observar o rosto de outra pessoa enriquece a conversa e aumenta a satisfação dela. No entanto, estou chateado com um recurso relacionado à conexão de vídeo atual: a incapacidade dos participantes da conversa de olharem nos olhos um do outro. Não havia esse problema em Star Trek, e esse universo, é claro, é a fonte de todas as minhas expectativas tecnológicas.

Olhe para mim enquanto fala


Se você usou o bate-papo por vídeo, provavelmente entende o que quero dizer. Uma câmera que olha no seu rosto está localizada acima (e às vezes abaixo ou ao lado) da tela. Isso significa que o ângulo em que você olha para a tela é diferente do ângulo em que a câmera (e seu interlocutor) o vê - esse efeito é conhecido como paralaxe [ou não; para paralaxe é uma alteração na posição aparente de um objeto em relação a um fundo distante, dependendo da posição do observador / aprox. transl.]. O interlocutor terá a impressão de que você o olha nos olhos somente se você olhar para a câmera. Portanto, quando você vê a imagem do seu amigo na tela, parece que ele está olhando para baixo (ou em uma direção diferente, mas não para você) e você parece exatamente o mesmo na tela do seu amigo. Obviamente, você pode posicionar a câmera diretamente na frente da tela, mas a câmera fechará a imagem do seu interlocutor.

O contato visual é extremamente importante para uma conversa significativa e, no final, o objetivo de usar o vídeo em vez de apenas o áudio é ver a pessoa com quem você está falando. Mas se você não consegue olhar nos olhos de uma pessoa, isso elimina a maioria dos benefícios do vídeo em ligações telefônicas regulares. As instruções eficazes de comunicação comercial geralmente dizem que você deve olhar para a câmera enquanto fala, para que as pessoas do outro lado tenham a impressão de que está falando diretamente com elas. Mas isso não é natural, não permite que você veja a reação deles ao seu discurso. De fato, precisamos exatamente do que aconteceu nas naves espaciais da Federação: telas de vídeo que funcionam simultaneamente com câmeras para que, quando você olha para a tela, seus olhos pareçam iguais do outro lado. Naturalmente, os engenheiros já estão tentando alcançar esse efeito, trabalhando em várias direções.

É tudo sobre os espelhos


Uma maneira razoavelmente simples de manter contato visual durante as videochamadas é usar a tecnologia emprestada da indústria da televisão: o teleprompter . Se você assistir as notícias na TV, notará que o locutor está olhando diretamente para a câmera. Os anunciantes não aprendem suas histórias; eles os leem de uma tela de vídeo especial que parece aparecer bem na frente da câmera. De fato, a tela (um painel plano comum) está localizada com a face para cima na frente da câmera e o texto é mostrado na imagem espelhada. Acima dessa tela, bem na frente das câmeras, em um ângulo de 45 °, há um espelho parcialmente prateado (ou de dupla face). O locutor vê nele um reflexo do texto abaixo e a câmera vê apenas o locutor.



Teleprompters - tecnologia simples, testada e comprovada; eles existem há mais de 60 anos. E quando esses dispositivos são usados ​​para comunicações de vídeo, às vezes são chamados de túneis de vídeo. Mas eles têm certos problemas. Um problema é o tamanho: o equipamento é de natureza bastante volumosa, porque requer um espelho angular na frente da câmera, além de uma proteção especial da lente contra o brilho. Os teleprompters também costumam ser pesados, frágeis e caros - todos esses fatores os tornam pouco atraentes para os consumidores comuns.

Eu tenho um dispositivo ProPrompter Desktop que custa "apenas" US $ 500, que pode ser usado no meu computador (desktop ou laptop) ou em um tablet. Na verdade, trata-se de um teleprompter em miniatura, e o vídeo pode ser organizado de maneira que a imagem do seu interlocutor (em vez do texto a ser lido) seja localizada diretamente na frente da câmera. É complicado, mas funciona, e acaba sendo útil quando eu conduzo apresentações de vídeo remotas na frente de grandes grupos ou gravo vídeos em um script.

Se você usa o teleprompter ou não - há outro problema, nos casos em que mais de duas pessoas participam de uma conversa por vídeo. Se eu olhar diretamente para a câmera, para todas as pessoas que me vêem na tela, parece que estou fazendo contato visual com elas, mesmo que estejam espalhadas em lugares diferentes. Os participantes não terão a impressão de que meus olhos se movem quando eu volto minha atenção de uma pessoa para outra - e não posso dizer quem está olhando para mim (ou para minha imagem) na tela. O sistema GAZE-2 , que está sendo desenvolvido na Universidade de Kingston, em Queenston, Ontário, está tentando resolver esse problema usando várias câmeras em um túnel de vídeo, juntamente com uma câmera adicional direcionada para onde o computador acredita que o olhar do usuário é direcionado; O software muda para a câmera mais próxima do olhar do usuário e gira a imagem na outra extremidade para coincidir com o que está acontecendo.

Efeito da presença


Outra solução proposta para o problema de determinar a direção do olhar, desenvolvida na Universidade Keio em Tóquio em 1996, foi o sistema MAJIC . Ela substituiu o espelho de dupla face do teleprompter por uma grande tela curva feita de material perfurado fino que proporcionava uma superfície refletora de um lado e, na maior parte transparente, do outro. As câmeras atrás da tela registravam os participantes da conversa em um só lugar, e os projetores de vídeo comuns mostravam imagens de outros participantes (localizados em um ou mais lugares) na tela. Uma característica única do MAJIC era que, por trás da imagem de cada pessoa na tela, cada uma tinha uma câmera menor, trabalhando com os olhos virtuais dessa pessoa naquele lugar (e tocando sua voz junto com o alto-falante). No final, parecia que cada pessoa sempre olhava para o participante da conversa para a qual se voltara no momento, e até era possível ver quando um participante da conversa olhava para o outro. Uma vantagem adicional: projeções em tamanho real criaram a sensação de pessoas sentadas em uma mesa em frente uma da outra. Infelizmente, até onde eu sei, esse sistema nunca foi colocado à venda, o que não é surpreendente, devido ao seu volume e custo de equipamento.

Dez anos depois, uma versão muito mais compacta desse sistema apareceu. Em janeiro de 2006, a Apple recebeu uma patente para um sistema de vídeo olho no olho no qual uma grande variedade de câmeras microscópicas (e, de fato, invisíveis) foram incorporadas ao monitor junto com os elementos de exibição; e o software combinou todos esses milhares ou milhões de imagens em uma. Isso deve dar um efeito semelhante ao sugerido pelo MAJIC. O tempo dirá quando, ou de que forma, uma tecnologia semelhante estará disponível para os consumidores.

Outra abordagem, talvez mais promissora, chamada correção do olhar , agora está sendo estudada por pesquisadores de grandes empresas como HP, Microsoft e AT&T, entre outras . Tudo começa com uma ou duas câmeras de vídeo comuns montadas ao lado de uma tela comum. Um processador de vídeo especial altera digitalmente a imagem do rosto de cada pessoa em tempo real, para que pareça que seus olhos estão olhando diretamente para a câmera, mesmo que não esteja. Nas primeiras demonstrações, esses sistemas parecem mais ou menos convincentes - embora um pouco assustadores - mas ainda não estão prontos para uso comercial. Além disso, eles ainda não foram adaptados para um trabalho satisfatório com muitos participantes localizados em um local ou para contato visual seletivo com um dos vários participantes remotos.


É ótimo que o progresso não pare, mas, dado o enorme poder computacional dos dispositivos de computação atuais, estou surpreso e desapontado por até o momento não haver ferramentas de software disponíveis para que todos possam corrigir o olhar. É irritante que essa ferramenta já existia antes - um aplicativo do Windows chamado CatchEye que funcionava com o Skype, Google Hangouts, Facebook Messenger e outros produtos. No entanto, ele foi removido do mercado em 2017 sem qualquer explicação. Gostaria de pensar que isso aconteceu porque o desenvolvedor foi comprado por uma grande empresa como a Apple ou a Microsoft e agora está trabalhando duro para dar essa oportunidade às massas, mas posso ser otimista demais. Se eu pudesse olhar para gigantes tecnológicos bem nos olhos ...

Source: https://habr.com/ru/post/pt459022/


All Articles