El "micrófono visual" es una técnica que le permite restaurar el audio de una grabación de video silenciosa. Hoy le diremos no solo sobre esto, sino también otros métodos y tecnologías que le permiten leer y restaurar música o voz de forma remota.
Foto m01229 CCPredecesores tecnológicos
Una forma de grabar sonido a distancia
es a través de láser. Los llamados
micrófonos láser se utilizan para leer las vibraciones causadas por las ondas sonoras. Por ejemplo, puede "capturar" el sonido de esta manera desde la superficie del cristal de una ventana si hay personas hablando en la sala o escuchando música. El interferómetro detecta el "movimiento" de la superficie al cambiar la longitud del camino óptico del haz reflejado. Después de eso, estas desviaciones se convierten en una señal de sonido utilizando algoritmos especiales.
La red tiene grabaciones de audio que muestran que los "micrófonos láser" le permiten restaurar el sonido con bastante buena calidad. Sin embargo, este enfoque tiene su inconveniente asociado con la complejidad de la instalación del dispositivo.
También puede "grabar sonido a distancia" utilizando
radiación de microondas de baja intensidad, que se utiliza en las comunicaciones. Se
utilizaron tecnologías similares en la NASA para capturar y reconocer señales de radio débiles en el espacio.
Una antena de bocina dirige microondas a una frecuencia de 30-100 GHz a través de una pared del edificio. Si las personas hablan en interiores o suena música, las ondas sonoras pueden contarse mediante microvibraciones como objetos y materiales ligeros: en una forma "capturada"
adquieren una modulación de amplitud. Esta información se utiliza para reconstruir el sonido que actúa sobre el objeto. Además, este objeto puede ser cualquier tipo de ropa, por lo que este método le permite "interceptar" incluso el sonido de un latido cardíaco.
Micrófono visual: una solución de los científicos del MIT
Los científicos del MIT han
propuesto otra forma de leer el sonido desde la distancia. Probaron que es posible restaurar el sonido basado en video. Para hacer esto, debe grabar un video del objeto usando una cámara para disparar a alta velocidad y analizar las vibraciones microscópicas causadas por la propagación de las ondas sonoras.
Basado en el video, se construye una
pirámide de imágenes controlable , que
es un conjunto de filtros que "dividen" cada cuadro del video en subbandas complejas que corresponden a diferentes puntos del objeto en estudio.
Los científicos han desarrollado un algoritmo especial (y lo
ponen en el dominio público), que calcula la intensidad de las vibraciones del sonido en cada uno de los puntos seleccionados. Las señales locales se promedian, y una señal común se forma en base a ellas, lo que determina cómo actúan las ondas de sonido en un objeto. Esta señal pasa a través de un filtro de paso alto de Butterworth con un umbral de corte de 20–100 Hz. Entonces es posible restaurar la grabación de audio.
Según el líder del estudio, Abe Davis, un micrófono visual le permite recibir grabaciones de audio de menor calidad en comparación con los métodos activos (por ejemplo, el uso de láser), pero tiene sus propias ventajas. Su sistema no requiere equipo adicional ni detectores; solo necesita una cámara de video de alta velocidad. Al mismo tiempo, la superficie desde la que se "leerá" el sonido no tiene que reflejarse ni alisarse, como a menudo requieren
los micrófonos láser .
El equipo de Abe trató de leer el sonido de una bolsa de papel, paquetes de chips y papel de aluminio. Son ligeros, porque las vibraciones de sonido en ellos fueron más notables, y la señal resultante es menos ruidosa. Entre los objetos de prueba también había una planta de interior y un ladrillo que, según los científicos, "se mostró" mejor de lo que esperaban.
El equipo hizo un video en el que mostraban cómo "suenan" ciertos objetos:
Los científicos señalan que planean continuar trabajando en esta dirección y explorar la posibilidad de reproducir audio de cualquier grabación de video, y no solo prepararse especialmente con una cámara de alta velocidad.
Desarrollo tecnológico
Otros científicos están tratando de mejorar la tecnología propuesta por el grupo del MIT. Por ejemplo, el año pasado, los investigadores iraníes
introdujeron un algoritmo que acelera la extracción de sonido del "video de alta velocidad" y mejora su calidad.
El sonido afecta a diferentes áreas de un objeto de diferentes maneras. La intensidad de la vibración depende del material del que está hecho el artículo, su forma, frecuencia del sonido de impacto y la distancia a la fuente. Por ejemplo, cuando se graba video a una frecuencia de 20 kHz, las ondas de sonido viajan unos 17 mm entre dos cuadros. Por lo tanto, los objetos más alejados de la fuente de sonido reaccionan con retraso.
Todos estos factores hacen que diferentes áreas del objeto vibren con diferentes fuerzas. Por lo tanto, los científicos al analizar las imágenes de la cámara tienen en cuenta solo aquellas zonas que hacen la mayor contribución a la formación de la señal resultante, los bloques menos "ruidosos". En este caso, las frecuencias que las forman tienen diferentes cambios de fase para eliminar la interferencia atenuante.
Investigadores iraníes señalan que gracias a esto, pudieron mejorar la calidad del sonido reproducido, así como acelerar el procesamiento de imágenes, en comparación con el algoritmo MIT original. Dicen que su sistema es capaz de procesar la imagen y restaurar el sonido en tiempo real.
El potencial de los micrófonos visuales.
En general, la tecnología aún es experimental y no se habla de comercialización completa. Pero ella ya está profetizando un uso potencial en el campo de la ley y el orden: la policía podrá obtener más información de las cámaras de CCTV.
Hay otras opciones: dichos sistemas le permitirán analizar cómo se comporta el sonido en los estudios de grabación y salas de conciertos para determinar sus propiedades acústicas. Otra aplicación es utilizar el sistema en la industria espacial para estudiar sonidos en el espacio. Por cierto, los residentes de Hacker News ya han
sugerido que en el futuro, los "micrófonos visuales" resolverán de una vez por todas el misterio del alunizaje.
Más interesante sobre el sonido: en nuestro "Mundo de alta fidelidad":
Nuestros nuevos materiales en GT: