Un grupo de investigadores
digitalizó miles de horas de grabaciones de audio de archivos de la NASA. Estos son los registros de las negociaciones de los empleados del centro de control de la misión con los astronautas de la misión Apolo. Con su ayuda, los investigadores esperan mejorar las tecnologías de reconocimiento de voz y análisis.
Hablaremos sobre este proyecto y las dificultades para trabajar en él bajo el corte.
Por cierto, si le gusta leer sobre trabajar con sonido en microformato, nuestro canal Telegram .
Foto Salvatore Capalbi CC BY-SASobre el proyecto
En 2012, un equipo de investigadores dirigido por el profesor John Hansen de la Universidad de Texas en Dallas
le pidió a la NASA que les diera acceso a los archivos de audio de la agencia. Los investigadores querían usar grabaciones de conversaciones de astronautas con el centro de control de misiones de la NASA para desarrollar y entrenar algoritmos de reconocimiento de voz.
Se les dio acceso a los investigadores, pero se enfrentaron a un problema desagradable: resultó que la mayoría de las grabaciones de audio no estaban digitalizadas y almacenadas en archivos de la NASA en cinta.
El equipo decidió abordar este problema, después de haber lanzado el proyecto, que duró más de cinco años. Los científicos comenzaron a digitalizar todos los registros de la misión espacial Apollo 11 y la mayoría de los registros de Apollo 1, Apollo 13 y Gemini-8.
La tarea de digitalizar películas antiguas resultó ser técnicamente difícil. Las grabaciones solo se podían reproducir en dispositivos SoundScriber especiales que se hicieron en la década de 1960 para la NASA. Hay dos máquinas de este tipo en el mundo, hechas específicamente para la agencia.
Instaladas en el centro de comando, las máquinas grabaron sonido de 30 fuentes diferentes en 30 pistas separadas. Sin embargo
, solo un SoundScriber
ha sobrevivido hasta nuestros días. En este caso, la máquina podría reproducir solo una pista a la vez. Dado que los investigadores tenían innumerables películas con grabaciones de 14 horas cada una, el proyecto podría llevar mucho tiempo.
"Incluso si haces esto las 24 horas, digitalizar el archivo solo para el Apolo 11 nos llevaría unos 170 años", dijo Hansen.
Para resolver el problema, los científicos modificaron SoundScriber, desarrollando un nuevo cabezal de lectura, que permitía leer 30 pistas a la vez. Además, se implementó una solución para el procesamiento paralelo.
Como resultado, el archivo de las cuatro misiones se digitalizó en solo tres meses. Luego, los investigadores crearon un programa que no solo reconocía el habla, sino que también determinaba quién hablaba cuándo y colocaba las notas en orden cronológico.
El archivo estará a disposición del público para otros científicos y personal universitario. Algunos de los registros ya están en el sitio web
Explore Apollo , que está dedicado a la misión Apollo 11.
¿Por qué es esto importante?
Uno de los principales problemas de los
sistemas de
PNL es el problema del reconocimiento de voz en un entorno ruidoso: cuando mucha gente habla a la vez, hay sonidos extraños. El equipo de investigación y John Hansen esperan que su trabajo nos permita dar un paso adelante para resolverlo.
Los archivos de audio de la NASA son grabaciones de conversaciones de muchas personas al mismo tiempo en una situación real relacionada con la resolución de una serie de problemas complejos. Además, a menudo el personal del centro en Houston tiene un pronunciado acento de Texas en su discurso, y el
reconocimiento de diferentes variantes de pronunciación no es el lado más fuerte de los sistemas de IA. El uso de dichos registros para entrenar algoritmos de ML permitirá "preparar" mejor las máquinas para trabajar en condiciones difíciles.
John Hansen también
cree que su trabajo abrirá la puerta al mundo de los viajes espaciales para el público en general. Por lo general, solo vemos el trabajo de los astronautas, pero perdemos de vista el trabajo de las personas que acompañan el vuelo desde la Tierra. Estas notas proporcionarán una idea del corazón de la NASA. Como dice Hansen, esta es una oportunidad para aprender sobre los "héroes detrás de los héroes".
Fotos de la NASAOtras entradas
Anteriormente, la NASA ya había publicado algunas grabaciones de audio de sus archivos. En 2014, el sitio web de la agencia
publicó grabaciones de conversaciones de la tripulación a bordo del Apollo 11. Todos los registros se dan en su forma original, con interferencia técnica y largas pausas. El audio en algunos puntos deja mucho que desear, pero al lado de los archivos correspondientes hay marcas de tiempo que se pueden usar para
verificar el descifrado de texto .
Los registros de las negociaciones durante las misiones de la NASA también se pueden encontrar en el archivo oficial de la agencia
en archive.org . Existen registros tanto de vuelos antiguos (desde 1982) como de lanzamientos modernos.
También en Internet puede encontrar grabaciones de charlas de astronautas en la EEI. Por ejemplo, en este recurso
hay grabaciones de audio realizadas
durante la caminata espacial y la
resolución de una emergencia a bordo de la estación en agosto de 2007. Hay registros en los que los astronautas de la EEI responden preguntas y
cuentan cómo se relajan y qué crecen .
Todos estos archivos y proyectos le permiten familiarizarse mejor con los procesos que tienen lugar en órbita en el espacio y en la sede en la Tierra.
Más interesante sobre el sonido: en nuestro "Mundo de alta fidelidad":