Sekelompok peneliti
mendigitalkan ribuan jam rekaman audio dari arsip NASA. Ini adalah catatan negosiasi staf pusat kendali misi dengan para astronot misi Apollo. Dengan bantuan mereka, para peneliti berharap dapat meningkatkan pengenalan suara dan teknologi analisis.
Kami akan membicarakan proyek ini dan kesulitan dalam mengerjakannya di bawah potongan.
Omong-omong, jika Anda suka membaca tentang bekerja dengan suara dalam mikroformat - saluran Telegram kami.
Foto Salvatore Capalbi CC BY-SATentang proyek
Pada 2012, sebuah tim peneliti yang dipimpin oleh Profesor John Hansen dari University of Texas di Dallas
meminta NASA untuk memberi mereka akses ke arsip audio agensi tersebut. Para peneliti ingin menggunakan rekaman percakapan astronot dengan pusat kendali misi NASA untuk mengembangkan dan melatih algoritma pengenalan ucapan.
Para peneliti diberi akses, tetapi mereka menghadapi masalah yang tidak menyenangkan - ternyata sebagian besar rekaman audio tidak didigitalkan dan disimpan dalam arsip NASA dalam rekaman.
Tim memutuskan untuk mengatasi masalah ini, setelah meluncurkan proyek, yang berlangsung lebih dari lima tahun. Para ilmuwan mulai mendigitalkan semua catatan dari misi luar angkasa Apollo 11 dan sebagian besar catatan dari Apollo 1, Apollo 13 dan Gemini-8.
Tugas digitalisasi film-film lama ternyata sulit secara teknis. Rekaman hanya dapat diputar pada perangkat SoundScriber khusus yang dibuat pada 1960-an untuk NASA. Ada dua mesin seperti itu di dunia, dibuat khusus untuk agensi.
Dipasang di pusat perintah, mesin merekam suara dari 30 sumber berbeda pada 30 trek terpisah. Namun
, hanya satu SoundScriber yang
bertahan hingga hari ini. Dalam hal ini, mesin hanya dapat memutar satu lagu pada satu waktu. Mengingat para peneliti memiliki film yang tak terhitung banyaknya dengan rekaman masing-masing 14 jam, proyek ini bisa memakan waktu lama.
"Bahkan jika Anda melakukan ini sepanjang waktu, mendigitalkan arsip untuk Apollo 11 saja akan memakan waktu sekitar 170 tahun," kata Hansen.
Untuk mengatasi masalah ini, para ilmuwan memodifikasi SoundScriber, mengembangkan head baca baru, yang memungkinkan untuk membaca 30 lagu sekaligus. Plus, solusi diimplementasikan untuk pemrosesan paralel.
Hasilnya, arsip keempat misi itu didigitalkan hanya dalam waktu tiga bulan. Para peneliti kemudian menciptakan sebuah program yang tidak hanya mengenali pembicaraan, tetapi juga menentukan siapa yang berbicara kapan dan menempatkan catatan dalam urutan kronologis.
Arsip akan tersedia untuk umum bagi ilmuwan lain dan staf universitas. Beberapa catatan sudah ada di situs web
Explore Apollo , yang didedikasikan untuk misi Apollo 11.
Mengapa ini penting?
Salah satu masalah utama
sistem NLP adalah masalah pengenalan suara di lingkungan yang bising - ketika banyak orang berbicara sekaligus, suara asing muncul. Tim peneliti dan John Hansen berharap bahwa pekerjaan mereka akan memungkinkan kita untuk mengambil langkah maju dalam menyelesaikannya.
Arsip audio NASA adalah rekaman percakapan banyak orang pada saat bersamaan dalam situasi nyata terkait dengan penyelesaian sejumlah masalah rumit. Selain itu, sering kali staf pusat di Houston memiliki aksen Texas yang jelas dalam pidatonya, dan
pengakuan varian pelafalan yang berbeda bukanlah sisi terkuat dari sistem AI. Menggunakan catatan tersebut untuk melatih algoritma ML akan memungkinkan Anda untuk lebih “mempersiapkan” mesin untuk bekerja dalam kondisi yang sulit.
John Hansen juga
percaya bahwa pekerjaan mereka akan membuka pintu ke dunia perjalanan ruang angkasa untuk masyarakat umum. Biasanya kita hanya melihat karya para astronot, tetapi kita tidak melihat karya orang-orang yang menemani penerbangan dari Bumi. Catatan ini akan memberikan wawasan ke jantung NASA. Seperti kata Hansen, ini adalah kesempatan untuk belajar tentang "pahlawan di belakang para pahlawan."
Foto NASAEntri lainnya
Sebelumnya, NASA telah menerbitkan beberapa rekaman audio dari arsipnya. Pada tahun 2014, situs web agensi
memposting rekaman pembicaraan kru di atas kapal Apollo 11. Semua catatan diberikan dalam bentuk aslinya, dengan gangguan teknis dan jeda panjang. Audio di beberapa titik menyisakan banyak yang diinginkan, tetapi di sebelah file yang sesuai ada cap waktu yang dapat digunakan untuk
memeriksa dekripsi teks .
Rekaman negosiasi selama misi NASA juga dapat ditemukan di arsip resmi lembaga itu
di archive.org . Ada catatan penerbangan lama (dari 1982) dan peluncuran modern.
Juga di Internet Anda dapat menemukan rekaman pembicaraan astronot di ISS. Misalnya, pada sumber daya ini
ada rekaman audio yang dibuat
selama spacewalk dan
menyelesaikan keadaan darurat di stasiun pada Agustus 2007. Ada catatan tentang astronot dari ISS yang menjawab pertanyaan dan
memberi tahu bagaimana mereka rileks dan apa yang mereka tumbuhkan .
Semua arsip dan proyek ini memungkinkan Anda untuk lebih mengenal proses yang terjadi di orbit dalam ruang dan di kantor pusat di Bumi.
Lebih menarik tentang suara - di "Dunia Hi-Fi" kami: