Insinyur dari Hitachi telah menghasilkan ribuan rekaman audio yang menggambarkan pengoperasian peralatan industri dalam kondisi pertempuran. Dengan bantuan pustaka semacam itu, algoritma mesin dapat mendeteksi pengoperasian sistem yang tidak normal dan memprediksi kemungkinan gangguan.
Kami memberi tahu apa yang masuk ke dalam kumpulan data dan siapa yang masih mengerjakan proyek serupa.
Foto abi ismail / UnsplashMengapa itu perlu?
Dokter menggunakan stetoskop untuk mendiagnosis penyakit tertentu. Tetapi akurasi dengan patologi yang dapat dideteksi dengan cara ini
adalah 20-40%. Oleh karena itu, stetoskop elektronik hari ini dengan sistem kecerdasan buatan datang untuk menyelamatkan. Misalnya, perangkat semacam itu
dibuat oleh spesialis dari Northwest Memorial Hospital of Chicago. Algoritma pintar membantu meningkatkan akurasi diagnosis hingga 97%.
Pendekatan serupa mendapatkan momentum di bidang model pembelajaran mesin - produksi yang menunjukkan kegagalan fungsi mesin industri: suara bising yang tidak wajar dalam pengoperasian transmisi, pompa, kipas atau katup. Untuk meningkatkan akurasi dan kualitas pembelajaran mesin, Hitachi menyiapkan dan menyediakan serangkaian rekaman audio mesin industri untuk umum. Pekerjaan telah dilakukan dalam kondisi pabrik nyata.
Menurut penulis, ini adalah
set data pertama di dunia . Itu disebut MIMII Dataset - Sound Dataset untuk Kerusakan Investigasi dan Inspeksi Mesin Industri.
Apa yang ada di dalamnya
Pilihan tersebut berisi bunyi katup, pompa, kipas dan pemandu rel. Semuanya dari produsen yang berbeda. Arsip berisi lebih dari 26 ribu sampel sepuluh detik dengan suara mesin yang beroperasi dalam kondisi normal. Juga, ada 6 ribu file audio dengan rekaman karya perangkat yang rusak dan mesin yang berada dalam "keadaan tidak sempurna".
Di antara kondisi-kondisi ini: kerusakan pada pemandu dan kurangnya pelumasan pada mereka, ketidakseimbangan selama rotasi bilah dan kemacetan mereka, kebocoran oli dan lonjakan daya.
Foto Sergei Akulich / UnsplashDurasi sampel audio adalah 10 detik, semuanya direkam dalam format WAV dengan frekuensi sampling 16 kHz. Rekaman dilakukan sekaligus di beberapa pabrik produksi. Delapan mikrofon digunakan, dirakit dalam susunan melingkar dan dipasang pada jarak 10-50 cm dari peralatan dan peralatan mesin (diagram dapat ditemukan
dalam whitepaper pada halaman 3 ).
Kit ini dilisensikan di bawah CC BY-SA 4.0 . Arsipnya ada di situs Zenodo, tetapi berat totalnya melebihi 150 GB . Anda dapat mendengarkan beberapa rekaman audio di sini .
Rencana penulis
Untuk setiap model mesin industri - karena mereka semua memiliki karakteristik akustik sendiri - para insinyur mengembangkan detektor anomali. Peluncuran uji menunjukkan bahwa sistem cerdas yang terlatih lebih baik mendeteksi kegagalan fungsi pada kipas dan pemandu kereta. Tetapi detektor mengalami kesulitan menganalisis operasi katup.
Insinyur menjelaskan hal ini dengan fakta bahwa suara membuka dan menutup katup pendek dan jarang terjadi. Dengan demikian, lebih sulit untuk mengidentifikasi kerusakan daripada dalam kasus suara statis dan terus menerus dari mekanisme lain. Pengembangan algoritma yang efektif untuk mendeteksi anomali dalam pengoperasian katup, akan ditangani oleh spesialis Hitachi di masa mendatang.
Proyek serupa
Pada subbab pertama, kami mencatat bahwa sistem kecerdasan buatan menembus sektor kesehatan. Oleh karena itu, sejumlah besar set data untuk algoritma pelatihan yang mendiagnosis penyakit organ internal juga muncul di area ini. Sebagai contoh, seorang insinyur dari Universitas Stanford telah
secara terbuka menerbitkan klasifikasi kelainan detak jantung.
Ini digunakan untuk mengembangkan stetoskop pintar - kumpulan data telah
diunduh lebih dari 7 ribu kali oleh para ahli dari India, AS, Kanada, Prancis, Jerman, dan negara-negara lain.
Foto Marcelo Leal / UnsplashContoh lain adalah dari dunia mobil. Perusahaan Israel 3signals sedang
mengembangkan sistem diagnostik cerdas. Berkat itu, pemilik mobil akan dapat menerima informasi tepat waktu tentang kerusakan. Para penulis mengklaim bahwa sistem dapat memprediksi interval waktu selama kerusakan akan terjadi.
Keakuratan diagnostik tersebut, menurut hasil pengujian,
adalah 98%. Sayangnya, kumpulan data di mana jaringan saraf dilatih tidak diungkapkan dalam 3 sinyal. Solusi perusahaan juga cocok untuk memantau instalasi industri besar. Misalnya, sudah
digunakan di Enel Green Power Corporation untuk mengevaluasi kondisi turbin energi.
Bacaan tambahan dari blog kami:
Bitchy Betty: Mengapa Antarmuka Audio Berbicara dengan Suara Wanita
"Machine Sound": synthesizer berdasarkan pada jaringan saraf
Perpustakaan dengan berbagai suara alam
Suara untuk UI: Kompilasi Sumber Daya Bertema
Di mana mendapatkan sampel audio untuk proyek: pilihan sembilan sumber daya tematik
Musik untuk proyek Anda: 12 sumber daya tematik dengan trek Creative Commons
Cara memvisualisasikan suara di web: pilihan materi tematik dan video ceramah