Dalam proses kegiatan kami, kami setiap hari menghadapi masalah dalam menentukan prioritas pembangunan. Mengingat dinamika perkembangan industri TI yang tinggi, permintaan yang terus meningkat dari pihak bisnis dan negara untuk teknologi baru, setiap kali, menentukan vektor pengembangan dan menginvestasikan sumber daya dan sumber daya kita sendiri dalam potensi ilmiah perusahaan kita, kita memastikan bahwa semua penelitian dan proyek kita adalah fundamental dan interdisipliner.
Oleh karena itu, dengan mengembangkan teknologi utama kami - kerangka kerja pengenalan data HIEROGLYPH, kami peduli untuk meningkatkan kualitas pengenalan dokumen (lini bisnis utama kami) dan kemungkinan penerapan teknologi untuk memecahkan masalah pengakuan terkait. Dalam artikel hari ini, kami akan memberi tahu bagaimana, berdasarkan mesin pengenal kami (dokumen), kami membuat pengakuan objek yang lebih besar, strategis dan penting dalam aliran video.
Pernyataan masalah
Dengan menggunakan pengalaman yang ada, bangun sistem pengenalan tangki yang memungkinkan Anda untuk mengklasifikasikan objek, serta menentukan parameter geometris dasar (orientasi dan jarak) dalam kondisi yang tidak terkontrol tanpa menggunakan peralatan khusus.
Solusi
Sebagai algoritma utama untuk memecahkan masalah, kami memilih pendekatan pembelajaran mesin statistik. Tetapi salah satu masalah utama dari pembelajaran mesin adalah kebutuhan akan jumlah data pembelajaran yang cukup. Jelas, gambar dalam bentuk yang diperoleh dari adegan nyata yang mengandung objek yang kita butuhkan tidak dapat diakses oleh kita. Oleh karena itu, diputuskan untuk menggunakan data yang diperlukan untuk pelatihan, karena kami memiliki banyak pengalaman di tempat ini . Namun, tampaknya tidak wajar untuk sepenuhnya mensintesis data untuk tugas ini, jadi tata letak khusus disiapkan untuk memodelkan adegan nyata. Berbagai objek pemodelan pedesaan dipasang pada tata letak: penutup lanskap karakteristik, semak-semak, pohon, hambatan, dll. Gambar ditangkap menggunakan kamera format kecil digital. Dalam proses pengambilan gambar, latar belakang adegan berubah secara signifikan untuk memastikan stabilitas algoritma yang lebih besar terhadap perubahan di latar belakang.

Empat model tank tempur digunakan sebagai target: T-90 (Rusia), M1A2 Abrams (AS), T-14 (Rusia), Merkava III (Israel). Objek-objek tersebut terletak pada posisi yang berbeda dari poligon, sehingga memperluas daftar sudut pandang objek yang dapat diterima. Peran penting dimainkan oleh hambatan teknik, pohon, semak-semak dan elemen lansekap lainnya.

Dengan demikian, dalam beberapa hari kami telah mengumpulkan satu set yang cukup untuk pelatihan dan evaluasi selanjutnya dari kualitas algoritma (beberapa puluh ribu gambar).
Mereka memutuskan untuk membagi pengakuan secara langsung menjadi dua bagian: pelokalan objek dan klasifikasi objek. Lokalisasi dilakukan dengan menggunakan classifier terlatih Viola dan Jones (setelah semua, tank adalah benda kaku yang normal, tidak lebih buruk dari wajah, oleh karena itu metode "buta dengan detail" Viola dan Jones dengan cepat melokalisasi objek target). Tetapi kami mempercayakan klasifikasi dan definisi sudut dengan jaringan saraf convolutional - dalam tugas ini penting bagi kami bahwa detektor berhasil mengidentifikasi fitur-fitur yang, katakanlah, membedakan T-90 dari Merkava. Akibatnya, dimungkinkan untuk membangun komposisi algoritma yang efektif yang berhasil memecahkan masalah lokalisasi dan klasifikasi objek dari jenis yang sama.

Selanjutnya, kami meluncurkan program yang dihasilkan pada semua platform yang kami miliki (Intel, ARM, Elbrus, Baikal, COMDIV), dioptimalkan algoritma komputasi yang sulit untuk meningkatkan kinerja (kami telah menulis tentang ini dalam artikel kami, misalnya, di sini https: // habr .com / ru / perusahaan / smartengines / blog / 438948 / atau https://habr.com/en/company/smartengines/blog/351134/ ) dan telah mencapai operasi yang stabil dari program pada perangkat secara real time.
Sebagai hasil dari semua tindakan yang dijelaskan, kami telah memperoleh produk perangkat lunak lengkap yang memiliki karakteristik taktis dan teknis yang signifikan.
Pembaca tank cerdas
Jadi, kami mempersembahkan kepada Anda pengembangan baru kami - sebuah program untuk mengenali gambar tangki dalam aliran video Pembaca Tangki Cerdas , yang:

- Ini memecahkan masalah "teman atau musuh" untuk satu set objek tertentu secara real time;
- Menentukan indikator geometris (jarak ke objek, orientasi objek yang disukai);
- Ini bekerja dalam kondisi cuaca yang tidak terkendali, serta dalam kasus tumpang tindih sebagian objek oleh benda asing;
- Operasi sepenuhnya otonom pada perangkat target, termasuk tidak adanya komunikasi radio;
- Daftar arsitektur prosesor yang didukung: Elbrus, Baikal, COMDIV, serta x86, x86_64, ARM;
- Daftar sistem operasi yang didukung: Elbrus OS, AstraLinux OS, Atlix OS, serta MS Windows, macOS, berbagai distribusi Linux yang mendukung gcc 4.8, Android, iOS;
- Pembangunan domestik sepenuhnya.
Biasanya, sebagai kesimpulan dari artikel kami di Habré, kami memberikan tautan ke pasar, di mana setiap orang yang ingin menggunakan ponsel mereka dapat mengunduh versi demo aplikasi untuk benar-benar mengevaluasi kinerja teknologi. Kali ini, dengan mempertimbangkan spesifik dari aplikasi yang dihasilkan, kami berharap semua pembaca kami tidak pernah menghadapi masalah dengan cepat menentukan apakah sebuah tangki milik pihak tertentu.