Eye in the Sky: Drone patroli dengan pengakuan kekerasan di kerumunan dan tempat-tempat umum


Ilustrasi di sebelah kiri menunjukkan 14 poin utama pada tubuh manusia yang diakui oleh sistem penglihatan mesin: kepala, leher, bahu, siku, pergelangan tangan, pinggul, lutut, pergelangan kaki. Di kanan atas adalah drone Parrot AR dengan sistem pengenalan kekerasan. Di kanan bawah, masing-masing elemen foto dari set data pelatihan dengan poin utama

Saat ini, UAV semakin banyak digunakan oleh lembaga penegak hukum dan badan intelijen. Biasanya untuk spionase, intelijen, kontrol perbatasan, dll. Polisi tidak terlalu aktif menggunakan pesawat tanpa awak untuk berpatroli di jalan-jalan kota. Namun di sinilah letak potensi besar. Drone patroli secara signifikan dapat menghemat gaji staf. Mereka menutupi area yang luas dan terlihat sempurna dalam gelap.

Sehubungan dengan pertumbuhan kejahatan dan ancaman terorisme di banyak negara, pihak berwenang tertarik untuk memperkuat kontrol atas penduduk sipil. Drone otomatis dengan pengenalan kekerasan secara otomatis adalah sistem generasi baru yang membuka pintu bagi sistem yang lebih otonom dan cerdas untuk merespons kerusuhan jalanan dan hooliganisme.

Sebelumnya, UAV digunakan terutama dalam mode "manual". Jadi mereka berada di bawah kendali seorang operator yang secara bersamaan melacak gambar dari camcorder. Tetapi mode ini sangat membatasi penggunaan drone secara massal , karena setiap UAV membutuhkan operator terpisah.

Sistem visi alat berat menghilangkan batasan ini. Mereka memungkinkan Anda untuk mengirim ratusan dan ribuan drone di sepanjang rute yang ditentukan, dan operator hanya memperhatikan alarm yang dipicu ketika tanda-tanda tertentu dikenali. Sistem semacam itu telah dikembangkan untuk patroli otomatis untuk mendeteksi kebakaran, kerusakan pipa, dll. Pada 2010, sistem dikembangkan untuk lembaga penegak hukum dengan identifikasi "benda terlantar", yaitu, tas dan paket yang ditinggalkan di tempat-tempat umum. Pengakuan otomatis atas kekerasan adalah langkah logis berikutnya, yang memungkinkan Anda menggunakan UAV untuk berpatroli di kerumunan dan tempat-tempat umum.

Pada tahun 2009, sebuah makalah ilmiah diterbitkan menggambarkan sistem visi mesin untuk secara otomatis mengenali kejahatan di tempat umum menggunakan analisis gerak. Dia menentukan dengan akurat sekitar 85% tindakan seperti mengambil dompet dari orang yang lewat, menculik anak, dll.

Sistem seperti ini sangat berhasil dalam mendeteksi berbagai tindak kriminal. Meskipun akurasi yang mengesankan (dalam beberapa kasus akurasi lebih dari 90%) mereka memiliki ruang lingkup yang sangat terbatas.

Pada tahun 2014, para peneliti mengusulkan sistem UAV pertama untuk secara otomatis mengenali kekerasan di tempat-tempat umum, yang pertama dari jenisnya menggunakan model bagian yang cacat untuk mengevaluasi postur seseorang dengan identifikasi lebih lanjut dari orang-orang yang mencurigakan dengan pose mereka. Ini adalah tugas penglihatan mesin yang sangat sulit karena foto dan video drone dapat mengalami perubahan pencahayaan, bayangan, detail rendah, dan blur. Selain itu, orang-orang muncul di tempat bingkai yang berbeda dan di posisi yang berbeda. Sistem ini menentukan kekerasan dengan akurasi sekitar 76%, yang jauh lebih rendah daripada sistem yang sangat terspesialisasi yang dijelaskan di atas.

Perkembangan baru para ilmuwan dari Universitas Cambridge (Inggris Raya), Institut Teknologi Nasional (India) dan Institut Sains India di Bangalore menghadirkan sistem yang ditingkatkan untuk pengenalan otonom real-time kekerasan menggunakan jaringan fitur piramida (FPN), jaringan pembelajaran dalam hibrida ScatterNet (ScatterNet) Hybrid Deep Learning (SHDL) dan menghitung orientasi antara anggota badan dari pose yang dihitung menggunakan mesin vektor dukungan (SVM). Operasi pipa pengakuan ditunjukkan secara rinci dalam ilustrasi.


Konveyor yang memprediksi postur seseorang yang dapat digunakan untuk memprediksi kekerasan di keramaian dan tempat-tempat umum. Kerangka kerja ini pertama-tama mengenali orang-orang dalam bingkai yang diambil oleh kamera drone. Potongan-potongan foto dengan gambar orang-orang datang sebagai masukan ke jaringan SHDL, di mana ScatterNet beroperasi di ujung depan untuk mengekstrak tanda-tanda yang dijelaskan secara manual dari gambar-gambar masukan. Karakteristik yang diekstraksi dari tiga lapisan digabungkan dan diumpankan ke input empat lapisan konvolusional dari jaringan regresi yang berjalan di backend.

Akurasi rata-rata mengenali kekerasan dalam sistem baru adalah 88,8%, termasuk 89% untuk tendangan, 94% untuk tendangan, 82% untuk penembakan, 85% untuk pencekikan, dan 92% untuk penikaman. Ini secara signifikan lebih tinggi dari sistem sebelumnya pada tahun 2014.


Artikel ilmiah ini diterbitkan pada 3 Juni 2018 di situs preprint arXiv.org dan akan dipresentasikan di Lokakarya Visi dan Pola Pengenalan Pola (CVPR) Komputer IEEE 2018 Konferensi IEEE 2018 tentang Visi Komputer dan Pengenalan Pola.

Source: https://habr.com/ru/post/id413753/


All Articles