Mobil Google akan mengenali pejalan kaki dengan akurasi tinggi



Sebelum munculnya kendaraan tanpa awak yang dijual, tidak ada banyak waktu yang tersisa. Google mengingatkan teknologi visi alat berat dan salah satu elemen terpenting - pengakuan pejalan kaki secara langsung.

Peneliti Google Research, Alex Krizhevsky, Anelia Angelova dan rekannya mempresentasikan metode baru untuk mendeteksi pejalan kaki menggunakan jaringan saraf . Metode ini menunjukkan hasil yang menggembirakan: pejalan kaki dapat dideteksi dengan akurasi tinggi di 73,8% kasus dengan uji Caltech Pedestrian, yang berisi database 50.000 pejalan kaki yang ditandai dalam kondisi perkotaan dan pedesaan. Hasil ini sebanding dengan desain alternatif terbaik.

Para ahli mengatakan bahwa salah satu bidang yang menjanjikan dalam beberapa tahun terakhir adalah penggunaan akselerator GPU di jaringan saraf untuk mengeksekusi algoritma kompleks hampir real-time untuk pengenalan pola, NLP dan analisis lancar dari aliran video.

Pada Konferensi Teknologi GPU Nvidia, beberapa solusi diperkenalkan . Kemajuan teknologi di bidang ini paling baik terlihat dalam uji Tantangan Pengenalan Visual Skala Besar ImageNet , yang telah diadakan sejak 2010. Sejak itu, tingkat kesalahan dalam klasifikasi gambar oleh algoritma visi mesin telah menurun secara dramatis.



Pengakuan pejalan kaki adalah salah satu tugas praktis di mana teknologi baru digunakan. Di masa depan, jaringan saraf dengan akselerasi GPU kemungkinan akan digunakan dalam kamera pengintai, sistem kontrol lalu lintas kendaraan, dll.

Kembali ke pengembangan Google, pengakuan pejalan kaki adalah tugas yang sangat sulit, karena harus diselesaikan dalam kondisi lingkungan yang terus berubah dalam waktu yang hampir bersamaan. Benda-benda di sekitar mobil bergerak. Teknologi yang ada relatif berhasil menyelesaikan masalah ini. Misalnya, salah satu metode menunjukkan akurasi 58% dalam tes Caltech Pedestrian. Metode lain yang disebut VeryFast menyediakan perekaman video pada 100 frame / s (untuk perbandingan, Google menembak pada 15 frame / s), tetapi akurasinya lebih rendah di sana. Ada metode dengan akurasi yang lebih tinggi, tetapi mereka bekerja jauh lebih lambat, mengurangi kecepatan hingga 195 kali.

Google Research telah menetapkan tujuan untuk meningkatkan akurasi pengenalan tanpa mengorbankan kecepatan. Pada 15 frame / s, mereka menunjukkan peningkatan dramatis dalam akurasi hingga 73,8% .

Ungkapan “26,2% rata-rata kehilangan rata-rata” dari sebuah makalah ilmiah tidak boleh menyesatkan: kita tidak berbicara tentang fakta bahwa mobil itu melewatkan pejalan kaki dan tidak mendapatkan poin seperti di Carmageddon. Sebaliknya, frasa ini berarti bahwa algoritma ini “tidak terjawab” dan tidak mengenali orang yang mengerem di depannya.

Di Google Research, sistem visi mesin diluncurkan pada akselerator grafis Nvidia K20 GPU generasi tua. Sekarang merilis versi baru K40 dan K80, yang digunakan di beberapa superkomputer dari peringkat Top500.

Tim Google Research bermaksud untuk meningkatkan hasilnya dengan meningkatkan kedalaman kaskade jaringan saraf dan mengoptimalkan rasio kinerja dan akurasi.

Salah satu cara atau yang lain, tetapi dengan munculnya mobil robot di jalanan, lebih baik berpakaian lebih terang daripada kamuflase sehingga visi mesin mobil tidak membingungkan Anda dengan latar belakang. Di sisi lain, saran seperti itu dapat diberikan bahkan sekarang, ketika mobil sering dikendarai oleh pengemudi setengah buta, setengah mabuk dan terganggu.

Source: https://habr.com/ru/post/id382879/


All Articles