Pada bagian sebelumnya,
"Pelatihan set dari video - dengan cepat dan efisien", kami berbicara tentang kompleksitas menggunakan jaringan saraf untuk tugas apa pun yang terkait dengan objek langka, tidak biasa, atau hanya kompleks. Pastikan untuk melihat contohnya, mereka sepadan.
Algoritma visi komputer klasik, ternyata, dapat sangat membantu dalam memperoleh set pelatihan yang berkualitas tinggi. Secara alami, pendekatan ini tidak berlaku dalam semua kasus, yang perlu dipahami.
Apa kesulitannya?
Seperti yang ditunjukkan pada bagian
sebelumnya , tata letak set manual yang terperinci adalah proses yang sangat memakan waktu dan, terus terang, bukan pilihan bagi orang waras. Penandaan otomatis, terutama ketika mengenai kontur, terlihat jauh lebih menarik, tetapi bagaimana cara mendapatkan kontur yang menarik dengan cepat dan akurat?
Fungsi keanggotaan
Mungkin ini layak dimulai dengan fungsi keanggotaan. Misalkan objek yang menarik bagi kita ditandai dengan warna cerah, yang, lebih lagi, unik untuk objek dalam konteks adegan tertentu:
Mengingat kekhususan pendekatan (yaitu, kebutuhan adegan seperti itu yang mudah "diurai"), cukup mudah untuk merumuskan aturan untuk memilih contoh untuk mendapatkan perangkat pelatihan: adegan yang memenuhi aturan keunikan warna objek yang diinginkan akan sangat berguna (ingat, dengan semua kasus sulit) Anda harus berurusan dengan jaringan saraf yang telah berhasil dilatih menggunakan set yang dihasilkan).
Sebenarnya, kondisi keunikan adalah minimum yang diperlukan, karena warna dapat dan harus juga dikerjakan:
Jarak warna
Bekerja dengan warna, dalam hal ini, adalah bagian yang sangat penting dari keseluruhan pendekatan. Bahkan, fungsi keanggotaan dapat diimplementasikan sebagai fungsi kedekatan dengan warna yang diberikan dengan nilai ambang batas yang ditetapkan:

Solusi yang ada menggunakan beberapa implementasi
Delta E sebagai standar paling akurat. Misalnya, CIE94 dalam ruang warna LCH (L * C * h):

Ambang yang terlalu besar, untuk jarak warna, cenderung "mematahkan" lintasan, menangkap piksel yang tidak terkait dengan objek yang diinginkan. Terlalu kecil - hanya memilih bagian dari objek yang diinginkan. Dalam hubungan ini, adegan kompleks memerlukan perhatian, misalnya:

Paus dalam foto masih dapat dilihat oleh mata (dengan susah payah, tentu saja), tetapi garis besarnya sudah dibuat secara tidak benar. Seluruh contoh:
Kembalikan sirkuit
Misalkan semuanya baik-baik saja dengan warna, bagaimana cara mendapatkan garis yang diinginkan? Tugasnya tidak sederhana, karena hasilnya cenderung cukup kompleks, dengan rongga, elemen kecil, dll. Manakah dari opsi untuk kontur yang dipulihkan untuk objek tunggal yang benar?
Pencahayaan itu rumit, bayangan, refleks adalah bagian integral dari dunia tiga dimensi, dll. Kami menggunakan contoh yang lebih kompleks:
Algoritma untuk mendapatkan hasil seperti itu adalah sebagai berikut:

- gambar sumber
- pemilihan langkah pemindaian (kinerja kritis)
- pemindaian horizontal
- pemindaian vertikal dan analisis persimpangan untuk mencari "objek" yang terisolasi
- membangun array meta-piksel (untuk mengidentifikasi bentuk dan fitur internal objek) dan pasca pemrosesan (penyaringan, perataan, dll.)
- "Vektorisasi" bentuk objek yang dipulihkan
Analisis titik-temu membuatnya mudah untuk melokalisasi area yang terpisah dan tidak terkait. Dengan menyalakan mode tampilan garis pindai, Anda dapat dengan mudah melihat pendekatan itu sendiri dan efek dari langkah pemindaian pada hasil akhir. Perhatikan trik yang sangat sederhana dengan batas yang secara signifikan meningkatkan kesan yang Anda buat:

Keakuratan sirkuit yang direkonstruksi mudah dievaluasi menggunakan contoh berikut:

Tes akhir
Lebih banyak objek, lebih banyak kontur, akurasi lebih baik, rambut, dan dalam 4K - jika Anda memeriksa implementasi Anda, demikian juga dengan lagu dan tarian.
Sampai lain kali, dan detail lainnya sama-sama menarik.
Hasil lainnya
Ikuti perkembangan proyek
YouTube:
RobotsCanSeeTelegram:
RobotsCanSeeUs