Bagaimana kami belajar memproses scan dengan cepat

Dalam artikel ini saya akan memberi tahu Anda bagaimana kami belajar mengenali cek (atau lebih tepatnya tergelincir), penggaruk seperti apa yang mereka tuju dan efisiensi seperti apa yang kami capai.

Saya akan mulai dengan intro singkat. Kami menghasilkan dengan melakukan promosi untuk produsen dan penjual berbagai barang konsumen. Sebagai aturan, ini adalah sesuatu dari kategori “beli barang - temukan kodenya - kirim ke kami - menangkan hadiah”. Produk utama kami adalah platform yang menghasilkan, menerima, memproses kode-kode ini, membantu berkomunikasi dengan peserta, membayar bonus dan melakukan lebih banyak lagi.

Baru-baru ini, kami mulai melihat semakin sering promosi dari kolega di toko, di mana konfirmasi pembelian bukan kode promosi, seperti pada contoh di atas, tetapi foto cek. Dan sekarang fenomena itu sudah menyebar luas. Tidak diizinkan untuk menjauh.

Pertama-tama, saya mendaftar di semua saham dengan cek yang saya temukan (jujur, tidak semuanya, di suatu tempat di area sepuluh detik saya lelah). Saya kira Anda tidak memiliki cek, dan saya memutuskan untuk menggunakan foto kucing pada latar belakang abstrak alih-alih cek.Bayangkan keterkejutan saya ketika dalam semua tindakan, kecuali satu, kucing saya diterima dan diterima sebelum hadiah undian. Dan di beberapa tempat mereka bahkan mengeluarkan hadiah instan dalam bentuk kode promosi ke perpustakaan online. Sejujurnya, dalam satu tindakan itu kucing juga diterima, tetapi berjanji untuk mengirimnya dalam jumlah sedang dan dalam waktu 8 (!) Jam untuk menyelesaikan masalah partisipasi saya dalam tindakan.

Opsi ini jelas tidak cocok untuk kita. Pertama, tidak baik membiarkan seseorang bermain di foto apa pun. Dia bisa selama platform memungkinkan sekali untuk mengunggah foto dari cek yang sama, sehingga berulang kali meningkatkan peluangnya untuk menang. Ketika salah satu dari aplikasi ini menang, yang asli dari cek tunggal disajikan dan hadiah diambil. Tentu saja, ada kesempatan untuk menang dua kali dan mengkhianati diri sendiri, tetapi kita sudah terbawa oleh ini. Kedua, 8 jam tidak memberikan umpan balik kepada orang-orang terlihat mengejek di dunia di mana pengunjung yang menghabiskan lebih dari 15 detik di suatu situs dianggap ditargetkan. Ketiga, memberi hadiah untuk foto kucing berarti menunjukkan dirinya bukan penyelenggara yang sangat kompeten. Ngomong-ngomong, ini dia.



Kesimpulannya jelas: kita perlu belajar bagaimana mengenali cek. Tugasnya sulit, jadi kami pergi ke profesional - satu perusahaan terkenal. Untungnya, mereka memiliki solusi untuk mengenali cek, yang, sayangnya, tidak dilokalkan di pasar Rusia. Untuk menghormati ini, mereka memberi kami 1000 upaya gratis untuk mengenali cek, janji untuk membantu dengan saran dan berharap mereka beruntung.

Pada saat itu, permintaan dari klien muncul. Tugas kami adalah mengadakan aksi untuk jaringan besar toko ritel. Ke depan, saya akan mengatakan bahwa mereka menerima hingga 1000 pendaftaran per hari. Untuk memenuhi syarat untuk hadiah dalam promosi, Anda harus membeli sesuatu dengan biaya N gosok dari periode waktu tertentu. dan pastikan untuk membayar pembelian Anda dengan kartu VISA. Foto yang diperoleh saat membeli slip harus diunggah ke situs promosi kami. Jika Anda diakui sebagai pemenang, Anda harus menunjukkan slip dan kartu VISA di box office dan mengambil hadiahnya. Satu foto - satu peluang untuk menang. Pemenang dihitung di antara semua peserta yang memuat slip yang benar, sesuai dengan formula khusus. Tugas kita pada tahap ini adalah menerima slip dan mengizinkan / tidak mengizinkan seseorang untuk berpartisipasi dalam gambar. Dalam hal ini, diinginkan untuk memotong trik secara maksimal,yang mungkin mencoba untuk menyelipkan kami satu slip dua kali, slip yang dicetak sebelum dimulainya tindakan dan banyak hal yang lebih menarik termasuk, tetapi tidak terbatas pada foto kucing.

Pengujian berganda atas produk perusahaan besar menunjukkan bahwa ia menentukan jumlah pembelian, jenis kartu, nomor kartu, waktu dan tanggal pencetakan slip. Dan sepertinya ini: kami menduplikasinya (untuk ini, menghitung hash dari parameter yang dikenali dan gambar itu sendiri), kami mengenali jumlah, tanggal, sistem pembayaran dan nomor kartu. Benar, ini dikenali dengan kesalahan ... dan tidak semua.

Biarkan saya mengingatkan Anda bahwa ketika mengeluarkan hadiah, pemenang memeriksa jumlah slip dan kartu, atau lebih tepatnya 4 digit terakhir dari nomor kartu. Data diperiksa dengan registri, yang, menurut hasil undian, secara otomatis dikirim ke toko oleh sistem kami. Artinya, data ini harus benar.

Kami harus membuat kompromi pertama: kami meminta peserta untuk memasukkan jumlah pembelian dan 4 digit terakhir dari nomor kartu dengan tangan. Lebih lanjut, jika apa yang orang masukkan dan apa yang diakui mesin bersamaan, dan sistem pembayaran dan tanggal cetak slip sudah benar, kami mengizinkan peserta untuk menggambar.
Kami pikir ternyata kami hanya mengizinkan 71% dari slip. 29% sisanya adalah gambar yang salah atau berkualitas buruk dan benar, tetapi gambar yang dikenali secara salah dalam rasio perkiraan 50/50.

Bagaimana dengan 14,5% cek yang ditolak karena kesalahan ini? Solusinya datang cukup cepat, mereka mulai mengirimkan aplikasi manual ke pusat kontak yang ramah. Dari minus: mahal dan panjang. Jika 71% dari yang beruntung mendapatkan hasilnya dalam satu menit, maka orang-orang ini harus melaporkan menunggu hingga 8 jam. Diputuskan untuk mencoba menormalkan hasil pengakuan dalam sistem kami.

Kami mengaktifkan analitik: kami memverifikasi data di foto dan hasil pengenalan secara manual. Hasil pengakuan datang sebagai berikut: secara terpisah bidang "tanggal", "jumlah", dll. dan secara terpisah teks lengkap, yaitu, secara umum semua yang ditemukan dalam gambar. Seringkali, data yang tidak terkandung dalam salah satu bidang pertama dapat ditemukan dalam teks lengkap melalui mata. Berdasarkan analisis beberapa ratus slip, kami memutuskan untuk melakukan hal berikut:

1) Kami membedakan cek dari slip: di antara semua slip yang diterima, kami mencari slip dengan jumlah garis maksimum. Untuk dokumen apa pun yang ditolak (karena alasan apa pun), kami mempertimbangkan jumlah baris, jika melebihi jumlah maksimum yang dihitung sebelumnya, kami berkata kepada orang tersebut “Mungkin Anda mencoba mengunduh cek, bukan slip. Ambil foto slip secara terpisah dari cek dan coba lagi. " Dengan demikian, seseorang lebih memahami apa yang salah dengan fotonya.

2) Jika tanggal tidak dikenali: kami mencoba mencari dalam teks lengkap untuk fragmen oleh topeng "XX / XX / XU", di mana X adalah angka apa pun dan Y adalah karakter apa pun. Ketika menemukan fragmen Y, ubah ke 6 (atau 7, tergantung pada tahun verifikasi), pertimbangkan fragmen yang ditemukan sebagai tanggal slip dicetak. Ya, ya, sistem memangkas terutama pada digit terakhir dari tanggal. Memenangkan 2%.

3) Jika jumlahnya tidak dikenali: cari dalam teks lengkap untuk topeng "ZXXXX.XX RU", di mana X adalah angka apa pun dan Z adalah karakter apa pun termasuk spasi atau tidak adanya karakter. Fragmen yang ditemukan dibandingkan dengan apa yang dimasukkan peserta. Jika ada perbedaan, ganti semua 6 dengan 8 karakter dalam fragmen yang ditemukan satu per satu dan bandingkan dengan yang Anda masukkan. Untuk beberapa alasan, mesin sering bingung persis 6 dan 8, dan bukan 8 dan 6, yaitu 6 dan 8. Keuntungannya sekitar 3%.

4) Nomor kartu: cari dalam teks lengkap untuk topeng "** XXXX", di mana X adalah nomor apa pun. Di antara karakter X mungkin ada spasi atau tanda baca, kami membuangnya. Jumlah yang dihasilkan dibandingkan dengan nomor kartu yang dimasukkan secara manual. + 1%.

5) Kartu pembayaran: cari dalam teks lengkap untuk salah satu fragmen: "Kartu: V", "Kartu: V", "Card'V", "VISH". Jika ditemukan, anggap kartu tersebut sebagai kartu VISA. + 3%.

Dengan demikian, kami telah meningkatkan jumlah aplikasi yang diterima dalam satu menit menjadi 80%. Sayangnya, kemungkinan normalisasi praktis sudah habis untuk ini, dan kami beralih untuk meningkatkan efisiensi pengenalan manual (tapi ini adalah cerita lain).

Secara umum, sejauh yang saya tahu, kami telah menjadi kampanye pertama di negara ini dengan pengakuan cek mesin yang nyata. Hasil untuk pertama kalinya bagi saya tampaknya tidak buruk, tetapi pada musim panas mitra kami berjanji untuk secara signifikan meningkatkan kualitas pengakuan dengan secara resmi mengirimkan versi Rusia dari layanannya.

Source: https://habr.com/ru/post/id401391/


All Articles