Dans cet article, je vais vous expliquer comment nous avons appris à reconnaître les chèques (ou plutôt les bordereaux), sur quel type de râteau ils ont marché et quel type d'efficacité nous avons atteint.
Je vais commencer par une brève introduction. Nous gagnons en réalisant des promotions pour les fabricants et les vendeurs d'une variété de biens de consommation. En règle générale, il s'agit de la catégorie «acheter des marchandises - trouver le code - nous l'envoyer - gagner un prix». Notre produit principal est une plate-forme qui génère, accepte, traite ces codes, aide à communiquer avec les participants, paie des bonus et fait bien plus encore.
Récemment, nous avons vu de plus en plus de promotions de collègues de la boutique, où la confirmation d'achat n'était pas un code promotionnel, comme dans l'exemple ci-dessus, mais une photo d'un chèque. Et maintenant, le phénomène s'est généralisé. Il n'était pas permis de rester à l'écart.
Tout d'abord, je me suis inscrit dans toutes les actions avec des chèques que j'ai découvert (enfin, pour être honnête, pas du tout, quelque part dans la zone du deuxième dix, je me suis fatigué). Je suppose que vous n'aviez aucun chèque, et j'ai décidé d'utiliser une photo de chat sur un fond abstrait au lieu d'un chèque.
Imaginez ma surprise quand dans toutes les actions, sauf une, mon chat a été accepté et admis avant le tirage au sort. Et dans certains endroits, ils ont même remis un prix instantané sous la forme d'un code promotionnel à la bibliothèque en ligne. Honnêtement, dans cette action, le chat a également été accepté, mais a promis de l'envoyer pour modération et dans les 8 (!) Heures pour résoudre le problème de ma participation à l'action.
Cette option ne nous convenait évidemment pas. Premièrement, il n'est pas bon de permettre à une personne de jouer sur n'importe quelle photo. Il peut tant que la plate-forme permet une fois de télécharger une photo du même chèque, augmentant ainsi à plusieurs reprises ses chances de gagner. Lorsqu'une de ces candidatures est gagnante, l'original de ce chèque unique est présenté et le prix est prélevé. Bien sûr, il y a une chance de gagner deux fois et de se trahir, mais nous sommes déjà emportés par cela. Deuxièmement, huit heures sans donner de feedback aux gens semblent moqueuses dans un monde où un visiteur qui a passé plus de 15 secondes sur un site est considéré comme ciblé. Troisièmement, donner un prix pour une photo de chat, c'est se montrer un organisateur peu compétent. Au fait, le voici.

La conclusion était évidente: nous devons apprendre à reconnaître les chèques. La tâche est difficile, nous sommes donc allés vers les professionnels - une entreprise bien connue. Heureusement, ils avaient une solution pour reconnaître les chèques, qui malheureusement n'était pas localisée sur le marché russe. En l'honneur de cela, ils nous ont donné 1000 tentatives gratuites pour reconnaître le chèque, une promesse d'aider avec des conseils et leur ont souhaité bonne chance.
À ce moment-là, une demande du client est apparue. Notre tâche était de mener une action pour un large réseau de magasins de détail. Pour l'avenir, je dirai qu'ils ont accepté jusqu'à 1 000 inscriptions par jour. Pour pouvoir prétendre à des prix en promotion, vous deviez acheter quelque chose au prix de N rub à partir d'une certaine période. et assurez-vous de payer votre achat avec une carte VISA. La photo obtenue lors de l'achat d'un coupon doit être téléchargée sur notre site promotionnel. Si vous étiez reconnu comme gagnant, vous deviez présenter un bordereau et une carte VISA à la billetterie et récupérer le prix. Une photo - une chance de gagner. Le gagnant est calculé parmi tous les participants qui ont chargé les bons bons, selon une formule spéciale. Notre tâche à ce stade est d'accepter le bordereau et de permettre / interdire à une personne de participer au dessin. Dans le même temps, il est souhaitable de couper au maximum les astuces qui peuvent essayer de nous glisser un slip deux fois, de glisser le slip imprimé avant le début de l'action et bien d'autres choses intéressantes, y compris, mais sans s'y limiter, la photo du chat.
De multiples tests sur un produit d'une grande entreprise ont montré qu'il détermine le montant de l'achat, le type de carte, le numéro de carte, l'heure et la date de l'impression du bordereau. Et cela ressemble à ceci: nous le dupliquons (pour cela, calculons les hachages des paramètres reconnus et l'image elle-même), nous reconnaissons le montant, la date, le système de paiement et le numéro de carte. Certes, il est reconnu avec des erreurs ... et pas tous.
Permettez-moi de vous rappeler que lors de l'émission d'un prix, le gagnant a vérifié le montant du coupon et la carte, ou plutôt les 4 derniers chiffres du numéro de carte. Les données ont été vérifiées avec le registre qui, selon les résultats du tirage, a été automatiquement envoyé au magasin par notre système. Autrement dit, ces données doivent simplement être correctes.
Nous avons dû faire le premier compromis: nous demandons au participant de saisir manuellement le montant de l'achat et les 4 derniers chiffres du numéro de carte. De plus, si ce que la personne a entré et ce que la machine a reconnu coïncident, et que le système de paiement et la date d'impression du bon sont corrects, nous permettons au participant de dessiner.
Nous avons pensé que nous n'autorisons que 71% des feuillets. Les 29% restants sont des images incorrectes ou de mauvaise qualité et des images correctes mais mal reconnues dans un rapport approximatif de 50/50.
Qu'en est-il de ces 14,5% de chèques rejetés par erreur? La solution est venue assez rapidement, ils ont commencé à envoyer une application manuelle à un centre de contact convivial. Des inconvénients: cher et long. Si 71% des chanceux ont obtenu le résultat en une minute, ces personnes ont dû déclarer attendre jusqu'à 8 heures. Il a été décidé d'essayer de normaliser les résultats de reconnaissance dans notre système.
Nous activons l'analyse: nous vérifions manuellement les données de la photo et le résultat de la reconnaissance. Le résultat de la reconnaissance arrive comme suit: séparément les champs «date», «montant», etc. et séparément le texte intégral, c'est-à-dire en général tout ce qui a été trouvé dans l'image. Souvent, les données non contenues dans l'un des premiers champs pouvaient être trouvées dans le texte intégral à travers les yeux. Sur la base de l'analyse de plusieurs centaines de feuillets, nous avons décidé de procéder comme suit:
1) On distingue le chèque du bordereau: parmi tous les bordereaux acceptés, nous recherchons un bordereau avec le nombre maximum de lignes. Pour tout document rejeté (pour une raison quelconque), nous considérons le nombre de lignes, s'il dépasse le maximum calculé précédemment, nous disons à la personne «Peut-être que vous essayez de télécharger un chèque, pas un bordereau. Prenez une photo du bordereau séparément du chèque et réessayez. " Ainsi, une personne a mieux compris ce qui n'allait pas avec sa photo.
2) Si la date n'est pas reconnue: nous essayons de rechercher dans le texte complet le fragment par le masque «XX / XX / XU», où X est n'importe quel nombre et Y est n'importe quel caractère. Lorsque vous trouvez le fragment Y, changez-le en 6 (ou 7, selon l'année de vérification), considérez le fragment trouvé comme la date à laquelle le feuillet a été imprimé. Oui, oui, le système a tondu principalement sur le dernier chiffre de la date. A gagné 2%.
3) Si le montant n'est pas reconnu: recherchez dans le texte intégral le masque "ZXXXX.XX RU", où X est n'importe quel nombre et Z est n'importe quel caractère, y compris un espace ou l'absence de caractère. Le fragment trouvé est comparé à ce que le participant a entré. En cas de divergence, remplacez les 6 par 8 caractères dans le fragment trouvé un par un et comparez avec ce que vous avez entré. Pour une raison quelconque, la machine a souvent confondu exactement 6 et 8, et non 8 et 6, à savoir 6 et 8. Le gain est d'environ 3%.
4) Numéro de carte: recherchez dans le texte intégral le masque «** XXXX», où X est un nombre quelconque. Entre les caractères X, il peut y avoir des espaces ou des signes de ponctuation, nous les supprimons. Le numéro obtenu est comparé au numéro de carte saisi manuellement. + 1%.
5) Carte de paiement: recherchez dans le texte intégral l'un des fragments: «Carte: V», «Carte: V», «Card'V», «VISH». Si elle est localisée, considérez la carte comme une carte VISA. + 3%.
Ainsi, nous avons augmenté le nombre de demandes acceptées en une minute à 80%. Hélas, les possibilités de normalisation étaient pratiquement épuisées à ce sujet, et nous sommes passés à l'augmentation de l'efficacité de la reconnaissance manuelle (mais c'est une autre histoire).
D'une manière générale, nous avons, pour autant que je sache, été la première campagne du pays à reconnaître réellement les chèques à la machine. Le résultat pour la première fois ne me semble pas mauvais, mais d'ici l'été, notre partenaire a promis d'améliorer considérablement la qualité de la reconnaissance en soumettant officiellement la version russe de son service.