Cómo aprendimos a procesar rápidamente los escaneos de cheques

En este artículo, le contaré cómo aprendimos a reconocer los cheques (o más bien los resbalones), qué tipo de rastrillo pisaron y qué tipo de eficiencia obtuvimos.

Comenzaré con una breve introducción. Ganamos realizando promociones para fabricantes y vendedores de una variedad de bienes de consumo. Como regla, esto es algo de la categoría de "comprar bienes - encontrar el código - enviárnoslo - ganar un premio". Nuestro producto principal es una plataforma que genera, acepta, procesa estos códigos, ayuda a comunicarse con los participantes, paga bonos y hace mucho más.

Recientemente, comenzamos a ver cada vez más promociones de colegas en la tienda, donde la confirmación de compra no era un código promocional, como en el ejemplo anterior, sino una foto de un cheque. Y ahora el fenómeno se ha generalizado. No estaba permitido mantenerse alejado.

En primer lugar, me registré en todas las acciones con cheques que descubrí (bueno, para ser honesto, no del todo, en algún lugar en el área de los segundos diez me cansé). Supongo que no tenía ningún cheque, y decidí usar la foto de un gato en un fondo abstracto en lugar de un cheque. Imagine mi sorpresa cuando en todas las acciones, excepto una, mi gato fue aceptado y admitido antes del sorteo. Y en algunos lugares incluso emitieron un premio instantáneo en forma de un código promocional para la biblioteca en línea. Honestamente, en esa única acción, el gato también fue aceptado, pero prometió enviarlo con moderación y dentro de las 8 (!) Horas para resolver el problema de mi participación en la acción.

Esta opción obviamente no nos convenía. En primer lugar, no es bueno permitir que una persona juegue en ninguna foto. Siempre que la plataforma lo permita, una vez que pueda subir una foto del mismo cheque, aumentará repetidamente sus posibilidades de obtener una victoria. Cuando una de estas solicitudes gana, se presenta el original de ese cheque único y se toma el premio. Por supuesto, existe la posibilidad de ganar dos veces y traicionarse a sí mismo, pero ya nos dejamos llevar por esto. En segundo lugar, 8 horas de no dar retroalimentación a las personas parece burlón en un mundo donde un visitante que ha pasado más de 15 segundos en un sitio se considera objetivo. En tercer lugar, dar un premio por una foto de un gato significa no mostrarse como un organizador muy competente. Por cierto, aquí está.



La conclusión era obvia: necesitamos aprender a reconocer cheques. La tarea es difícil, por lo que acudimos a los profesionales, una empresa conocida. Afortunadamente, tenían una solución para reconocer cheques que, desafortunadamente, no estaba localizada en el mercado ruso. En honor a esto, nos dieron 1000 intentos gratuitos para reconocer el cheque, una promesa de ayudar con consejos y les deseamos buena suerte.

En ese momento, apareció una solicitud del cliente. Nuestra tarea consistía en llevar a cabo una acción para una gran red de tiendas minoristas. Mirando hacia el futuro, diré que aceptaron hasta 1000 registros por día. Para calificar para los premios en promociones, tenía que comprar algo a un costo de N rub desde un cierto período de tiempo. y asegúrese de pagar su compra con una tarjeta VISA. La foto obtenida al comprar un recibo debe cargarse en nuestro sitio promocional. Si fue reconocido como un ganador, tenía que presentar un recibo y una tarjeta VISA en la taquilla y recoger el premio. Una foto: una oportunidad de ganar. El ganador se calcula entre todos los participantes que cargaron los resbalones correctos, de acuerdo con una fórmula especial. Nuestra tarea en esta etapa es aceptar el recibo y permitir / no permitir que una persona participe en el sorteo. Al mismo tiempo, es deseable cortar los trucos máximos que pueden tratar de deslizarnos un resbalón dos veces, deslizar el resbalón impreso antes del inicio de la acción y muchas cosas más interesantes, incluidas, entre otras, la foto del gato.

Múltiples pruebas de un producto de una gran empresa mostraron que determina el monto de la compra, el tipo de tarjeta, el número de tarjeta, la hora y la fecha de la impresión del recibo. Y parece así: lo duplicamos (para esto, calculando los valores hash de los parámetros reconocidos y la imagen en sí), reconocemos la cantidad, la fecha, el sistema de pago y el número de tarjeta. Es cierto, se reconoce con errores ... y no todos.

Permítame recordarle que al emitir un premio, el ganador verificó el monto del boleto y la tarjeta, o más bien los últimos 4 dígitos del número de tarjeta. Los datos se verificaron con el registro que, de acuerdo con los resultados del sorteo, nuestro sistema envió automáticamente a la tienda. Es decir, estos datos simplemente deben ser correctos.

Tuvimos que hacer el primer compromiso: le pedimos al participante que ingrese el monto de la compra y los últimos 4 dígitos del número de la tarjeta a mano. Además, si lo que ingresó la persona y lo que reconoció la máquina coincidió, y el sistema de pago y la fecha de impresión de recibo son correctos, permitimos que el participante dibuje.
Pensamos que resultó que solo permitimos el 71% de los resbalones. El 29% restante son imágenes incorrectas o de baja calidad y correctas, pero imágenes incorrectamente reconocidas en una proporción aproximada de 50/50.

¿Qué pasa con este 14.5% de los cheques rechazados por error? La solución llegó bastante rápido, comenzaron a enviar una aplicación manual a un centro de contacto amigable. De los inconvenientes: caros y largos. Si el 71% de los afortunados obtuvieron el resultado en un minuto, entonces estas personas tuvieron que reportar esperar hasta 8 horas. Se decidió tratar de normalizar los resultados de reconocimiento en nuestro sistema.

Activamos el análisis: verificamos manualmente los datos en la foto y el resultado del reconocimiento. El resultado del reconocimiento llega de la siguiente manera: por separado, los campos "fecha", "cantidad", etc. y por separado el texto completo, es decir, en general todo lo que se encontró en la imagen. A menudo, los datos que no figuran en uno de los primeros campos se pueden encontrar en el texto completo a través de los ojos. Con base en el análisis de varios cientos de resbalones, decidimos hacer lo siguiente:

1) Distinguimos el cheque del recibo: entre todos los recibos aceptados, buscamos un recibo con el número máximo de líneas. Para cualquier documento rechazado (por cualquier motivo), consideramos el número de líneas, si excede el máximo calculado previamente, le decimos a la persona “Quizás esté intentando descargar un cheque, no un resbalón. Tome una foto del recibo por separado del cheque e intente nuevamente ". Por lo tanto, una persona entendió mejor lo que estaba mal con su foto.

2) Si no se reconoce la fecha: tratamos de buscar en el texto completo el fragmento con la máscara "XX / XX / XU", donde X es cualquier número e Y es cualquier carácter. Cuando encuentre el fragmento Y, cámbielo a 6 (o 7, dependiendo del año de verificación), considere que el fragmento encontrado es la fecha en que se imprimió el recibo. Sí, sí, el sistema cortó principalmente el último dígito de la fecha. Ganó 2%.

3) Si no se reconoce la cantidad: busque en el texto completo la máscara "ZXXXX.XX RU", donde X es cualquier número y Z es cualquier carácter, incluido un espacio o la ausencia de un carácter. El fragmento encontrado se compara con lo que ingresó el participante. Si hay una discrepancia, reemplace los 6 por 8 caracteres en el fragmento encontrado uno por uno y compárelos con lo que ingresó. Por alguna razón, la máquina a menudo confundía exactamente 6 y 8, y no 8 y 6, es decir, 6 y 8. La ganancia es aproximadamente del 3%.

4) Número de tarjeta: busque en el texto completo la máscara "** XXXX", donde X es cualquier número. Entre los caracteres X puede haber espacios o signos de puntuación, los descartamos. El número resultante se compara con el número de tarjeta ingresado manualmente. + 1%.

5) Tarjeta de pago: busque en el texto completo uno de los fragmentos: “Tarjeta: V”, “Tarjeta: V”, “Tarjeta'V”, “VISH”. Si se encuentra, considere la tarjeta como una tarjeta VISA. + 3%.

Por lo tanto, hemos aumentado el número de solicitudes aceptadas en un minuto al 80%. Por desgracia, las posibilidades de normalización prácticamente se agotaron en esto, y cambiamos a aumentar la eficiencia del reconocimiento manual (pero esta es otra historia).

En general, hasta donde yo sé, hemos resultado ser la primera campaña en el país con reconocimiento real de cheques por máquina. El resultado por primera vez no me parece malo, pero para el verano nuestro socio prometió mejorar significativamente la calidad del reconocimiento al presentar oficialmente la versión rusa de su servicio.

Source: https://habr.com/ru/post/es401391/


All Articles