ABBYY Mobile Web Capture: fotos de alta calidad de documentos directamente en el navegador de su teléfono inteligente

imagen

Nuestros clientes a menudo usan un teléfono móvil para fotografiar un documento y enviarlo a una compañía de autos compartidos, centro de visas, operador de telecomunicaciones, compañías financieras y otras. Una foto del documento es suficiente para alquilar un automóvil, activar una tarjeta SIM y solicitar un préstamo. Pero a veces obtener una imagen de buena calidad desde un teléfono inteligente puede ser difícil. Sin embargo, logramos resolver este problema.

Ahora hay muchas aplicaciones en iOS y Android para "escaneo móvil" de documentos. Pero, ¿cuántas aplicaciones móviles tienes en tu teléfono? ¿Por qué perder el tiempo e instalar más nuevos si no puede hacer esto?

Es mucho más fácil fotografiar un documento directamente en un navegador móvil, que ya está en cualquier teléfono inteligente. Es por eso que creamos ABBYY Mobile Web Capture . Esta es la API de JavaScript, es decir, el SDK que ofrecemos a nuestros clientes para incorporar en sus páginas web y aplicaciones basadas en la web. Le permite capturar una buena imagen directamente en un navegador web en el sistema operativo móvil más popular y enviarla para su posterior procesamiento a un servidor o en la nube. Hoy hablaremos sobre cómo funciona esta tecnología.

ABBYY Mobile Web Capture ofrece tomar una foto del documento deseado en una transmisión de video desde un navegador móvil. Cuenta, licencia de conducir, pasaporte, contrato, formulario de solicitud, solicitud: se pueden procesar todos los documentos.

El nuevo producto utiliza nuestra tecnología móvil para la captura automática de imágenes Captura de imagen, que se transfirió a JavaScript. El núcleo del algoritmo está escrito en C ++, por lo que utilizamos la tecnología WebAssembly para transferirlo a un navegador web. Además, creamos componentes de interfaz de usuario responsables de trabajar con la cámara. Se agregaron a la API JS para que los desarrolladores puedan incrustar de manera simple y conveniente la captura de la transmisión de video en su aplicación web o sitio web. Para simplificar la integración, agregamos el código fuente del código de la página web de muestra al paquete de distribución del producto y mostramos cómo usar nuestra API correctamente. De hecho, el desarrollador solo necesita copiar este código en su sitio web y eso es todo, no más complicado que, por ejemplo, insertar una métrica para el análisis del tráfico.

Después de eso, directamente en el navegador, puede encender la videocámara y apuntarla al documento. Y luego ABBYY Mobile Web Capture actúa:

1. Cuando un documento entra en el marco, encontramos sus límites en la secuencia de video.

2. A continuación, capturará automáticamente una imagen clara del documento. Para hacer esto, debe asegurarse de que la persona haya dejado de mover la cámara y que ya haya "apuntado" al documento deseado. No confiamos en los sensores del teléfono, porque siempre existe la posibilidad de que una persona mantenga el teléfono inmóvil, pero la otra parte con el documento se mueve. Para evitar esto, evaluamos si la imagen se está moviendo, es decir considere el desplazamiento entre los objetos de cuadro a cuadro. Si es mínimo, puede comenzar a capturar. Además, nos fijamos en la nitidez. Por lo tanto, el SDK capta automáticamente el momento en que necesita tomar una foto del documento para obtener una imagen de alta calidad. No tiene que presionar ningún botón:


3. Después de capturar el marco con el documento, córtelo a los bordes y alinee:



ABBYY Mobile Web Capture proporciona una buena imagen, que luego se puede enviar para su reconocimiento, por ejemplo, en ABBYY FlexiCapture , y definitivamente se procesará. En el ejemplo de nuestros proyectos con ABBYY FlexiCapture, vemos que a menudo es más conveniente para los clientes ingresar documentos a través de un teléfono inteligente en lugar de un escáner. Pero las imágenes obtenidas de esta manera a menudo resultan borrosas, entonces simplemente no pueden procesarse con alta calidad. Luego se le pide a la persona que envió la foto desde el teléfono que "tome una foto". Pero no siempre es conveniente para el cliente hacer esto.

Cuando desarrollamos ABBYY Mobile Web Capture, nos dimos cuenta de que fotografiar un documento en un navegador en una transmisión de video no es tan simple. En primer lugar, la búsqueda de límites de documentos, la estimación del desplazamiento y la nitidez del marco requieren recursos computacionales: fue necesario optimizar para que la transmisión de video en el navegador no se ralentice. En segundo lugar, en iOS, nos enfrentamos con el hecho de que en Safari era imposible obtener video con una resolución superior a HD. Las imágenes que capturamos en iOS, incluso en iPhones XS geniales, no eran muy buenas. Simplemente no se pudieron reconocer, porque para reconocer un documento A4 escrito en la décima fuente, se necesita una imagen Full HD y superior. Escribimos informes de errores a Apple y le pedimos que hiciera posible trabajar con la cámara en alta resolución desde Safari. ¡Y lo arreglaron en iOS 12.2! Sin esto, nuestro producto no funcionaría como está ahora. Y ahora, el SDK le ofrece buenas imágenes, y luego puede hacer lo que quiera con ellas.

Por supuesto, cuando hicimos el SDK, evaluamos qué tareas tenían que resolver los usuarios finales. Cuéntanos un poco sobre ellos.

Debe abrir una cuenta por primera vez o solicitar un préstamo de un banco, solicitar un seguro, alquilar un automóvil u otro servicio


Imagina que vienes al banco. Aunque no, si vienes, entonces todo ya está mal. Mucha gente odia ir al banco. Piensas así: "Eh, ahora al menos media hora ahora". Por lo tanto, si necesita obtener algún tipo de préstamo en efectivo lo más rápido posible, lo más probable es que tome un teléfono y googlee las opciones disponibles. Supongamos que encuentra información sobre un préstamo y el sitio ofrece completar una solicitud en línea. Es conveniente organizarlo solo en el sitio, y no en la aplicación; debe instalar la aplicación, pero aún no sabe si le otorgarán un préstamo o no. ¿Por qué obstruir previamente el teléfono con aplicaciones innecesarias? Entonces, presiona el botón y luego debe completar sus datos personales.

Solía ​​ser así: el banco pide llevar el documento a la cámara o subir la foto terminada desde la galería. La gente hace esto, pero las imágenes pueden estar borrosas o sin ningún documento; de acuerdo con la experiencia de nuestros proyectos, las personas a menudo confunden y cargan el archivo incorrecto. Todo esto se envía al banco, pero la imagen no cabe y todo se va por el desagüe.

Algunos bancos intentan solucionar el problema de esta manera: ponen el reconocimiento "instantáneo" en la parte posterior. Pero aquí hay otra historia: el cliente fotografió el documento y lo envió a la oficina administrativa para su reconocimiento. Toma alrededor de un minuto. Pero cuando distingue un servicio desde un teléfono móvil, un minuto es mucho tiempo. Durante este tiempo, lo más probable es que decida que todo se ha atascado, cierre la página y llame al soporte técnico o deje todo y vaya a otro sitio para solicitar un préstamo.

Con ABBYY Mobile Web Capture, el cliente no necesita instalar nada. Filma un documento en una secuencia de video. La tecnología procesa la foto y mejora la imagen, que ahora se puede enviar fácilmente al banco.

Debe procesar una foto desde su teléfono para enviarla a una agencia gubernamental, centro de visas, banco


¿Tienes pasaporte? Sucede que no hay ningún documento disponible, pero lo fotografió y la imagen se almacena en la galería de su teléfono inteligente. Siempre es útil si necesita registrarse en algún lugar o comprar boletos en el sitio web de la aerolínea. A veces se le puede pedir que envíe una fotografía de un cambio de sentido de su pasaporte. ¿Qué pasa si la foto no es muy clara o tomada contra una alfombra? ¿Entenderán esto en el centro de visas? Probablemente, pero es mejor no arriesgarse.

Puede cargar esta foto en su sitio utilizando ABBYY Mobile Web Capture, y la tecnología encontrará los bordes del documento en la imagen. Si no hay límites, emitiremos una advertencia y llamaremos la atención del cliente sobre el hecho de que probablemente descargó algo incorrecto. Además, intentaremos evaluar la calidad del documento para comprender si es adecuado para un mayor reconocimiento. ("Lo intentaremos" porque esta función ahora está en modo de vista previa de tecnología, pero estamos trabajando activamente para mejorarla).

Necesita completar una tarjeta en CRM sin tormentos innecesarios


Aquí hay un ejemplo: tenemos un cliente potencial: un concesionario de automóviles, y él necesita saber todo acerca de las personas a las que vende automóviles. Para hacer esto, los empleados ingresan los datos del cliente en un portal web, como un sistema CRM. Piden al cliente los derechos, los escanean y luego vuelven a escribir los datos en la computadora. ¿Por qué los empleados usan el portal web y no la aplicación móvil? Muy simple: la tarea principal del concesionario es vender automóviles y atender a los clientes, en lugar de escribir mucho código para una aplicación interna. Por lo tanto, es importante que la empresa cree rápidamente una solución que funcione en todas las plataformas.

Con ABBYY Mobile Web Capture, este proceso de negocio se puede simplificar: un empleado solo necesita tomar una foto de un documento en un teléfono inteligente y luego enviar la imagen para su reconocimiento y procesamiento utilizando nuestro otro producto: ABBYY FlexiCapture. Entonces, al final, ahorraremos tiempo y aumentaremos la calidad de los datos.

Para ser honesto, me he encontrado con varias situaciones en las que sería muy útil para mí escanear documentos directamente en el navegador. Por ejemplo, cuando solicité una visa hace un año, pasé aproximadamente una hora para tomar todos los documentos necesarios, transferirlos a una computadora, guardarlos en el formato deseado y subirlos al sitio. Y así, en 15 minutos, todo podría ser fotografiado.

¡Realmente espero que pronto ABBYY Mobile Web Capture se use en muchos sitios y ayude a simplificar las tareas que requieren fotografiar documentos!

Olga Titova, propietaria del producto Mobile SDK

Source: https://habr.com/ru/post/466019/


All Articles