
Nossos clientes costumam usar um telefone celular para fotografar um documento e enviá-lo a uma empresa de compartilhamento de carros, central de vistos, operadora de telecomunicações, financeira e outras. Uma foto do documento é suficiente para alugar um carro, ativar um cartão SIM, solicitar um empréstimo. Às vezes, porém, é difícil obter uma imagem de boa qualidade em um smartphone. No entanto, conseguimos resolver esse problema.
Agora, existem muitos aplicativos no iOS e Android para "digitalização móvel" de documentos. Mas quantos aplicativos móveis você possui no telefone? Por que perder tempo e instalar mais novos se você não pode fazer isso?
É muito mais fácil fotografar um documento diretamente em um navegador móvel, que já está em qualquer smartphone. Por isso, criamos o
ABBYY Mobile Web Capture . Essa é a API JavaScript, ou seja, o SDK que oferecemos aos nossos clientes para incorporar em suas páginas e aplicativos baseados na Web. Ele permite capturar uma boa imagem diretamente em um navegador da Web no sistema operacional móvel mais popular e enviá-la para processamento adicional em um servidor ou na nuvem. Hoje, falaremos sobre como essa tecnologia funciona.
O ABBYY Mobile Web Capture oferece para tirar uma foto do documento desejado em um fluxo de vídeo a partir de um navegador móvel. Conta, carteira de motorista, passaporte, contrato, formulário de inscrição, inscrição - todos os documentos podem ser processados.
O novo produto usa nossa tecnologia móvel para captura automática de imagens Image Capture, que foi transferida para JavaScript. O núcleo do algoritmo é escrito em C ++, então usamos a tecnologia
WebAssembly para transferi-lo para um navegador da web. Além disso, criamos componentes de interface do usuário responsáveis por trabalhar com a câmera. Eles foram adicionados à API JS para que os desenvolvedores possam incorporar de maneira simples e conveniente a captura do fluxo de vídeo em seu aplicativo ou site baseado na Web. Para tornar a integração muito simples, adicionamos o código fonte do código de exemplo da página da web ao pacote de distribuição do produto e mostramos como usar nossa API corretamente. De fato, o desenvolvedor só precisa copiar esse código em seu site e isso é tudo - não é mais complicado do que, por exemplo, inserir uma métrica para análise de tráfego.
Depois disso, diretamente no navegador, você pode ligar a câmera de vídeo e apontá-la para o documento. E então o ABBYY Mobile Web Capture age:
1. Quando um documento entra no quadro, encontramos seus limites no fluxo de vídeo.
2. Em seguida, você capturará automaticamente uma imagem nítida do documento. Para fazer isso, você precisa ter certeza de que a pessoa parou de mover a câmera e já "apontou" para o documento desejado. Não confiamos nos sensores do telefone, porque sempre existe a possibilidade de uma pessoa segurar o telefone imóvel, mas a outra mão do documento se move. Para evitar isso, avaliamos se a imagem está se movendo, ou seja, considere o deslocamento entre os objetos de quadro para quadro. Se for mínimo, você poderá começar a capturar. Além disso, analisamos a nitidez. Assim, o SDK captura automaticamente o momento em que você precisa tirar uma foto do documento para obter uma imagem de alta qualidade. Você não precisa pressionar nenhum botão:
3. Depois de capturarmos o quadro com o documento, corte-o nas bordas e alinhe:

O ABBYY Mobile Web Capture fornece uma boa imagem, que pode ser enviada para reconhecimento, por exemplo, no
ABBYY FlexiCapture , e definitivamente será processada. No exemplo de nossos projetos com o ABBYY FlexiCapture, vemos que geralmente é mais conveniente para os clientes inserir documentos através de um smartphone em vez de um scanner. Mas as imagens obtidas dessa maneira costumam ficar embaçadas - então elas simplesmente não podem ser processadas com alta qualidade. Em seguida, a pessoa que enviou a foto pelo telefone é solicitada a "tirar uma foto". Mas nem sempre é conveniente para o cliente fazer isso.
Quando desenvolvemos o ABBYY Mobile Web Capture, percebemos que fotografar um documento em um navegador em um fluxo de vídeo não é tão simples. Primeiro, a busca pelos limites do documento, a estimativa do deslocamento e a nitidez do quadro exigem recursos computacionais - tive que otimizar para que o fluxo de vídeo no navegador não diminuísse a velocidade. Em segundo lugar, no iOS, nos deparamos com o fato de que no Safari era impossível obter vídeo com uma resolução maior que o HD. As fotos que capturamos no iOS, mesmo em iPhones XS legais, não eram muito boas. Eles simplesmente não puderam ser reconhecidos, porque para reconhecer um documento A4 digitado na 10a fonte, você precisa de uma imagem em HD total e acima. Escrevemos relatórios de erros para a Apple e pedimos que fosse possível trabalhar com a câmera em alta resolução no Safari. E eles consertaram no iOS 12.2! Sem isso, nosso produto não funcionaria como está agora. E agora - o SDK oferece boas fotos e você pode fazer o que quiser com elas.
Obviamente, quando fizemos o SDK, avaliamos quais tarefas os usuários finais precisavam resolver. Conte um pouco sobre eles.
Você precisa abrir uma conta pela primeira vez ou tomar um empréstimo de um banco, solicitar um seguro, alugar um carro ou outro serviço

Imagine que você vem ao banco. Embora não, se você vier, tudo já está errado. Muitas pessoas odeiam ir ao banco. Você pensa assim: "Ei, agora pelo menos meia hora agora." Portanto, se você precisar obter algum tipo de empréstimo em dinheiro o mais rápido possível, provavelmente precisará de um telefone e do Google que opções estão disponíveis. Suponha que você encontre informações sobre um empréstimo e o site se ofereça para preencher um requerimento on-line. É conveniente organizá-lo apenas no site, e não no aplicativo - você precisa instalar o aplicativo, mas ainda não sabe se eles lhe concederão um empréstimo ou não. Por que pré-entupir o telefone com aplicativos desnecessários? Então, você pressiona o botão e precisa preencher seus dados pessoais.
Costumava ser assim: o banco pede para levar o documento para a câmera ou fazer upload da foto finalizada da galeria. As pessoas fazem isso, mas as fotos podem ficar tremidas ou sem um documento - de acordo com a experiência de nossos projetos, as pessoas geralmente confundem e enviam o arquivo errado. Tudo isso é enviado para o banco, mas a imagem não se encaixa e tudo corre pelo ralo.
Alguns bancos tentam contornar o problema desta maneira: eles colocam o reconhecimento "instantâneo" nas costas. Mas aqui está outra história: o cliente fotografou o documento e o enviou ao back office para reconhecimento. Demora cerca de um minuto. Mas quando você realiza um serviço a partir de um telefone celular, um minuto é muito tempo. Durante esse período, é provável que você decida que tudo ficou bloqueado, feche a página e ligue para o suporte técnico ou largue tudo e vá para outro site para solicitar um empréstimo.
Com o ABBYY Mobile Web Capture, o cliente não precisa instalar nada. Ele grava um documento em um fluxo de vídeo. A tecnologia processa a foto e melhora a imagem, que agora pode ser facilmente enviada ao banco.
Você precisa processar uma foto do seu telefone para enviar para uma agência governamental, centro de vistos, banco

Você tem passaporte? Acontece que não há nenhum documento em mãos, mas você o fotografou e a imagem é armazenada na galeria do seu smartphone. É sempre útil se você precisar se registrar em algum lugar ou comprar passagens no site da companhia aérea. Às vezes, você pode ser solicitado a enviar uma fotografia da inversão de marcha do seu passaporte. E se a foto não for muito clara ou for tirada contra um tapete? Eles entenderão isso no centro de vistos? Provavelmente, mas é melhor não arriscar.
Você pode carregar esta foto no seu site usando o ABBYY Mobile Web Capture, e a tecnologia encontrará as bordas do documento na imagem. Se não houver limites, emitiremos um aviso e chamaremos a atenção do cliente para o fato de que ele provavelmente baixou algo errado. Além disso, tentaremos avaliar a qualidade do documento para entender se ele é adequado para reconhecimento adicional. ("Vamos tentar" porque esse recurso agora está no modo de visualização de tecnologia, mas estamos trabalhando ativamente para aprimorá-lo.)
Necessidade de preencher um cartão no CRM sem tormento desnecessário

Aqui está um exemplo: temos um cliente em potencial - um revendedor de carros e ele precisa saber tudo sobre as pessoas para quem vende carros. Para fazer isso, os funcionários inserem os dados do cliente em um portal da web, como um sistema de CRM. Eles pedem ao cliente os direitos, os digitalizam e, em seguida, redigitam os dados no computador. Por que os funcionários usam o portal da web e não o aplicativo móvel? Muito simples: a principal tarefa do revendedor é vender carros e atender clientes, em vez de escrever muito código para um aplicativo interno. Portanto, é importante que a empresa crie rapidamente uma solução que funcione em todas as plataformas.
Com o ABBYY Mobile Web Capture, esse processo de negócios pode ser simplificado: um funcionário só precisa tirar uma foto de um documento em um smartphone e depois enviar a imagem para reconhecimento e processamento usando nosso outro produto - ABBYY FlexiCapture. Portanto, no final, economizaremos tempo e aumentaremos a qualidade dos dados.
Para ser sincero, eu próprio já deparei com várias situações em que seria muito útil digitalizar documentos diretamente no navegador. Por exemplo, quando solicitei um visto há um ano, gastei cerca de uma hora para gravar todos os documentos necessários, transferi-los para um computador, salvar no formato desejado e fazer o upload para o site. E em 15 minutos tudo poderia ser fotografado.
Eu realmente espero que em breve o ABBYY Mobile Web Capture seja usado em muitos sites e ajude a simplificar as tarefas que exigem fotografia de documentos!
Olga Titova, Dono do produto Mobile SDK