
Unsere Kunden verwenden häufig ein Mobiltelefon, um ein Dokument zu fotografieren und an eine Carsharing-Firma, ein Visa-Center, einen Telekommunikationsbetreiber, Finanz- und andere Unternehmen zu senden. Ein Foto des Dokuments reicht aus, um ein Auto zu mieten, eine SIM-Karte zu aktivieren und einen Kredit zu beantragen. Manchmal kann es jedoch schwierig sein, ein Bild von guter Qualität von einem Smartphone zu erhalten. Trotzdem ist es uns gelungen, dieses Problem zu lösen.
Jetzt gibt es viele Anwendungen auf iOS und Android zum "mobilen Scannen" von Dokumenten. Aber wie viele mobile Anwendungen haben Sie auf Ihrem Telefon? Warum Zeit verschwenden und neue installieren, wenn Sie dies nicht können?
Es ist viel einfacher, ein Dokument direkt in einem mobilen Browser zu fotografieren, der sich bereits auf einem Smartphone befindet. Aus diesem Grund haben wir
ABBYY Mobile Web Capture erstellt . Dies ist die JavaScript-API, dh das SDK, das wir unseren Kunden anbieten, um sie in ihre Webseiten und webbasierten Anwendungen einzubetten. Sie können ein gutes Bild direkt in einem Webbrowser auf dem beliebtesten mobilen Betriebssystem aufnehmen und zur weiteren Verarbeitung an einen Server oder in die Cloud senden. Heute werden wir darüber sprechen, wie diese Technologie funktioniert.
ABBYY Mobile Web Capture bietet die Möglichkeit, ein Foto des gewünschten Dokuments in einem Videostream über einen mobilen Browser aufzunehmen. Konto, Führerschein, Reisepass, Vertrag, Antragsformular, Antrag - alle Dokumente können verarbeitet werden.
Das neue Produkt verwendet unsere mobile Technologie zur automatischen Erfassung von Bildern. Image Capture wurde auf JavaScript übertragen. Der Kern des Algorithmus ist in C ++ geschrieben, daher haben wir die
WebAssembly- Technologie verwendet, um ihn in einen Webbrowser zu übertragen. Darüber hinaus haben wir UI-Komponenten erstellt, die für die Arbeit mit der Kamera verantwortlich sind. Sie wurden der JS-API hinzugefügt, damit Entwickler die Erfassung aus dem Videostream einfach und bequem in ihre webbasierte Anwendung oder Website einbetten können. Um die Integration sehr einfach zu gestalten, haben wir den Quellcode des Beispiel-Webseitencodes zum Distributionspaket des Produkts hinzugefügt und zeigen, wie unsere API korrekt verwendet wird. Tatsächlich muss der Entwickler diesen Code nur auf seine Website kopieren, und das ist alles - nicht komplizierter als beispielsweise das Einfügen einer Metrik für die Verkehrsanalyse.
Danach können Sie direkt im Browser den Camcorder einschalten und auf das Dokument zeigen. Und dann handelt ABBYY Mobile Web Capture:
1. Wenn ein Dokument in den Frame gelangt, finden wir seine Grenzen im Videostream.
2. Als Nächstes erfassen Sie automatisch ein klares Bild des Dokuments. Dazu müssen Sie sicherstellen, dass die Person die Kamera nicht mehr bewegt und bereits auf das gewünschte Dokument "gerichtet" hat. Wir verlassen uns nicht auf die Sensoren des Telefons, da immer die Möglichkeit besteht, dass eine Person das Telefon bewegungslos hält, sich aber mit dem Dokument bewegt. Um dies zu vermeiden, bewerten wir, ob sich das Bild bewegt, d.h. Betrachten Sie den Versatz zwischen den Objekten von Bild zu Bild. Wenn es minimal ist, können Sie mit der Erfassung beginnen. Zusätzlich betrachten wir die Schärfe. Somit erfasst das SDK automatisch den Moment, in dem Sie ein Bild des Dokuments aufnehmen müssen, um ein qualitativ hochwertiges Bild zu erhalten. Sie müssen keine Tasten drücken:
3. Nachdem wir den Rahmen mit dem Dokument erfasst haben, schneiden Sie ihn an den Rändern aus und richten Sie ihn aus:

ABBYY Mobile Web Capture liefert ein gutes Bild, das dann beispielsweise in
ABBYY FlexiCapture zur Erkennung
gesendet werden kann und auf jeden Fall verarbeitet wird. Am Beispiel unserer Projekte mit ABBYY FlexiCapture sehen wir, dass es für Kunden häufig bequemer ist, Dokumente über ein Smartphone als über einen Scanner einzugeben. Aber die auf diese Weise erhaltenen Bilder erweisen sich oft als verschwommen - dann können sie einfach nicht mit hoher Qualität verarbeitet werden. Dann wird die Person, die das Foto vom Telefon gesendet hat, aufgefordert, "ein Foto zu machen". Dies ist für den Kunden jedoch nicht immer bequem.
Als wir ABBYY Mobile Web Capture entwickelten, stellten wir fest, dass das Fotografieren eines Dokuments in einem Browser in einem Videostream nicht so einfach ist. Erstens erfordern die Suche nach den Grenzen des Dokuments, die Schätzung des Versatzes und der Schärfe des Rahmens Rechenressourcen - es musste optimiert werden, damit der Videostream im Browser nicht langsamer wird. Zweitens waren wir unter iOS mit der Tatsache konfrontiert, dass es in Safari unmöglich war, Videos mit einer höheren Auflösung als HD zu erhalten. Die Bilder, die wir auf iOS aufgenommen haben, waren selbst auf coolen XS-iPhones nicht sehr gut. Sie konnten einfach nicht erkannt werden, da Sie zum Erkennen eines A4-Dokuments in der 10. Schriftart ein Full-HD-Bild und höher benötigen. Wir haben Fehlerberichte an Apple geschrieben und darum gebeten, die Arbeit mit der Kamera in hoher Auflösung von Safari aus zu ermöglichen. Und sie haben es in iOS 12.2 behoben! Ohne dies würde unser Produkt nicht so funktionieren, wie es jetzt ist. Und jetzt - das SDK liefert Ihnen gute Bilder, und dann können Sie mit ihnen machen, was Sie wollen.
Als wir das SDK erstellt haben, haben wir natürlich bewertet, welche Aufgaben Endbenutzer lösen müssen. Erzähl ein wenig über sie.
Sie müssen zum ersten Mal ein Konto eröffnen oder einen Kredit bei einer Bank aufnehmen, eine Versicherung bestellen, ein Auto mieten oder eine andere Dienstleistung erbringen

Stellen Sie sich vor, Sie kommen zur Bank. Obwohl nicht, wenn Sie kommen, dann ist schon alles falsch. Viele Leute hassen es, zur Bank zu gehen. Sie denken so: "Eh, jetzt mindestens eine halbe Stunde." Wenn Sie also so schnell wie möglich einen Geldkredit benötigen, nehmen Sie höchstwahrscheinlich ein Telefon und googeln, welche Optionen verfügbar sind. Angenommen, Sie finden Informationen zu einem Darlehen und die Website bietet an, einen Antrag online auszufüllen. Es ist praktisch, es nur auf der Website und nicht in der Anwendung zu arrangieren. Sie müssen die Anwendung installieren, wissen aber immer noch nicht, ob Sie einen Kredit erhalten oder nicht. Warum das Telefon mit unnötigen Anwendungen vorverstopfen? Sie drücken also die Taste und müssen dann Ihre persönlichen Daten eingeben.
Früher war es so: Die Bank bittet darum, das Dokument zur Kamera zu bringen oder das fertige Foto aus der Galerie hochzuladen. Die Leute tun dies, aber Bilder können verschwommen oder ohne Dokument sein - nach den Erfahrungen unserer Projekte verwirren die Leute oft die falsche Datei und laden sie überhaupt hoch. Dies wird alles an die Bank gesendet, aber das Bild passt nicht und alles geht den Bach runter.
Einige Banken versuchen, das Problem auf diese Weise zu umgehen: Sie setzen „sofortige“ Erkennung auf den Rücken. Aber hier ist eine andere Geschichte: Der Kunde hat das Dokument fotografiert und zur Anerkennung an das Backoffice gesendet. Es dauert ungefähr eine Minute. Wenn Sie jedoch einen Dienst von einem Mobiltelefon aus erkennen, ist eine Minute eine sehr lange Zeit. Während dieser Zeit werden Sie höchstwahrscheinlich entscheiden, dass alles hängen geblieben ist, die Seite schließen und den technischen Support anrufen oder alles löschen und auf eine andere Website gehen, um einen Kredit zu beantragen.
Mit ABBYY Mobile Web Capture muss der Client nichts installieren. Er nimmt ein Dokument in einem Videostream auf. Die Technologie verarbeitet das Foto und verbessert das Bild, das jetzt problemlos an die Bank gesendet werden kann.
Sie müssen ein Foto von Ihrem Telefon verarbeiten, um es an eine Regierungsbehörde, ein Visa-Zentrum oder eine Bank zu senden

Hast du einen pass Es kommt vor, dass kein Dokument zur Hand ist, Sie es jedoch fotografiert haben und das Bild in der Galerie Ihres Smartphones gespeichert ist. Es ist immer nützlich, wenn Sie sich irgendwo registrieren oder Tickets auf der Website der Fluggesellschaft kaufen müssen. Manchmal werden Sie gebeten, ein Foto einer Kehrtwende Ihres Reisepasses zu senden. Was ist, wenn das Foto nicht sehr klar ist oder auf einem Teppich aufgenommen wurde? Werden sie das im Visa-Zentrum verstehen? Wahrscheinlich, aber es ist besser, es nicht zu riskieren.
Sie können dieses Foto mit ABBYY Mobile Web Capture auf Ihre Website hochladen, und die Technologie erkennt die Ränder des Dokuments im Bild. Wenn es keine Grenzen gibt, werden wir eine Warnung ausgeben und den Kunden darauf aufmerksam machen, dass er wahrscheinlich etwas Falsches heruntergeladen hat. Außerdem werden wir versuchen, die Qualität des Dokuments zu bewerten, um zu verstehen, ob es für die weitere Erkennung geeignet ist. ("Wir werden es versuchen", da sich diese Funktion jetzt im Technologie-Vorschaumodus befindet, wir arbeiten jedoch aktiv daran, sie zu verbessern.)
Sie müssen eine Karte in CRM ohne unnötige Qualen ausfüllen

Hier ein Beispiel: Wir haben einen potenziellen Kunden - einen Autohändler, und er muss alles über die Menschen wissen, an die er Autos verkauft. Zu diesem Zweck geben Mitarbeiter Kundendaten in einem Webportal wie einem CRM-System ein. Sie fragen den Client nach den Rechten, scannen sie und geben die Daten erneut in den Computer ein. Warum nutzen Mitarbeiter das Webportal und nicht die mobile App? Ganz einfach: Die Hauptaufgabe des Händlers besteht darin, Autos zu verkaufen und Kunden zu bedienen, anstatt viel Code für eine interne Anwendung zu schreiben. Daher ist es für das Unternehmen wichtig, schnell eine Lösung zu erstellen, die auf allen Plattformen funktioniert.
Mit ABBYY Mobile Web Capture kann dieser Geschäftsprozess vereinfacht werden: Ein Mitarbeiter muss lediglich ein Bild eines Dokuments auf einem Smartphone aufnehmen und das Bild dann zur Erkennung und Verarbeitung mit unserem anderen Produkt - ABBYY FlexiCapture - senden. Am Ende sparen wir also Zeit und erhöhen die Datenqualität.
Um ehrlich zu sein, bin ich selbst auf verschiedene Situationen gestoßen, in denen es für mich sehr nützlich wäre, Dokumente direkt im Browser zu scannen. Als ich beispielsweise vor einem Jahr ein Visum beantragte, verbrachte ich ungefähr eine Stunde damit, alle erforderlichen Dokumente zu erstellen, sie auf einen Computer zu übertragen, im gewünschten Format zu speichern und auf die Website hochzuladen. Und so konnte in 15 Minuten alles einfach fotografiert werden.
Ich hoffe wirklich, dass ABBYY Mobile Web Capture bald auf vielen Websites verwendet wird und dazu beiträgt, Aufgaben zu vereinfachen, bei denen Dokumente fotografiert werden müssen!
Olga Titova, Product Owner Mobile SDK