Der lang erwartete Schritt in Richtung komplex strukturierter Dokumente (+ Video)

Bild


Mit diesem Artikel über Habré freuen wir uns, Ihnen, Freunde, mitteilen zu können, dass wir von starr strukturierten Vorlagendokumenten zur Erkennung verschiedener komplex strukturierter Dokumente übergegangen sind. Und das, glauben Sie mir, ist ein ganz anderes Lied! Für Details willkommen unter Katze.


In jedem unserer Artikel über Habré werden wir immer wieder wiederholen, dass unser Hauptziel darin besteht, die Eingabe von Daten aus Dokumenten unter natürlichen, unkontrollierten Bedingungen zu automatisieren, ohne dass spezielle Geräte erforderlich sind. In nur wenigen Jahren ist es uns gelungen, das Erkennungssystem für ID-Dokumente auf industrielles Niveau zu bringen. Jetzt verwenden die meisten Finanzanwendungen (einschließlich einiger Anwendungen von nationaler Bedeutung) unsere Technologie, um die Arbeit mit der Anwendung zu beschleunigen und zu vereinfachen.


Für dieses Jahr ist unser globales Ziel die Erkennung von Dokumenten ohne zusätzliche Anforderungen an Vorlagen und Formulare. Wie immer sollte die Erkennung direkt auf dem Gerät erfolgen (sei es ein mobiles Gerät oder ein leistungsfähiger Server). Nachdem wir die meiste Zeit mit internen Überprüfungen verbracht und unsere grundlegende Hieroglyphen-Technologie fast vollständig überarbeitet haben, haben wir die erste Version des universellen Dokumentenerkennungsprogramms erstellt - Smart DocumentReader.


Welche Dokumente werden von Smart DocumentReader erkannt?


Architektonisch enthält das Smart DocumentReader-Programm keine Einschränkungen für die Arten der unterstützten Dokumente und ermöglicht es Ihnen, die Erkennung komplex strukturierter Dokumente zu konfigurieren. Dokumente können verschiedene semantische Elemente enthalten: Tabellen, Kontrollkästchen, Bereiche der handschriftlichen Füllung usw. In unserem Programm gibt es jedoch eine Einschränkung, die eher durch die Hardwarefunktionen mobiler Geräte verursacht wird: Die maximale physische Größe erkannter Dokumente entspricht dem A4-Format. Sie sehen jedoch, dass dies aus bürokratischer Sicht in der Russischen Föderation keine starke Einschränkung darstellt. Alle wichtigen Finanzdokumente sind auf unseren Seiten A4 abgedruckt: Zertifikat in Form 2-NDFL, Rechnung, Rechnung, Zertifikat, Frachtbrief (TTN), Frachtbrief in Form von TORG12, Universal Transfer Document (UPD), Charter, Vertrag , Rechnung, Fragebogen, Bewerbung usw.


Anerkennung von Referenzen 2-Einkommensteuer


Als erstes Beispiel haben wir das Programm Smart DocumentReader zur Erkennung von Zertifikaten in Form von 2-NDFL eingerichtet. Aus praktischer Sicht ist dies ein sehr beliebtes Dokument, das beispielsweise von Banken bei der Beantragung großer Kredite vom Staat verlangt wird, um Steuerabzüge zu erhalten.


Aus Sicht der internen Struktur ist das 2-NDFL-Zertifikat ein hervorragendes Beispiel für ein komplex strukturiertes Dokument: Es enthält obligatorische und optionale Felder, mehrere Tabellen, eine logische Beziehung zwischen einzelnen Attributen und eine große Anzahl erkannter Felder.


Smart DocumentReader unterstützt die Erkennung mehrseitiger Dokumente. Dazu sollte das Programm abwechselnd alle Seiten des Dokuments anzeigen. Beim Erscheinen neuer Seiten wird das Gesamterkennungsergebnis mit neuen Daten aktualisiert.



Wie alle unsere vorherigen Produkte läuft Smart DocumentReader auf einer Vielzahl von Prozessorarchitekturen unter verschiedenen Betriebssystemen. Heute unterstützen wir die Betriebssysteme Elbrus, Comdiv, SPARC, MIPS, ARM, x86, Sailfish Mobile OS RUS (Aurora), iOS, Android, Elbrus, Linux, Windows, MacOS und Solaris . In Bezug auf die Erkennungsgeschwindigkeit wird auf einem Mobiltelefon ein einseitiges 2-NDFL-Dokument in 3-5 Sekunden erkannt.


PS In diesem Artikel haben wir den technischen Teil praktisch übersehen und in naher Zukunft eine Reihe seriöser Veröffentlichungen über die wichtigsten Details zur Implementierung der vorgestellten Funktionalität erwartet.

Source: https://habr.com/ru/post/de453044/


All Articles