
Dengan artikel tentang Habré ini, kami dengan senang hati mengumumkan kepada Anda, teman-teman, bahwa kami telah beralih dari template dokumen terstruktur secara kaku ke pengakuan berbagai dokumen terstruktur yang kompleks. Dan ini, percayalah, adalah lagu yang sama sekali berbeda! Untuk detail, selamat datang di bawah kucing.
Dalam setiap artikel kami tentang Habré, kami tidak pernah bosan mengulangi bahwa tujuan utama kami adalah untuk mengotomatiskan input data dari dokumen apa pun dalam kondisi alami yang tidak terkendali tanpa memerlukan peralatan khusus. Hanya dalam beberapa tahun, kami berhasil membawa sistem pengakuan dokumen ID ke tingkat industri dan sekarang sebagian besar aplikasi keuangan (termasuk bahkan beberapa aplikasi yang memiliki kepentingan nasional) menggunakan teknologi kami untuk mempercepat dan menyederhanakan bekerja dengan aplikasi tersebut.
Untuk tahun ini, tujuan global kami adalah pengakuan semua dokumen, tanpa persyaratan tambahan untuk templat dan formulir. Seperti biasa, pengenalan harus dilakukan langsung pada perangkat (baik itu perangkat seluler atau server yang kuat). Setelah menghabiskan sebagian besar waktu untuk tinjauan internal, setelah mendesain ulang teknologi Hieroglyph dasar kami hampir sepenuhnya, kami menciptakan versi pertama dari program pengenalan dokumen universal - Smart DocumentReader.
Dokumen apa yang dikenali oleh Smart DocumentReader
Secara arsitektural, program Smart DocumentReader tidak mengandung batasan pada jenis dokumen yang didukung dan memungkinkan Anda untuk mengonfigurasi pengenalan dokumen terstruktur yang rumit. Dokumen dapat berisi berbagai elemen semantik: tabel, kotak centang, area isian tulisan tangan, dll. Meskipun, satu batasan, lebih disebabkan oleh fitur perangkat keras dari perangkat seluler, ada dalam program kami: ukuran fisik maksimum dari dokumen yang dikenali adalah format A4. Tapi, Anda tahu, ini bukan batasan yang kuat dari sudut pandang birokrasi di Federasi Rusia. Semua dokumen keuangan utama dicetak pada halaman kami A4: sertifikat dalam bentuk 2-NDFL, faktur, faktur, sertifikat, waybill (TTN), waybill dalam bentuk TORG12, dokumen transfer universal (UPD), piagam, kontrak , faktur, kuesioner, aplikasi, dll.
Pengakuan referensi pajak penghasilan 2-pribadi
Sebagai contoh pertama, kami menyiapkan program Smart DocumentReader untuk mengenali sertifikat dalam bentuk 2-NDFL. Dari sudut pandang penggunaan praktis, ini adalah dokumen yang sangat populer, yang diperlukan, misalnya, oleh bank ketika mengajukan pinjaman besar, oleh negara untuk menerima potongan pajak.
Dari sudut pandang struktur internal, sertifikat 2-NDFL adalah contoh yang sangat baik dari dokumen terstruktur kompleks: berisi bidang wajib dan opsional, beberapa tabel, ada hubungan logis antara atribut individu, sejumlah besar bidang yang diakui.
Smart DocumentReader mendukung pengenalan dokumen multi-halaman. Untuk melakukan ini, program harus menunjukkan semua halaman dokumen secara bergantian. Setelah tampilan halaman baru, hasil pengenalan keseluruhan akan diperbarui dengan data baru.
Seperti semua produk kami sebelumnya, Smart DocumentReader berjalan pada berbagai arsitektur prosesor di bawah berbagai sistem operasi. Hari ini kami mendukung Elbrus, Comdiv, SPARC, MIPS, ARM, x86, Sailfish Mobile OS RUS (Aurora), iOS, Android, Elbrus, Linux, Windows, macOS, sistem operasi Solaris . Sedangkan untuk kecepatan pengenalan, pada ponsel dokumen satu-halaman 2-NDFL dikenali dalam 3-5 detik.
PS Dalam artikel ini, kami praktis melewatkan bagian teknis, mengantisipasi dalam waktu dekat serangkaian publikasi serius tentang detail paling penting yang mengimplementasikan fungsi yang disajikan.