Uso del reconocimiento óptico de caracteres en DeviceLock DLP para evitar fugas de documentos

Una de las tareas básicas para los sistemas DLP es la detección de varios documentos estatales de identidad en el flujo de datos transmitidos (pasaportes, certificados de nacimiento, licencias de conducir, etc.) y la prevención de su distribución no autorizada.



Si los documentos se presentan en forma de datos de texto en hojas de cálculo, bases de datos, etc., generalmente esto no causa ningún problema, siempre que el sistema DLP sea compatible con el filtrado de contenido en principio.


Sin embargo, ¿qué hacer cuando se trata de escaneos de documentos?


Quiero usar el complejo DeviceLock DLP como un ejemplo para mostrar cómo puede crear una política DLP que prohíba imprimir en impresoras, enviar por correo electrónico (SMTP) y cargar escaneos de pasaportes en almacenes de archivos en la nube.


Una característica de DeviceLock DLP es que el reconocimiento óptico de caracteres (OCR) se realiza directamente en la computadora del usuario mediante un módulo OCR residente como parte de un agente DLP, es decir. el OCR incorporado le permite extraer texto de archivos gráficos y luego verificarlo con reglas basadas en el análisis del contenido de los archivos y datos transferidos, inmediatamente en el momento en que el usuario toma medidas con estos archivos, sin transferirlos a un servidor de OCR de terceros. Esta arquitectura permite que DeviceLock DLP decida rápidamente si bloquear o permitir la operación de un usuario.


También me gustaría enfatizar que la implementación del agente del sistema DLP elimina fundamentalmente la necesidad de transferir datos de usuario fuera de la computadora protegida para cualquier tipo de análisis, incluido OCR, lo que permite operar con éxito DeviceLock DLP en países con una legislación muy estricta en el campo de la protección de los derechos de los trabajadores, por ejemplo, en Alemania y Francia


Utilizaremos este escaneo de un pasaporte ruso en formato JPG como muestra de prueba.



Primero, cree una regla de filtrado de contenido compuesto. “Capturaremos” los escaneos de pasaportes de acuerdo con las palabras que son características de un pasaporte ruso del diccionario integrado en DeviceLock DLP y por números, y solo nos interesan los archivos gráficos (más de 30 formatos gráficos son compatibles en total).



Luego aplicamos la regla de filtrado de contenido al protocolo SMTP, almacenamiento en la nube e impresoras. De acuerdo con la tarea establecida anteriormente, establecemos las prohibiciones para enviar a través de la red e imprimir archivos que se encuentran bajo la regla. Además, habilitaremos el registro de las acciones del usuario para ver los intentos de transferir e imprimir escaneos de pasaportes en los registros.




Ahora intentemos cargar un escaneo del pasaporte a Yandex.Disk.



Al mismo tiempo, se creó un registro en el registro de auditoría sobre este intento fallido.



Cuando intente imprimir un escaneo de pasaportes, DeviceLock DLP dejará de imprimir cuando la tarea se envíe a la impresora y mostrará este mensaje.



La falla también ocurrirá al momento de enviar el escaneo a través de SMTP.



En el registro de auditoría puede ver todos los rastros.



En conclusión, quiero agregar que DeviceLock DLP admite el reconocimiento óptico de caracteres (OCR) para todos los idiomas principales, incluidos ruso, inglés, alemán, chino, japonés, etc. El texto se puede extraer de documentos escaneados fotografiados en un ángulo de hasta 90 grados con respecto a la superficie fotografiada de los documentos, así como capturas de pantalla de documentos.

Source: https://habr.com/ru/post/es431814/


All Articles