Usando o reconhecimento óptico de caracteres no DeviceLock DLP para evitar vazamentos de documentos

Uma das tarefas básicas dos sistemas DLP é a detecção de vários documentos estaduais de identidade no fluxo de dados transmitidos (passaportes, certidões de nascimento, carteiras de motorista etc.) e a prevenção de sua distribuição não autorizada.



Se os documentos são apresentados na forma de dados de texto em planilhas, bancos de dados, etc., geralmente isso não causa problemas, desde que o sistema DLP ofereça suporte , em princípio, à filtragem de conteúdo .


No entanto, o que fazer quando se trata de digitalizações de documentos?


Desejo usar o complexo DeviceLock DLP como exemplo para mostrar como você pode criar uma política de DLP que proíba a impressão em impressoras, o envio por e-mail (SMTP) e o upload de digitalizações de passaporte para armazenamentos de arquivos na nuvem.


Um recurso do DeviceLock DLP é que o reconhecimento óptico de caracteres (OCR) é realizado diretamente no computador do usuário por um módulo OCR residente como parte de um agente DLP, ou seja, o OCR embutido permite extrair texto de arquivos gráficos e, em seguida, verificar regras com base na análise do conteúdo dos arquivos e dados transferidos, imediatamente no momento em que o usuário executa ações com esses arquivos, sem transferi-los para um servidor OCR de terceiros. Essa arquitetura permite que o DeviceLock DLP decida rapidamente se deve bloquear ou permitir uma operação do usuário.


Também gostaria de enfatizar que a implementação do sistema DLP pelo agente elimina fundamentalmente a necessidade de transferir dados do usuário para fora do computador protegido para qualquer tipo de análise, incluindo o OCR, que possibilita operar com êxito o DeviceLock DLP em países com legislação muito rígida no campo da proteção dos direitos dos trabalhadores, por exemplo, na Alemanha e na França.


Usaremos essa digitalização de um passaporte russo no formato JPG como amostra de teste.



Primeiro, crie uma regra de filtragem de conteúdo composto. Nós “capturaremos” as varreduras de passaporte de acordo com as palavras que são características de um passaporte russo do dicionário incorporado no DeviceLock DLP e por números, e apenas os arquivos gráficos nos interessam (mais de 30 formatos gráficos são suportados no total).



Em seguida, aplicamos a regra de filtragem de conteúdo ao protocolo SMTP, armazenamento em nuvem e impressoras. De acordo com a tarefa definida acima, definimos as proibições de enviar pela rede e imprimir arquivos que se enquadram na regra. Além disso, habilitaremos o log de ações do usuário para ver tentativas de transferir e imprimir varreduras de passaporte nos logs.




Agora vamos tentar fazer o upload de uma varredura do passaporte para o Yandex.Disk.



Ao mesmo tempo, um registro foi criado no log de auditoria sobre essa tentativa malsucedida.



Quando você tenta imprimir uma digitalização de passaporte, o DeviceLock DLP para de imprimir quando a tarefa é enviada para a impressora e exibe essa mensagem.



A falha também ocorrerá no momento do envio da verificação via SMTP.



No log de auditoria, você pode ver todos os rastreamentos.



Concluindo, quero acrescentar que o DeviceLock DLP oferece suporte ao reconhecimento óptico de caracteres (OCR) para todos os principais idiomas, incluindo russo, inglês, alemão, chinês, japonês, etc. O texto pode ser extraído de documentos digitalizados fotografados em um ângulo de até 90 graus com a superfície fotografada dos documentos, bem como capturas de tela dos documentos.

Source: https://habr.com/ru/post/pt431814/


All Articles