Utilisation de la reconnaissance optique de caractères dans DeviceLock DLP pour éviter les fuites de documents

L'une des tâches de base des systèmes DLP est la détection de divers documents d'identité de l'État dans le flux de données transmises (passeports, certificats de naissance, permis de conduire, etc.) et la prévention de leur distribution non autorisée.



Si les documents sont présentés sous forme de données texte dans des feuilles de calcul, des bases de données, etc., cela ne pose généralement aucun problème, à condition que le système DLP prenne en charge le filtrage de contenu en principe.


Cependant, que faire en matière de numérisation de documents?


Je veux utiliser le complexe DeviceLock DLP comme exemple pour montrer comment vous pouvez créer une stratégie DLP qui interdit l'impression sur des imprimantes, l'envoi par e-mail (SMTP) et le téléchargement de scans de passeport vers des stockages de fichiers cloud.


Une caractéristique de DeviceLock DLP est que la reconnaissance optique de caractères (OCR) est effectuée directement sur l'ordinateur de l'utilisateur par un module OCR résident dans le cadre d'un agent DLP, c'est-à-dire l'OCR intégré vous permet d'extraire du texte à partir de fichiers graphiques, puis de le vérifier avec des règles basées sur l'analyse du contenu des fichiers et des données transférés, immédiatement au moment où l'utilisateur prend des mesures avec ces fichiers, sans les transférer vers un serveur OCR tiers. Cette architecture permet à DeviceLock DLP de décider rapidement de bloquer ou d'autoriser une opération utilisateur.


Je voudrais également souligner que la mise en œuvre par l'agent du système DLP élimine fondamentalement la nécessité de transférer des données utilisateur en dehors de l'ordinateur protégé pour tout type d'analyse, y compris l'OCR, ce qui permet de faire fonctionner avec succès DeviceLock DLP dans les pays avec une législation très stricte dans le domaine de la protection des droits des travailleurs, par exemple, en Allemagne et en France.


Nous utiliserons ce scan d'un passeport russe au format JPG comme échantillon de test.



Créez d'abord une règle de filtrage de contenu composite. Nous "capturerons" les scans de passeport en fonction des mots caractéristiques d'un passeport russe provenant du dictionnaire intégré à DeviceLock DLP et par des nombres, et seuls les fichiers graphiques nous intéressent (plus de 30 formats graphiques sont pris en charge au total).



Ensuite, nous appliquons la règle de filtrage de contenu au protocole SMTP, au stockage cloud et aux imprimantes. Selon la tâche définie ci-dessus, nous avons défini les interdictions d'envoi sur le réseau et d'impression de fichiers qui relèvent de la règle. De plus, nous activerons la journalisation des actions de l'utilisateur afin de voir les tentatives de transfert et d'impression des analyses de passeport dans les journaux.




Essayons maintenant de télécharger une analyse du passeport vers Yandex.Disk.



Dans le même temps, un enregistrement a été créé dans le journal d'audit sur cette tentative infructueuse.



Lorsque vous essayez d'imprimer une numérisation de passeport, DeviceLock DLP arrête l'impression lorsque la tâche est envoyée à l'imprimante et affiche ce message.



Un échec se produira également au moment de l'envoi de l'analyse via SMTP.



Dans le journal d'audit, vous pouvez voir toutes les traces.



En conclusion, je veux ajouter que DeviceLock DLP prend en charge la reconnaissance optique de caractères (OCR) pour toutes les langues principales, y compris le russe, l'anglais, l'allemand, le chinois, le japonais, etc. Le texte peut être extrait de documents numérisés photographiés à un angle pouvant atteindre 90 degrés par rapport à la surface photographiée des documents, ainsi que des captures d'écran de documents.

Source: https://habr.com/ru/post/fr431814/


All Articles