在DeviceLock DLP中使用光学字符识别以防止文档泄漏

DLP系统的基本任务之一是检测传输数据流(护照,出生证,驾驶执照等)中各种身份的状态文件,并防止未经授权的分发。



如果文档以电子表格,数据库等形式的文本数据形式呈现,则通常不会造成任何问题,只要DLP系统原则上支持内容过滤


但是,涉及文档扫描时该怎么办?


我想以DeviceLock DLP复合体为例来说明如何创建DLP策略,该策略禁止在打印机上打印,通过电子邮件(SMTP)发送以及将通行证扫描上传到云文件存储。


DeviceLock DLP的一个功能是,光学字符识别(OCR)由驻留在OCR模块上的DLP代理(即DLP代理)的一部分直接在用户计算机上执行。 内置的OCR允许您从图形文件中提取文本,然后在用户对这些文件进行操作时立即基于对传输的文件和数据的内容进行分析的规则来检查文本,而无需将其传输到第三方OCR服务器。 这种架构使DeviceLock DLP可以快速决定是阻止还是允许用户操作。


另外,我想指出的是,代理商实施DLP系统从根本上消除了将用户数据传输到受保护计算机之外进行任何类型的分析的需要,包括OCR,这使得在保护工人权益领域法律非常严格的国家/地区成功运行DeviceLock DLP成为可能。在德国和法国。


我们将以JPG格式对俄罗斯护照进行扫描作为测试样本。



首先,创建复合内容过滤规则。 我们将根据DeviceLock DLP内置的词典中的俄罗斯护照的特征以及数字,“捕捉”护照扫描的单词,并且只有我们感兴趣的图形文件(总共支持30多种图形格式)。



然后,我们将内容过滤规则应用于SMTP协议,云存储和打印机。 根据上述任务,我们设置了禁止通过网络发送和打印属于该规则的文件的禁令。 另外,我们将启用对用户操作的日志记录,以便在日志中查看尝试传输和打印护照扫描的尝试。




现在,让我们尝试将护照扫描文件上传到Yandex.Disk。



同时,在审核日志中创建了有关此失败尝试的记录。



当您尝试打印护照扫描件时,当任务发送到打印机时,DeviceLock DLP将停止打印并显示此消息。



通过SMTP发送扫描时也会失败。



在审核日志中,您可以查看所有跟踪。



最后,我想补充一点,DeviceLock DLP支持所有主要语言的光学字符识别(OCR) ,包括俄语,英语,德语,中文,日语等。 可以从与文档的拍摄表面成90度角拍摄的扫描文档中提取文本,以及文档的屏幕截图。

Source: https://habr.com/ru/post/zh-CN431814/


All Articles