了解应用程序和服务隐私策略将有助于神经网络

描述用户处理个人数据的条件的网站和应用程序的隐私政策通常由律师撰写,也...由律师撰写。 凡人很难理解其本质。 Hacker News的一位居民解决了这个问题-他开发了一种机器学习算法,可帮助阅读隐私政策。

我们谈论他和“消化”隐私政策的其他项目。


照片-Ashley Batz -Unsplash

有什么问题


今年,《纽约时报》 探索了 150个网站和应用程序隐私政策。 编辑者使用Lexile框架对其进行了分析。 它决定了文本的复杂性,同时考虑了句子和词汇的长度。 对文件的分析表明,大多数文件都是用即使对于专家和学生来说都难以理解的语言编写的,更不用说学童了。 措辞含糊不清使人们难以理解公司对个人数据的处理方式:他们收集什么信息,出于什么目的,如何处理这些信息以及向谁传输这些信息。

平均而言,隐私策略 2.5千个单词组成,但是在某些情况下,这个数字可能超过8000个,很难想象仔细仔细地阅读此类文档将花费多长时间。 根据一些报告-长达30分钟。

早在2008年,卡内基梅隆大学的专家计算出,互联网用户平均需要181到304个小时( 表7 )来研究一年中访问站点的隐私政策。 同时,他们没有考虑分析产品和服务使用协议所花费的时间,其中隐私政策仅占一小部分。 有理由相信,自那时以来,这种情况只会恶化。

因此,在90年代后期,Google用600字来解释他们如何收集和使用个人数据。 在过去的20年中,该文档的数量增长了七倍 。 但是,并非所有政治人物都复杂而混乱。 《纽约时报》编辑在研究中注意到 ,英国广播公司的文件既简单又简洁,没有很多术语。 有些项目的目的是将这种做法扩展到整个IT行业,如果不统一隐私策略,则可以简化其对用户的理解。

神经网络将为您读取


Hacker News Resident 开发了一种Guard实用程序,该实用程序使用机器学习算法来解析应用程序隐私策略。 他们在协议文本中寻找“灰色语言”,从而留下了解释的空间。 根据开发人员的说法,该工具将使用户了解他们到底同意什么。

该实用程序还显示特定公司中涉及个人数据泄漏的事件数。 该服务还很年轻,其应用程序库仍然很小。 它包括:Twitter,Instagram,Netflix,Telegram,Waze,Spotify,Reddit等。

警卫队也有类似物- 服务条款; 未读 (ToS; DR)和TLDRLegal 。 他们还评估各个站点的隐私策略,但采用众包模式。 文本是由志愿者和爱好者评估的,而不是神经网络。 将来,此类工具的普及将对网络上个人数据的安全性产生积极影响。

隐私共用规范了一切


这类似于知识共享,但适用于隐私权政策。 这个想法是要形成一个清晰易懂的结构,并带有以下描述:公司收集什么个人数据,如何保护它以及将谁传递给谁。 他们早在2011年就在Mozilla中从事过类似项目。 该公司的专家建议为网站引入特殊图标 。 他们指出了公司与PD合作的政策和方法。 但是该项目尚未完成beta版。

IT-GRAD和1cloud.ru的市场总监Sergey Belkin表示:“有条件的标准化将使隐私政策透明化,并排除灰色区域。” “但是他们谈论实施隐私共享协议至少已有十年了,而且这一过程没有进展。” 尽管随着欧洲GDPR和ePrivacy法规的出台,企业仍然有可能在实践中实现标准化。”

浏览器警告违规


有些协议允许站点通知浏览器有关所谓的用户个人数据的接收。 例如,W3C联盟一次使用“隐私首选项平台”(P3P)。 用户告诉浏览器他们愿意分享哪些个人数据。 他在支持P3P的网站上检查了带有隐私策略的首选项列表。 如果出现差异,浏览器会向用户发出警告。


照片-Kai Brame -Unsplash

但是过了一段时间,由于大多数站点都忽略了P3P的开发,因此它被关闭了。 但是,从某种意义上说,今天的功能是由新法规带来的Cookie横幅执行的。 资源建议用户选择他准备共享的个人数据。 现在,W3C正在开发另一个标准-不跟踪(DNT)。 它向浏览器添加了一个功能,该功能可以告诉网站用户是否允许设置cookie。 据信DNT将比P3P更成功-它已经得到Mozilla,Google和Microsoft等公司的支持。


1cloud云管理的分步说明 。 我们分析有关虚拟服务器,计费和SSL证书操作的最常见问题。

Source: https://habr.com/ru/post/zh-CN471222/


All Articles