La compréhension des politiques de confidentialité des applications et des services aidera les réseaux de neurones

Les politiques de confidentialité des sites et applications qui décrivent les conditions de traitement des données personnelles des utilisateurs sont généralement écrites par des avocats et ... pour des avocats. Il peut être difficile pour un simple mortel de comprendre l'essence. Un résident de Hacker News a abordé le problème - il a développé un algorithme d'apprentissage automatique qui aide à lire la politique de confidentialité.

Nous parlons de lui et d'autres projets pour "digérer" les politiques de confidentialité.


Photos - Ashley Batz - Unsplash

Quel est le problème


Cette année, NYTimes a exploré les politiques de confidentialité de 150 sites et applications. Les éditeurs les ont analysés à l'aide du cadre Lexile . Il détermine la complexité du texte, en tenant compte de la longueur des phrases et du vocabulaire. Une analyse des documents a montré que la plupart d'entre eux sont rédigés dans une langue difficile à comprendre même pour les spécialistes et les étudiants, sans parler des écoliers. Les libellés vagues rendent difficile la compréhension de ce que les entreprises font des données personnelles: quelles informations elles collectent, à quelles fins, comment elles les traitent et à qui elles les transmettent.

En moyenne, les politiques de confidentialité se composent de 2,5 mille mots, mais dans certains cas, ce chiffre peut dépasser 8 000. Il est difficile d'imaginer combien de temps il faudra pour lire attentivement et attentivement un tel document. Selon certains rapports - jusqu'à 30 minutes.

En 2008, des experts de l'Université Carnegie Mellon ont calculé qu'en moyenne, un internaute avait besoin de 181 à 304 heures ( tableau 7 ) pour étudier la politique de confidentialité des sites visités au cours de l'année. Dans le même temps, ils n'ont pas pris en compte le temps pris pour analyser les accords sur l'utilisation des produits et services, dans lesquels les politiques de confidentialité ne constituent qu'une petite partie. Il y a lieu de croire que depuis lors, la situation n'a fait qu'empirer.

Ainsi, à la fin des années 90, Google a expliqué en 600 mots comment ils collectent et utilisent les données personnelles. Au cours des 20 dernières années, le volume du document a augmenté sept fois . Mais tous les politiciens ne sont pas compliqués et déroutants. Les rédacteurs de NYTimes dans leur étude ont remarqué que le document de la BBC est simple et concis, sans un tas de termes. Il existe des projets dont le but est d'étendre cette pratique à l'ensemble du secteur informatique et, si ce n'est d'unifier les politiques de confidentialité, de simplifier leur compréhension pour les utilisateurs.

Le réseau de neurones lira pour vous


Hacker News Resident a développé un utilitaire Guard qui analyse les politiques de confidentialité des applications à l'aide d'algorithmes d'apprentissage automatique. Ils recherchent un «langage gris» dans le texte de l'accord, laissant une marge d'interprétation. Selon le développeur, l'outil permettra aux utilisateurs de comprendre exactement ce qu'ils acceptent.

L'utilitaire affiche également le nombre d'incidents impliquant des fuites de données personnelles dans une entreprise particulière. Le service est assez jeune et sa bibliothèque d'applications est encore petite. Il comprend: Twitter, Instagram, Netflix, Telegram, Waze, Spotify, Reddit et plusieurs autres.

Guard a également des analogues - Conditions d'utilisation; N'a pas lu (ToS; DR) et TLDRLegal . Ils évaluent également les politiques de confidentialité des sites individuels, mais fonctionnent sur un modèle de crowdsourcing. Au lieu d'un réseau de neurones, le texte est évalué par des bénévoles et des passionnés. À l'avenir, la diffusion de ces outils affectera positivement la sécurité des données personnelles sur le réseau.

Privacy Commons standardise tout


Ceci est similaire à Creative Commons, mais pour les politiques de confidentialité. L'idée est de former une structure claire et facile à comprendre avec une description: quelles données personnelles l'entreprise recueille, comment elle les protège et à qui elles passent. Ils ont travaillé sur un projet similaire à Mozilla en 2011. Les spécialistes de l'entreprise ont proposé l'introduction d' icônes spéciales pour les sites . Ils ont indiqué les politiques et les approches des entreprises pour travailler avec PD. Mais le projet n'est pas encore sorti de la beta.

«La normalisation conditionnelle rendra les politiques de confidentialité transparentes et exclura les zones grises», commente Sergey Belkin, directeur marketing d'IT-GRAD et 1cloud.ru. «Mais ils parlent de la mise en œuvre de Privacy Commons depuis au moins dix ans, et le processus n'a pas progressé.» Bien qu'avec l'introduction du règlement européen GDPR et ePrivacy, il est possible que les entreprises parviennent néanmoins à la normalisation dans la pratique. »

Le navigateur met en garde contre les violations


Il existe des protocoles qui permettent aux sites d'informer le navigateur de la prétendue réception des données personnelles de l'utilisateur. Par exemple, le consortium W3C a déjà travaillé sur la plate-forme pour les préférences de confidentialité (P3P). Les utilisateurs ont indiqué au navigateur quelles données personnelles ils étaient prêts à partager. Il a vérifié la liste des préférences avec la politique de confidentialité sur les sites qui prennent en charge P3P. Si des divergences apparaissent, le navigateur envoie un avertissement à l'utilisateur.


Photos - Kai Brame - Unsplash

Mais après un certain temps, le développement de P3P a été arrêté, car la plupart des sites l'ont simplement ignoré. Cependant, dans un sens, sa fonction est aujourd'hui remplie par des bannières de cookies qui sont arrivées avec le nouveau règlement. Les ressources suggèrent à l'utilisateur de choisir les données personnelles qu'il est prêt à partager. Le W3C développe maintenant une autre norme - Ne pas suivre (DNT). Il ajoute une fonction aux navigateurs qui indique aux sites si l'utilisateur a autorisé ou non la configuration des cookies. On pense que DNT réussira mieux que P3P - il est déjà pris en charge par des sociétés telles que Mozilla, Google et Microsoft.


Instructions étape par étape pour l'administration cloud cloud. Nous analysons les questions les plus fréquemment posées sur le fonctionnement des serveurs virtuels, la facturation et les certificats SSL.

Source: https://habr.com/ru/post/fr471222/


All Articles