Comprender las políticas de privacidad de aplicaciones y servicios ayudará a las redes neuronales

Las políticas de privacidad de los sitios y aplicaciones que describen las condiciones para el procesamiento de datos personales de los usuarios generalmente están escritas por abogados y ... para abogados. Puede ser difícil para un simple mortal comprender la esencia. Un residente de Hacker News se ocupó del problema: desarrolló un algoritmo de aprendizaje automático que ayuda a leer la política de privacidad.

Hablamos de él y otros proyectos para "digerir" las políticas de privacidad.


Fotos - Ashley Batz - Unsplash

Cual es el problema


Este año, NYTimes exploró las políticas de privacidad de 150 sitios y aplicaciones. Los editores los analizaron usando el marco Lexile . Determina la complejidad del texto, teniendo en cuenta la longitud de las oraciones y el vocabulario. Un análisis de los documentos mostró que la mayoría de ellos están escritos en un idioma que es difícil de entender incluso para especialistas y estudiantes, sin mencionar a los escolares. La redacción vaga dificulta la comprensión de lo que hacen las empresas con los datos personales: qué información recopilan, con qué fines, cómo la procesan y a quién la transmiten.

En promedio, las políticas de privacidad consisten en 2,5 mil palabras, pero en algunos casos esta cifra puede exceder las 8 mil. Es difícil imaginar cuánto tiempo tomará leer cuidadosamente y cuidadosamente dicho documento. Según algunos informes, hasta 30 minutos.

En 2008, los expertos de la Universidad Carnegie Mellon calcularon que, en promedio, un usuario de Internet necesita entre 181 y 304 horas ( tabla 7 ) para estudiar la política de privacidad de los sitios visitados durante el año. Al mismo tiempo, no tuvieron en cuenta el tiempo necesario para analizar los acuerdos sobre el uso de productos y servicios, en los que las políticas de privacidad constituyen solo una pequeña parte. Hay razones para creer que desde entonces la situación solo ha empeorado.

Entonces, a fines de los años 90, Google en 600 palabras explicó cómo recopilan y usan datos personales. En los últimos 20 años, el volumen del documento ha crecido siete veces . Pero no todos los políticos son complicados y confusos. Los editores de NYTimes en su estudio notaron que el documento de la BBC es simple y conciso, sin muchos términos. Hay proyectos cuyo propósito es extender esta práctica a toda la industria de TI y, si no unificar las políticas de privacidad, simplificar su comprensión para los usuarios.

La red neuronal leerá por ti


Hacker News Resident ha desarrollado una utilidad Guard que analiza las políticas de privacidad de las aplicaciones utilizando algoritmos de aprendizaje automático. Buscan "lenguaje gris" en el texto del acuerdo, dejando espacio para la interpretación. Según el desarrollador, la herramienta permitirá a los usuarios comprender exactamente lo que están aceptando.

La utilidad también muestra la cantidad de incidentes relacionados con fugas de datos personales en una empresa en particular. El servicio es bastante joven y su biblioteca de aplicaciones aún es pequeña. Incluye: Twitter, Instagram, Netflix, Telegram, Waze, Spotify, Reddit y varios otros.

Guard también tiene análogos: términos de servicio; No leí (ToS; DR) y TLDRLegal . También evalúan las políticas de privacidad de sitios individuales, pero operan en un modelo de crowdsourcing. En lugar de una red neuronal, el texto es evaluado por voluntarios y entusiastas. En el futuro, la difusión de tales herramientas afectará positivamente la seguridad de los datos personales en la red.

Privacy Commons estandariza todo


Esto es similar a Creative Commons, pero para las políticas de privacidad. La idea es formar una estructura clara y fácil de entender con una descripción: qué datos personales recopila la empresa, cómo la protege y a quién se la pasa. Trabajaron en un proyecto similar en Mozilla en 2011. Los especialistas de la compañía han propuesto la introducción de iconos especiales para sitios . Denotaron las políticas y enfoques de las empresas para trabajar con DP. Pero el proyecto aún no ha salido de la versión beta.

"La estandarización condicional hará que las políticas de privacidad sean transparentes y excluirá las áreas grises", comenta Sergey Belkin, director de marketing de IT-GRAD y 1cloud.ru. "Pero han estado hablando de implementar Privacy Commons durante al menos diez años, y el proceso no ha avanzado". Aunque con la introducción del GDPR europeo y el Reglamento de privacidad electrónica, existe la posibilidad de que las empresas lleguen a la normalización en la práctica ".

El navegador advierte de infracciones


Existen protocolos que permiten a los sitios informar al navegador sobre la supuesta recepción de los datos personales del usuario. Por ejemplo, el consorcio W3C trabajó una vez en la Plataforma de Preferencias de Privacidad (P3P). Los usuarios le dijeron al navegador qué datos personales estaban dispuestos a compartir. Verificó la lista de preferencias con la política de privacidad en los sitios que admiten P3P. Si aparecían discrepancias, el navegador emitió una advertencia al usuario.


Fotos - Kai Brame - Unsplash

Pero después de un tiempo, el desarrollo de P3P se apagó, ya que la mayoría de los sitios simplemente lo ignoraron. Sin embargo, en cierto sentido, su función actual se realiza mediante banners de cookies que han llegado con la nueva regulación. Los recursos sugieren que el usuario elija qué datos personales está listo para compartir. Ahora W3C está desarrollando otro estándar: No rastrear (DNT). Agrega una función a los navegadores que le dice a los sitios si el usuario ha permitido la configuración de cookies o no. Se cree que DNT tendrá más éxito que P3P: ya es compatible con empresas como Mozilla, Google y Microsoft.


Instrucciones paso a paso de la administración de la nube de 1cloud. Analizamos las preguntas más frecuentes sobre el funcionamiento de los servidores virtuales, la facturación y los certificados SSL.

Source: https://habr.com/ru/post/471222/


All Articles