En este breve artículo, le contaré cómo la industria ha malinterpretado la investigación de privacidad a lo largo de los años y cómo esto ha frenado el desarrollo tecnológico en esta área. Finalmente, cómo la investigación reciente ha remediado la situación y qué beneficios se pueden obtener de ella.
Se trata de tomar huellas digitales a través de un navegador. Debido a las diferencias en el sistema operativo, las versiones del navegador, las fuentes, los complementos y al menos una docena de otros factores, los navegadores web de diferentes usuarios tienden a verse diferentes. Esto puede ser utilizado por sitios y rastreadores de terceros para crear "huellas digitales" únicas, identificadores del navegador. Estas huellas digitales son mucho más efectivas que las cookies para rastrear usuarios: no dejan rastros y no se pueden borrar.
La pregunta es: ¿qué tan efectiva es la huella digital? Es decir, ¿qué tan única es la huella digital del dispositivo de un usuario típico? La respuesta es de gran importancia para la privacidad en Internet. Pero estudiar este tema desde un punto de vista científico es difícil: aunque muchas compañías tienen enormes bases de datos de huellas digitales, no las comparten con los investigadores.
El primer experimento de huellas digitales a gran escala llamado Panopticlick lanzó la Electronic Frontier Foundation en 2009. Cientos de miles de voluntarios visitaron
panopticlick.eff.org y acordaron
tomar huellas digitales de su navegador para investigar. El experimento mostró un
resultado sorprendente: el 83% de los usuarios de toda la muestra mostraron huellas digitales únicas. Para los usuarios con Flash o Java habilitados, las huellas digitales son aún más únicas: 94%.
Un experimento realizado por investigadores de INRIA en Francia con una muestra aún mayor mostró un resultado generalmente similar. Mientras tanto, varios investigadores, incluyéndonos a nosotros, dijeron que en los navegadores está aumentando la cantidad de funciones que se pueden usar para tomar huellas digitales:
Canvas ,
Battery, Audio y WebRTC .
La conclusión fue clara: las huellas digitales son extremadamente efectivas. El navegador no puede hacer frente a esta amenaza al proporcionar a los scripts menos información: demasiadas fugas de información, demasiados vectores de ataque. Las consecuencias son serias. Los desarrolladores de navegadores llegaron a la conclusión de que no podían hacer frente a la vigilancia de terceros y, por lo tanto, proteger la privacidad del departamento a merced de las extensiones.
[1] Pero estas extensiones tampoco buscaron limitar las huellas digitales. La mayoría de ellos trabajaron de acuerdo con un esquema complejo: bloquearon miles de rastreadores de guiones de acuerdo con listas compiladas manualmente, constantemente poniéndose al día cuando aparecían nuevos jugadores.
Pero hubo un cambio: el equipo de INRIA (incluidos algunos autores de estudios previos) logró negociar con un gran sitio web francés y probar a sus visitantes para obtener impresiones. Los resultados se
publicaron hace unos meses, y esta vez los resultados son completamente diferentes: solo un tercio de los usuarios tienen huellas digitales únicas (en comparación con 83% y 94% antes), a pesar de que los investigadores usaron un conjunto completo de 17 signos. Para los usuarios de dispositivos móviles, el número es aún menor: menos del 20%. Estas diferencias se explican por dos razones: el aumento de la muestra en el nuevo estudio y el hecho de que la autoselección de los participantes parece haber introducido un cierto sesgo en estudios anteriores. Hay otros factores: Internet está eliminando gradualmente los complementos como Flash y Java, por lo que la posibilidad de tomar huellas digitales debería seguir disminuyendo. Un estudio cuidadoso de los resultados muestra que la intervención más simple del navegador para limitar los atributos con la máxima entropía mejorará significativamente la capacidad de los usuarios para esconderse entre la multitud.
Apple
anunció recientemente que Safari intentará limitar las huellas digitales. Es probable que el último experimento haya influido en esta decisión. Cabe destacar que pocos expertos en privacidad consideran que la protección contra las huellas digitales es inútil, e incluso el consorcio W3C ha publicado
recomendaciones para desarrolladores de nuevos estándares sobre cómo minimizar las huellas digitales. No es muy tarde Pero si en 2009 supiéramos lo que sabemos hoy, esto habría llevado a los navegadores a desarrollar e implementar dicha protección.
¿Cuál es la razón principal para malinterpretar los resultados? Una lección simple es que la estadística es una ciencia compleja, y las muestras no representativas pueden distorsionar completamente los resultados de la investigación. Pero hay otra conclusión que es más difícil de aceptar: un estudio reciente es mejor para verificar usuarios comunes porque los investigadores no les preguntan ni les notifican.
[2] En los experimentos en Internet, existe una contradicción entre el consentimiento informado tradicional y la confiabilidad de los resultados. Para resolver este problema, se necesitan nuevos estándares éticos.
Otra lección es que la protección de la privacidad no tiene que ser perfecta. Muchos investigadores e ingenieros piensan en la confidencialidad en términos de "todo o nada": un error destruye todo, y si la protección no es perfecta, entonces no debe usarla en absoluto. Esto puede tener sentido para algunas aplicaciones, como el navegador Tor, pero para los usuarios comunes de los principales navegadores, el modelo de amenaza es la muerte por miles de pequeños cortes. La protección de la privacidad hace un buen trabajo al interrumpir
la economía de la vigilancia .
Finalmente, el argumento sobre la futilidad de la protección es un ejemplo de derrotismo en la privacidad. Frente a la avalancha de malas noticias en esta área, generalmente adquirimos una variedad de
impotencia aprendida y llegamos a la conclusión simplificada de que la privacidad está muriendo y no hay nada que hacer al respecto. Pero esta posición no está respaldada por evidencia: de hecho, vemos que en esta área un nuevo punto de equilibrio es constantemente consistente. Aunque siempre hay violaciones de la privacidad, de vez en cuando son compensadas por mecanismos legales, tecnológicos y de protección social.
Las huellas digitales a través de los navegadores de hoy siguen a la vanguardia de la batalla por la privacidad. El RGPD ha
dificultado la vida de las empresas que hacen esto. Los desarrolladores de navegadores también han abordado seriamente esta práctica vil.
[1] Una excepción obvia es el navegador Tor, pero debe pagarlo con una pérdida grave de rendimiento y funciones rotas en los sitios. Otra excepción es Brave, cuyos usuarios supuestamente están dispuestos a soportar algunos inconvenientes a cambio de mantener la privacidad. [volver]
[2] El experimento llevó a usuarios que previamente habían aceptado aceptar cookies, pero no fueron informados específicamente sobre el estudio. [volver]