As políticas de privacidade de sites e aplicativos que descrevem as condições para o processamento de dados pessoais de usuários geralmente são escritas por advogados e ... para advogados. Pode ser difícil para um mero mortal entender a essência. Um morador do Hacker News assumiu o problema - ele desenvolveu um algoritmo de aprendizado de máquina que ajuda na leitura da política de privacidade.
Falamos sobre ele e outros projetos para "digerir" políticas de privacidade.
Fotos - Ashley Batz - UnsplashQual é o problema
Este ano, o NYTimes
explorou as políticas de privacidade de 150 sites e aplicativos. Os editores as analisaram usando a estrutura
Lexile . Determina a complexidade do texto, levando em consideração o tamanho das frases e o vocabulário. Uma análise dos documentos mostrou que a maioria deles é escrita em um idioma difícil de entender, mesmo para especialistas e estudantes, sem mencionar os alunos. Formulações vagas dificultam a compreensão do que as empresas fazem com os dados pessoais: quais informações coletam, com que finalidade, como as processam e para quem as transmitem.
Em média, as políticas de privacidade consistem em 2,5 mil palavras, mas em alguns casos esse número pode exceder 8 mil. É difícil imaginar quanto tempo levará para ler com cuidado e atenção esse documento. Segundo alguns relatórios - até 30 minutos.
Em 2008, especialistas da Universidade Carnegie Mellon calcularam que, em média, um usuário da Internet precisa de 181 a 304 horas (
tabela 7 ) para estudar a política de privacidade dos sites visitados ao longo do ano. Ao mesmo tempo, não levaram em consideração o tempo necessário para analisar acordos sobre o uso de produtos e serviços, nos quais as políticas de privacidade constituem apenas uma pequena parte. Há motivos para acreditar que, desde então, a situação só piorou.
Assim, no final dos anos 90, o Google, em 600 palavras, explicou como eles coletam e usam dados pessoais. Nos últimos 20 anos, o volume do documento
aumentou sete vezes . Mas nem todos os políticos são complicados e confusos. Os editores do NYTimes em seu estudo
perceberam que o documento da BBC é simples e conciso, sem muitos termos. Existem projetos cujo objetivo é estender essa prática para todo o setor de TI e, se não unificar as políticas de privacidade, simplificar sua compreensão para os usuários.
A rede neural lerá para você
O Hacker News Resident
desenvolveu um utilitário
Guard que analisa as políticas de privacidade de aplicativos usando algoritmos de aprendizado de máquina. Eles procuram por "linguagem cinza" no texto do acordo, deixando espaço para interpretação. Segundo o desenvolvedor, a ferramenta permitirá que os usuários entendam exatamente com o que estão concordando.
O utilitário também mostra o número de incidentes envolvendo vazamentos de dados pessoais em uma empresa específica. O serviço é bastante jovem e sua biblioteca de aplicativos ainda é pequena. Inclui: Twitter, Instagram, Netflix, Telegrama, Waze, Spotify, Reddit e vários outros.
O Guard também possui análogos -
Termos de Serviço; Não leu (ToS; DR) e
TLDRLegal . Eles também avaliam as políticas de privacidade de sites individuais, mas operam em um modelo de crowdsourcing. Em vez de uma rede neural, o texto é avaliado por voluntários e entusiastas. No futuro, a disseminação dessas ferramentas afetará positivamente a segurança dos dados pessoais na rede.
Privacy Commons padroniza tudo
Isso é semelhante ao Creative Commons, mas para políticas de privacidade. A idéia é
formar uma estrutura clara e fácil de entender, com uma descrição: quais dados pessoais a empresa coleta, como a protege e para quem passa. Eles trabalharam em um projeto semelhante no Mozilla em 2011. Os especialistas da empresa propuseram a introdução de
ícones especiais para sites . Eles denotaram as políticas e abordagens das empresas para trabalhar com a PD. Mas o projeto ainda não saiu da versão beta.
"A padronização condicional tornará as políticas de privacidade transparentes e excluirá áreas cinzentas", comenta Sergey Belkin, diretor de marketing da IT-GRAD e 1cloud.ru. "Mas eles falam sobre a implementação do Privacy Commons há pelo menos dez anos, e o processo não avançou". Embora com a introdução do Regulamento Europeu GDPR e ePrivacy, haja uma chance de as empresas, no entanto, chegarem à padronização na prática. ”
Navegador alerta para violações
Existem protocolos que permitem que os sites informem o navegador sobre o suposto recebimento de dados pessoais do usuário. Por exemplo, o consórcio W3C trabalhou ao mesmo tempo na Plataforma para Preferências de Privacidade (P3P). Os usuários disseram ao navegador que dados pessoais estavam dispostos a compartilhar. Ele verificou a lista de preferências com a política de privacidade em sites compatíveis com o P3P. Se surgissem discrepâncias, o navegador emitiu um aviso ao usuário.
Fotos - Kai Brame - UnsplashMas depois de algum tempo, o desenvolvimento do P3P foi desativado, pois a maioria dos sites simplesmente o ignorou. No entanto, de certa forma, sua função hoje é desempenhada por banners de biscoitos que chegaram com o novo regulamento. Os recursos sugerem que o usuário escolha quais dados pessoais ele está pronto para compartilhar. Agora o W3C está desenvolvendo outro padrão - Não Rastrear (DNT). Ele
adiciona uma função aos navegadores que informam aos sites se o usuário permitiu ou não a configuração de cookies. Acredita-se que o DNT terá mais sucesso que o P3P - ele já é suportado por empresas como Mozilla, Google e Microsoft.

Instruções
passo a passo da administração da nuvem 1cloud. Analisamos as perguntas mais frequentes sobre a operação de servidores virtuais, cobrança e certificados SSL.