Google déclare que «reCAPTCHA» n'abuse pas des données utilisateur. Vaut-il la peine de croire?



L'utilisation d'une méthode innovante pour distinguer les personnes des robots sur Internet pose un certain nombre de problèmes graves

Étonnamment, il faut beaucoup d'efforts pour s'assurer que les sites Web peuvent s'assurer que l'utilisateur n'est pas un robot. Pour cette raison, lorsque vous entrez dans des sites, vous pouvez souvent voir des questions du système CAPTCHA: des photos floues de passages pour piétons, des feux de circulation et des devantures de magasins qu'il est proposé d'identifier en quelques clics de souris.

Il existe différents types de tâches: des lettres vagues qui doivent être reconnues et saisies sur le terrain, aux slogans d'entreprises tels que «Comfort Plus» sur le site Web de Delta - comme si l'état déplorable du transport aérien moderne n'était toujours pas suffisamment anti-utopique. Le plus courant, cependant, est le service reCAPTCHA de Google, dont la troisième version est sortie fin 2018 . Sa tâche est de réduire considérablement le nombre d'actions requises de l'utilisateur lors de son entrée sur le site, ce qui est réalisé en attribuant aux utilisateurs des notations non affichables en fonction de la nature «humaine» de leur comportement. En fin de compte, la tâche initiale de CAPTCHA était d'éliminer les comptes de robots qui peuplent les sites Web à des fins moins qu'honnêtes.

Mais le système innovant développé par les spécialistes de Google a un inconvénient: la nouvelle version suit chaque mouvement de l'utilisateur sur le site Web, afin de déterminer s'il est vraiment une personne.

Traduit en Alconost


Source: Alexey Bezrodny / iStock / Getty Images Plus

Amélioration nécessaire?


Avant de découvrir le fonctionnement de ce nouveau produit, il est utile de savoir d'où il vient. Le nouveau reCAPTCHA a remplacé la technologie Web relativement ancienne, qui n'était pas seulement utilisée pour protéger les sites.

L'outil CAPTCHA - qui signifie "un test public de Turing entièrement automatisé pour faire la distinction entre les ordinateurs et les personnes" - est apparu à la fin des années 90: il a été développé par une équipe de l'un des premiers moteurs de recherche - AltaVista . Avant cela, il était assez facile d'écrire un bot qui s'enregistrait automatiquement sur le service et envoyait des milliers de commentaires indésirables. La solution AltaVista était basée sur les recommandations du manuel de l'imprimante pour la prévention de la mauvaise reconnaissance optique des caractères (OCR); le texte flou caractéristique du système CAPTCHA a été spécialement conçu de telle sorte qu'il était difficile à lire sur un ordinateur, mais facile pour une personne, et cela permettait de filtrer les bots.

Au début des années 2000, ces tests étaient partout. Puis est venu reCAPTCHA, développé par des chercheurs de Carnegie Mellon et acheté par Google en 2009, qui a utilisé la même idée, mais d'une manière nouvelle: en entrant un texte de vérification, les utilisateurs doivent identifier certains mots que les programmes ne peuvent pas reconnaître. Autrement dit, le programme scanne le texte et marque les mots qu'il ne peut pas reconnaître. Dans les tests reCAPTCHA, ces mots sont ensuite placés à côté des mots connus - de cette façon, l'utilisateur est vérifié sur un mot connu, puis il aide à en identifier un nouveau.

En 2011, Google avait numérisé l' intégralité des archives du New York Times avec les seuls tests reCAPTCHA. Les utilisateurs ont reconnu le texte des analyses de journaux par un mot flou à la fois, ce qui a finalement permis de numériser le catalogue de journaux et d'organiser une recherche sur celui-ci. En créant un outil pratique pour protéger les sites contre les robots, Google a réussi à inciter les gens à faire leur propre travail fastidieux.

Vous ne pouvez pas refuser d’utiliser reCAPTCHA: vous êtes obligé d’accepter de suivre ou de cesser d’utiliser le site dont vous avez besoin.

Après avoir obtenu de tels résultats, en 2014, reCAPTCHA est passé à l'affichage d'images à partir de l'application Google Street View. Après avoir cliqué sur le bouton «Je ne suis pas un robot», il vous sera peut-être demandé de déterminer laquelle des neuf images contient des «vélos» ou des «réverbères». En parallèle, Google a réduit la fréquence à laquelle les utilisateurs ont été invités à vérifier - cela a été réalisé grâce à l'analyse comportementale : maintenant reCAPTCHA peut travailler en arrière-plan et suivre la façon dont nous utilisons les sites Web.

Si votre ordinateur possède un cookie de Google ou si vous utilisez la souris et le clavier sur la page pour qu'il ne ressemble pas à un bot, vous ne serez pas invité à passer le test Street View. Mais certains utilisateurs qui se soucient de la confidentialité se sont plaints qu'après la suppression des cookies et lors de l'affichage en mode navigation privée , le nombre de tests reCAPTCHA qui sont proposés pour réussir augmente fortement .

Les utilisateurs ont également noté que lors de l'utilisation de navigateurs concurrents avec Google Chrome, tels que Firefox, d'autres tests étaient nécessaires, ce qui pose naturellement la question: est-ce que reCAPTCHA est utilisé pour renforcer la domination du navigateur de Google?

Cela soulève de graves problèmes de confidentialité, d'autant plus que les principaux revenus de Google proviennent d'une entreprise publicitaire qui repose sur le suivi des données. Il peut être troublant que reCAPTCHA soit essentiellement un outil de suivi publicitaire se cachant sur des sites réguliers, comme le même bouton Facebook Like intégré aux pages Web.

Point de vue Google


Pour utiliser la dernière version de reCAPTCHA, les développeurs doivent inclure des balises de suivi sur autant de pages du site Web que possible - cela donne l'occasion d'obtenir une meilleure image des actions des utilisateurs. Cependant, cet outil n'existe pas en vase clos: par exemple, il existe également Google Analytics, une plateforme qui aide les développeurs et les marketeurs à comprendre comment les visiteurs utilisent un site Web. C'est un excellent outil utilisé sur plus de 100 000 des 1 million de sites Web les plus visités selon la version Built With , mais en même temps, il fait partie d'une stratégie pour suivre les habitudes des utilisateurs sur Internet.

La nouvelle version de reCAPTCHA remplit les parties manquantes de cette image et permet à Google de pénétrer encore plus loin - sur les sites qui n'utilisent pas Google Analytics. En réponse à des réclamations pertinentes, la société a déclaré à Fast Company qu'elle ne collecterait pas de données utilisateur de reCAPTCHA à des fins publicitaires et que les données qu'elle collecte sont utilisées pour améliorer le service.

Mais ces données restent enfermées dans une boîte noire même pour les développeurs mettant en œuvre cette technologie à la maison. La documentation reCAPTCHA ne mentionne pas les données des utilisateurs, ni n'explique comment les utilisateurs peuvent être suivis, et où les informations sont finalement trouvées - elle décrit simplement la mise en œuvre pratique.

J'ai demandé à Google d'indiquer plus en détail les obligations de l'entreprise concernant l'indépendance de reCAPTCHA vis-à-vis de la publicité à long terme: le fait qu'ils ne soient pas connectés maintenant ne signifie pas qu'ils ne seront pas connectés à l'avenir.

"Google n'utilisera pas reCAPTCHA pour la publicité personnalisée."

Une porte-parole de Google a déclaré que «reCAPTCHA ne peut être utilisé que pour lutter contre le spam et l'utilisation abusive des [sites Web]» et que «l'API du service reCAPTCHA fonctionne en collectant des informations sur le matériel et les logiciels, tels que les données des appareils et des applications, et en les envoyant Données Google pour analyse. Les informations collectées dans le cadre de votre utilisation du service seront utilisées pour améliorer reCAPTCHA et à des fins de sécurité générale. Google n'utilisera pas reCAPTCHA pour la publicité personnalisée. "

C'est formidable, et nous espérons que Google tiendra sa promesse. Le problème est qu'il n'y a aucune raison de croire que tout sera ainsi. L'introduction d'une technologie de suivi aussi puissante est une étape qui devrait faire l'objet d'une attention particulière du public, car nous avons déjà vu avec quelle facilité les choses peuvent mal tourner. Par exemple, en 2014, il a été promis que WhatsApp resterait indépendant, fonctionnerait séparément de l'infrastructure backend de Facebook, mais seulement deux ans plus tard, cette décision a été révisée . Lorsque Google a acquis Nest, on nous a également promis l'indépendance, qui a été abandonnée cinq ans plus tard : les propriétaires d'appareils ont dû passer à un compte Google ou abandonner certaines fonctions.

Google pourrait créer un service comme reCAPTCHA, grâce à ses vastes ressources et sa large portée, mais c'est aussi la raison de soupçonner que tout se passera pour le pire.

Malheureusement, en tant qu'utilisateurs, nous ne pouvons pas faire grand-chose. Vous ne pouvez pas refuser d’utiliser reCAPTCHA: vous êtes obligé d’accepter de suivre ou de cesser d’utiliser le site dont vous avez besoin. Si vous n'aimez pas les scanners corporels dans les aéroports, vous pouvez au moins les refuser et effectuer une recherche régulière. Mais si le site dispose de reCAPTCHA, vous ne pouvez pas refuser de l'utiliser.

Si Google a l'intention de créer de tels outils en tenant compte de l'intérêt public plutôt que de son propre profit, les entreprises doivent trouver des moyens plus convaincants pour garantir aux autres qu'elles ne changeront pas leur parole quand cela sera opportun. S'ils voulaient ouvrir le code source du projet (comme c'était le cas avec de nombreux autres produits ), le retirer de l'entreprise, ou au moins mettre en place une supervision tierce, ce serait peut-être un bon début qui contribuerait à gagner la confiance des utilisateurs.

À propos du traducteur

L'article a été traduit par Alconost.

Alconost localise des jeux , des applications et des sites dans 70 langues. Traducteurs en langue maternelle, tests linguistiques, plateforme cloud avec API, localisation continue, chefs de projet 24/7, tout format de ressources de chaîne.

Nous réalisons également des vidéos de publicité et de formation - pour les sites qui vendent, présentent des images, de la publicité, des formations, des teasers, des explicateurs, des bandes-annonces pour Google Play et l'App Store.

En savoir plus

Source: https://habr.com/ru/post/fr460573/


All Articles