Google gibt an, dass "reCAPTCHA" keine Benutzerdaten missbraucht. Lohnt es sich zu glauben?



Die Verwendung einer innovativen Methode zur Unterscheidung zwischen Personen und Bots im Internet wirft eine Reihe schwerwiegender Probleme auf

Überraschenderweise ist viel Aufwand erforderlich, um sicherzustellen, dass Websites sicherstellen können, dass der Benutzer kein Roboter ist. Aus diesem Grund werden beim Betreten von Websites häufig Fragen aus dem CAPTCHA-System angezeigt: verschwommene Fotos von Fußgängerüberwegen, Ampeln und Schaufenstern, die mit wenigen Mausklicks identifiziert werden sollen.

Es gibt verschiedene Arten von Aufgaben: von vagen Buchstaben, die erkannt und in das Feld eingegeben werden müssen, bis zu Firmenslogans wie „Comfort Plus“ auf der Delta-Website - als ob der bedauerliche Zustand des modernen Luftverkehrs immer noch nicht anti-utopisch genug wäre. Am gebräuchlichsten ist jedoch der reCAPTCHA-Dienst von Google, dessen dritte Version Ende 2018 veröffentlicht wurde . Seine Aufgabe ist es, die Anzahl der Aktionen, die der Benutzer beim Betreten der Site benötigt, erheblich zu reduzieren. Dies wird erreicht, indem den Benutzern nicht anzeigbare Bewertungen zugewiesen werden, je nachdem, wie „menschlich“ ihr Verhalten ist. Am Ende bestand die ursprüngliche Aufgabe von CAPTCHA darin, Bot-Konten auszusortieren, die Websites für weniger als ehrliche Zwecke füllen.

Das von den Google-Spezialisten entwickelte innovative System hat jedoch einen Nachteil: Die neue Version verfolgt jede Bewegung des Nutzers auf der Website und bestimmt, ob er wirklich eine Person ist.

Übersetzt nach Alconost


Quelle: Alexey Bezrodny / iStock / Getty Images Plus

Notwendige Verbesserung?


Bevor wir uns mit der Funktionsweise dieses neuen Produkts befassen, sollten Sie herausfinden, woher es stammt. Das neue reCAPTCHA ersetzte die relativ alte Web-Technologie, die nicht nur zum Schutz von Websites eingesetzt wurde.

Das CAPTCHA-Tool - was "ein vollautomatischer öffentlicher Turing-Test zur Unterscheidung zwischen Computern und Menschen" bedeutet - erschien erstmals Ende der 90er Jahre: Es wurde von einem Team einer der ersten Suchmaschinen - AltaVista - entwickelt . Zuvor war es recht einfach, einen Bot zu schreiben, der sich automatisch beim Dienst registriert und zu Tausenden Spam-Kommentare sendet. Die AltaVista-Lösung basierte auf den Empfehlungen im Druckerhandbuch zur Verhinderung einer schlechten optischen Zeichenerkennung (OCR). Der charakteristische unscharfe Text des CAPTCHA-Systems wurde speziell so erstellt, dass es für einen Computer schwierig zu lesen war, für eine Person jedoch einfach, und dies ermöglichte das Herausfiltern von Bots.

Zu Beginn der 2000er Jahre waren diese Tests überall. Dann kam reCAPTCHA, das von Forschern von Carnegie Mellon entwickelt und 2009 von Google gekauft wurde und dieselbe Idee verwendete, jedoch auf eine neue Art und Weise: Durch Eingabe von Bestätigungstext müssen Benutzer bestimmte Wörter identifizieren, die Programme nicht erkennen können. Das heißt, das Programm scannt den Text und markiert Wörter, die es nicht erkennen kann. In reCAPTCHA-Tests werden diese Wörter dann neben bekannten Wörtern platziert. Auf diese Weise wird der Benutzer auf ein bekanntes Wort überprüft und hilft dann, ein neues zu identifizieren.

Bis 2011 hatte Google das gesamte Archiv der New York Times allein mit reCAPTCHA-Tests digitalisiert . Benutzer erkannten Text aus Zeitungsscans jeweils nach einem verschwommenen Wort, was es letztendlich ermöglichte, den Zeitungskatalog zu digitalisieren und eine Suche danach zu organisieren. Durch die Erstellung eines praktischen Tools zum Schutz von Websites vor Bots konnte Google Menschen dazu bringen, ihre eigene mühsame Arbeit zu erledigen.

Sie können die Verwendung von reCAPTCHA nicht ablehnen: Sie müssen entweder zustimmen, dass Sie die von Ihnen benötigte Website weiterverfolgen oder nicht mehr verwenden.

Nachdem reCAPTCHA solche Ergebnisse erzielt hatte, wechselte es 2014 zur Anzeige von Bildern aus der Google Street View-Anwendung. Nachdem Sie auf die Schaltfläche „Ich bin kein Roboter“ geklickt haben, werden Sie möglicherweise aufgefordert, festzustellen, welches der neun Bilder „Fahrräder“ oder „Straßenlaternen“ enthält. Parallel dazu reduzierte Google die Häufigkeit, mit der Nutzer zur Überprüfung aufgefordert wurden - dies wurde dank einer Verhaltensanalyse erreicht : Jetzt kann reCAPTCHA im Hintergrund arbeiten und verfolgen, wie wir Websites verwenden.

Wenn Ihr Computer ein Cookie von Google hat oder Sie die Maus und die Tastatur auf der Seite verwenden, damit es nicht wie ein Bot aussieht, werden Sie nicht aufgefordert, den Street View-Test durchzuführen. Einige Benutzer, denen der Datenschutz am Herzen liegt, beklagten sich jedoch darüber, dass nach dem Löschen von Cookies und beim Anzeigen im Inkognito-Modus die Anzahl der reCAPTCHA-Tests, die zum Bestehen angeboten werden, stark zunimmt .

Die Nutzer stellten außerdem fest, dass bei der Arbeit in konkurrierenden Browsern mit Google Chrome wie Firefox mehr Tests erforderlich waren. Dies wirft natürlich die Frage auf: Wird reCAPTCHA verwendet, um die Browser-Dominanz von Google zu stärken?

Dies wirft ernsthafte Bedenken hinsichtlich des Datenschutzes auf, insbesondere da die Haupteinnahmen von Google aus einem Anzeigengeschäft stammen, das auf Datenverfolgung beruht. Es kann beunruhigend sein, dass reCAPTCHA im Wesentlichen ein Tool zur Verfolgung von Werbung ist, das sich auf regulären Websites versteckt, genau wie der in Webseiten integrierte Facebook Like-Button.

Google Sicht


Um die neueste Version von reCAPTCHA zu verwenden, sollten Entwickler Tracking-Tags auf so vielen Seiten der Website wie möglich einfügen. Dies bietet die Möglichkeit, sich ein besseres Bild von Benutzeraktionen zu machen. Dieses Tool existiert jedoch nicht im luftleeren Raum: Beispielsweise gibt es auch Google Analytics, eine Plattform, mit der Entwickler und Vermarkter verstehen, wie Besucher eine Website nutzen. Es ist ein hervorragendes Tool, das gemäß der Built With-Version auf mehr als 100.000 der 1 Million am häufigsten besuchten Websites verwendet wird. Gleichzeitig ist es Teil einer Strategie zur Verfolgung der Benutzergewohnheiten im Internet.

Die neue Version von reCAPTCHA füllt die fehlenden Teile dieses Bildes aus und ermöglicht es Google, noch weiter in Websites einzudringen, die Google Analytics nicht verwenden. In Reaktion auf relevante Ansprüche teilte das Unternehmen Fast Company mit, dass es keine Benutzerdaten von reCAPTCHA für Werbezwecke sammeln würde und dass die gesammelten Daten zur Verbesserung des Dienstes verwendet würden.

Diese Daten bleiben jedoch auch für Entwickler, die diese Technologie zu Hause implementieren, in einer Black Box eingeschlossen. In der reCAPTCHA- Dokumentation werden weder Benutzerdaten erwähnt noch erläutert, wie Benutzer verfolgt werden können und wo die Informationen letztendlich gefunden werden. Sie beschreibt lediglich die praktische Implementierung.

Ich habe Google gebeten, detaillierter zu erläutern, welche Verpflichtungen das Unternehmen in Bezug auf die langfristige Unabhängigkeit von reCAPTCHA vom Werbegeschäft eingeht: Die Tatsache, dass sie jetzt nicht verbunden sind, bedeutet nicht, dass sie in Zukunft nicht verbunden werden.

"Google wird reCAPTCHA nicht für personalisierte Werbung verwenden."

Eine Google-Sprecherin sagte, dass "reCAPTCHA nur zur Bekämpfung von Spam und Missbrauch von [Websites] verwendet werden kann" und dass "die reCAPTCHA-Service-API Informationen über Hardware und Software wie Geräte- und Anwendungsdaten sammelt und diese sendet Google-Daten zur Analyse. Die im Zusammenhang mit Ihrer Nutzung des Dienstes gesammelten Informationen werden zur Verbesserung von reCAPTCHA und für allgemeine Sicherheitszwecke verwendet. Google wird reCAPTCHA nicht für personalisierte Werbung verwenden. “

Das ist großartig und hoffentlich wird Google sein Versprechen halten. Das Problem ist, dass es keinen Grund gibt zu glauben, dass alles so sein wird. Die Einführung einer solch leistungsstarken Tracking-Technologie ist ein Schritt, der die Aufmerksamkeit der Öffentlichkeit auf sich ziehen sollte, da wir bereits gesehen haben, wie leicht Dinge schief gehen können. Zum Beispiel wurde 2014 versprochen, dass WhatsApp unabhängig bleibt und getrennt von der Facebook-Backend-Infrastruktur arbeitet, aber nur zwei Jahre später wurde diese Entscheidung überarbeitet . Als Google Nest erwarb, wurde uns auch die Unabhängigkeit versprochen, die nur fünf Jahre später aufgegeben wurde : Gerätebesitzer mussten zu einem Google-Konto wechseln oder einige Funktionen aufgeben.

Google könnte dank seiner enormen Ressourcen und seiner großen Reichweite einen Dienst wie reCAPTCHA erstellen. Dies ist jedoch auch der Grund für den Verdacht, dass sich alles zum Schlechten wenden wird.

Leider können wir als Benutzer wenig tun. Sie können die Verwendung von reCAPTCHA nicht ablehnen: Sie müssen entweder zustimmen, dass Sie die von Ihnen benötigte Website weiterverfolgen oder nicht mehr verwenden. Wenn Sie Körperscanner an Flughäfen nicht mögen, können Sie sie zumindest ablehnen und eine regelmäßige Suche durchführen. Wenn die Site jedoch über reCAPTCHA verfügt, können Sie die Verwendung nicht verweigern.

Wenn Google beabsichtigt, solche Tools unter Berücksichtigung des öffentlichen Interesses und nicht des eigenen Gewinns zu erstellen, müssen Unternehmen überzeugendere Wege finden, um anderen zu versichern, dass sie ihr Wort nicht ändern, wenn es zweckmäßig ist. Wenn sie den Quellcode des Projekts öffnen möchten (wie dies bei vielen anderen Produkten der Fall war), ihn aus dem Unternehmen entfernen oder zumindest eine Überwachung durch Dritte einrichten möchten, ist dies möglicherweise ein guter Anfang, um das Vertrauen der Benutzer zu gewinnen.

Über den Übersetzer

Der Artikel wurde von Alconost übersetzt.

Alconost lokalisiert Spiele , Anwendungen und Websites in 70 Sprachen. Muttersprachliche Übersetzer, Sprachtests, Cloud-Plattform mit API, kontinuierliche Lokalisierung, Projektmanager rund um die Uhr, jedes Format von Zeichenfolgenressourcen.

Wir machen auch Werbe- und Schulungsvideos - für Websites, die verkaufen, Image, Werbung, Schulung, Teaser, Expliner, Trailer für Google Play und den App Store.

Lesen Sie mehr

Source: https://habr.com/ru/post/de460573/


All Articles