Großes Interview über Big Data: Warum folgen sie uns in sozialen Netzwerken und wer verkauft unsere Daten?

Haftungsausschluss . Der Big-Data-Spezialist Arthur Khachuyan erklärte, wie soziale Netzwerke unsere Nachrichten lesen können, wie unser Telefon uns belauscht und wer alles braucht. Dieser Artikel ist eine Abschrift eines großartigen Interviews. Es gibt Menschen, die sparen Zeit und lieben Text, es gibt Menschen, die keine Videos bei der Arbeit oder unterwegs ansehen können, aber glücklich lesen Habr, es gibt hörgeschädigte Menschen, für die die Tonspur unzugänglich oder schwer zu verstehen ist. Wir haben uns für alle und Sie entschieden, exzellente Inhalte zu entschlüsseln. Wer das Video bevorzugt, ist der Link am Ende.



Jeden Tag schreiben, suchen und posten wir im Internet und jeden Tag beobachtet uns jemand auf der anderen Seite des Bildschirms. Spezielle Programme scannen Fotos, Likes und Texte, um unsere Daten an Werbefirmen oder die Polizei zu verkaufen. Man kann es Paranoia oder Science Fiction nennen, aber das Telefon, der soziale Kreis, die Korrespondenz oder die Orientierung sind kein Geheimnis mehr.

Warum fordert die Facebook-Anwendung Zugriff auf Kamera, Mikrofon und Kontakte an?


Interviewer: - Ich werde ein kleines Beispiel geben. Womit wir uns einverstanden erklären, wenn wir die Facebook-Anwendung auf das Smartphone stellen. So hat es Zugriff auf Daten: über Kontakte, über das Ausführen von Anwendungen, über Dateien auf USB-Laufwerken, hat uneingeschränkten Zugriff auf das Internet, kann beim Einschalten des Smartphones gestartet werden, Hintergrundbilder ändern, Dateien herunterladen, SMS auf Anfrage anzeigen, Videos aufnehmen, Anrufe tätigen, Ton aufnehmen. Warum ist das alles notwendig?

Arthur Khachuyan: - Tatsächlich gibt es unter jeder dieser Funktionen eine echte Facebook-Funktion, unter jeder dieser Anforderungen. Und Facebook wird sagen, dass dies alles natürlich nötig ist, um die Interaktion mit der Anwendung zu verbessern. Wir alle wissen jedoch, dass dies geschieht, um Daten zu sammeln.

Zeichnen Apps unsere Gespräche auf?


Tatsächlich gibt es hier auch eine so feine Linie - jetzt möchte ich Ihnen ein Beispiel geben: Es gibt Leute, die sehr, sehr "paranoid" sind, weil "ich etwas gesagt habe, der Yandex" -Navigator es gehört hat und ich angefangen habe, Anzeigen zu bekommen "Oder bedingtes" Facebook "(es spielt keine Rolle) -" Ich sagte irgendwo, meine Bewerbung sei auf dem Tisch "...

Es gibt sozusagen drei Arten der Entwicklung ... dieser paranoiden Geschichte. Erstens schien es den Leuten nur so, als hätten sie vergessen, dass irgendwann ein Teil des Inhalts konsumiert wurde, oder sie fielen einfach in eine statistische Stichprobe, dass Leute in ihrem Alter, ihren Interessen und ihren Verhaltensmustern derzeit an Englischkursen interessiert sein sollten. Sie sagten dort etwas und es scheint ihnen, dass jemand sie beobachtet.

Werden unsere Beiträge in sozialen Netzwerken gelesen?


Aber es gibt tatsächlich eine zweite Geschichte, ich habe solche Experimente viele Male durchgeführt: Zwei saubere Accounts werden in sozialen Netzwerken erstellt, eine Nachricht wird von einem zum anderen geschrieben, wie "ein Freund ging nach Syktyvkar" (ich erzähle das alles im Scherz, ich weiß es nicht im Leben, wo Syktyvkar), aber nach zwei oder drei Tagen beginnen Sie, Werbung über Touren dort zu erhalten. Das heißt, das soziale Netzwerk scannt private Nachrichten, was gegen die Vereinbarung zu verstoßen scheint, aber Sie können es nicht beweisen. Und gestartete mobile Anwendungen sammeln sich sehr oft, um tatsächlich das Einkommen dieser Person zu verstehen. Die Jungs haben eine Menge solcher Nachforschungen angestellt: Weißt du, ruf ein Taxi vom selben Ort von "iPhone" und "Android" an, und ein anderes Preisschild gibt einer Taxiflotte die Möglichkeit, die Plattform zu bestimmen, die laufenden Anwendungen zu bestimmen ... Okay, bestimme zuerst die Plattform und verstehe wer braucht welchen wert für die plattform.

Wie Anwendungen alles über eine Person erzählen können


Und das Ausführen von Anwendungen ist im Allgemeinen eine solche Funktion, mit der Sie viel über eine Person sagen können. Wie verstehen wir, wer er ist? Durch den Inhalt, den es verbraucht. Anhand der installierten Anwendungen können wir alles verstehen, bis hin zur sexuellen Orientierung. Welche Anwendungen installiert sind, liegt dementsprechend im eigentlichen Interesse dieser Person. Das heißt, wenn er eine Art "Zubehör" für das Chartern von Privatflugzeugen installiert hat - okay. Wenn Sie eine Art "Buchung", "Avita", andere Anwendungen zum Verkauf installiert haben oder es viele Anwendungen für einige günstige Einkäufe und Rabatte, Cashbacks gibt - im Allgemeinen verstehen Sie selbst. Wenn Sie jetzt selbst Ihre Bewerbungen sehen ...

Wie man nichts ins Internet stellt und trotzdem da ist


I .: - Oder ist er ein Gamer?
A. Kh .: - Ja, natürlich können Sie sofort verstehen. Es ist elementar, bei welcher Bank er ein Konto hat.
Ich.: - Hören Sie, lassen Sie uns zunächst ein Geheimnis für alle eröffnen, dass nicht nur seine Abonnenten es sehen, wenn jemand etwas in sein soziales Netzwerk schreibt oder ein Foto veröffentlicht.
A. Kh .: - Ja, das stimmt. Ich zeige immer ein so großes Bild, in dem ein Porträt des durchschnittlichen russischen Nutzers sozialer Netzwerke zu sehen ist. Dort hat er, seine Freunde, Freunde von Freunden, Freunde von Freunden bis zum dritten Knie. Dies ist ein riesiges Publikum, etwa achthunderttausend Benutzer, die den Inhalt dieser Person gelegentlich zufällig sehen (aufgrund moderner integrierter Feeds in sozialen Netzwerken). Der größte Fehler des Neulings ist jedoch, dass eine Person möglicherweise überhaupt keinen Account in sozialen Netzwerken hat aber er ist irgendwo zu einer Veranstaltung gegangen, sie haben ein Foto von ihm gemacht, er hat dort etwas gemacht, dann haben sie es gepostet und dementsprechend ist einiges Wissen in diese riesige Datenbank von Open-Source-Quellen gelangt.
I .: - Das heißt, er kann in einem Restaurant sitzen oder auf einer Kundgebung sein und sich im Hintergrund einer Art Foto befinden - das System erkennt ihn ...
A. Kh.: - Vorne macht ein junges Mädchen ein Selfie mit ihrer 6-Megapixel-Frontkamera, und das war's auch schon ...

Welche Daten werden auf meinen Fotos in sozialen Netzwerken gesammelt


Das heißt, wir extrahieren auch in diesem Fall mit einem Foto das Wissen über diese Person und vergleichen dieses Wissen mit anderen erhaltenen Fotos, dh „diese Maschine gehört Ihnen oder gehört Ihnen nicht“, dh wenn Sie sie anderthalb Jahre lang veröffentlicht haben Mindestens fünf Mal gab es ein und dieselbe Nummer, Marke, Farbe ... Sie war nicht auf "Avto.ru", "Drom.ru", sie ist nicht unter Ihren Freunden - dann werden wir Ihnen dieses Auto zuweisen.

Ich.: - Und du wirst meinen ungefähren Reichtum verstehen?
A. Kh .: - Ja. Oder später, wenn Sie die Moskauer Ringstraße umrunden und von einer so großen „digitalen Superseite“ (großem Fernseher) begrüßt werden, auf der fast jeder Autonummern erkennt. Dreihundert Meter lang erkennen sie die Nummer Ihres Autos, geben sie uns und wir sagen Ihnen, welche Art von Werbung Sie zeigen sollen.
I .: - Erhalten Sie Daten von jeder Plakatwand, in die die Kamera eingebaut ist?
A. Kh .: - Nein, wir haben einen Partner, einen der größten Anbieter von Außenwerbung, wir haben eine API, sie geben uns die Nummer des Autos - wir sagen, an welchen Inhalten diese Person interessiert war. Das ist hier aus geschäftlicher Sicht eine Lösung für zwei Probleme: um keine Werbung für etwas zu zeigen, auf das eine Person bereits gestoßen ist; Wählen Sie dementsprechend im Stream 80 bis 90 Prozent der Personen mit ähnlichen Interessen aus und zeigen Sie ihnen bestimmte Inhalte.

Wie und warum berechnen Unternehmen meinen Standort?


Jetzt die lebhafteste Geschichte (nicht unsere) - sie ist mit der Analyse von "Wi-Fi" verbunden. In allen Einkaufszentren wird bei der Ankunft einer Person, die sich mit dem "Wi-Fi" verbindet, deren Mac-Adresse überwacht - wir können nachvollziehen, wie sich die Person bewegt hat. Dies ist eine sehr spezifische dunkle Materie, da es den Anschein hat, als hätten Hardwareanbieter neue Protokolle eingeführt, die eine solche Nachverfolgung stören, und es scheint, als hätte Apple dieses Protokoll nicht sehr gut implementiert, und Sie können tatsächlich diese Mac-Adressen erhalten bzw. nachverfolgen, wie Die Person bewegte sich.

Wie kann ich mein Gehalt anhand meines Standorts berechnen?


Und dann teilt dieses Metropolis-Einkaufszentrum, in dem dieses System steht, unter bestimmten Bedingungen Daten mit der bedingten „inpo-analytics“ (unter bestimmten Bedingungen der Betreiber aller dieser Daten in der U-Bahn). Und wir können verstehen, an welchem ​​Bahnhof Sie gesessen haben und an welchem ​​Sie abgereist sind. Wenn Sie also mehrere Tage lang Daten über sich sammeln, können Sie verstehen, wo Sie leben, wo Sie arbeiten - für fast alle: Was näher ist, ist Arbeit, was als nächstes kommt, ist zu Hause. Dementsprechend können Sie verstehen, ob Sie in der Nähe der Metropole leben oder nicht, wie oft Sie umziehen. Im Allgemeinen kann man, wenn eine Person die U-Bahn betritt und verlässt, ihren Verhaltensstil verstehen - einen Arbeiter, einen Studenten, Besucher, Mütter mit Kindern ... Nun, es gibt tatsächlich statistische Abhängigkeiten. Wenn wir dieses Beispiel entsprechend verfeinern, können wir verstehen, wo welche Person arbeitet. Fügen Sie dort außerdem seine Fotos aus sozialen Netzwerken hinzu. Sobald wir dann verstehen, wo er arbeitet, können Sie seine Position durch einige Parameter dort ungefähr verstehen; Vergleichen Sie es dann mit dem Headhunter SuperJob, und verstehen Sie das Durchschnittsgehalt für diesen Ort, für diese Position. Somit wird entsprechend Wissen gewonnen.

Ich.: - Biete ihm unter bestimmten Bedingungen einen Kredit an.
A. Kh .: - Ja, ja. Dann wird er in ein Land reisen, dort irgendwo einchecken, auf demselben Facebook ein Foto machen - „Ich fliege von Sheremetyevo nach Panama“. Sie können sich den Skyscanner ansehen, wie viel Tickets an diesem Tag kosten, abhängig von der Anzahl der Anfragen von Personen an ihren Bestimmungsort, wie viel das Hotel kostet - und dementsprechend nachvollziehen, wie viel Personen im Urlaub verbringen, wie oft sie reisen, wie viel freies Geld sie haben und Tatsächlich, basierend darauf, machen Sie Vorhersagen und so weiter.
I .: - Kommerzielle Produkte, Bankprodukte verkaufen.
A. Kh .: - Ja. Entweder ein Bankprodukt oder ein Finanzmanagement, oder es wird besteuert, weil der Einzelunternehmer eine Karte an eine juristische Person gebunden hat und Steuern, beispielsweise für 100.000, übergibt und dann ein neues Auto kaufte. Hier. Es gibt auch einen.

Wie künstliche Intelligenz unsere Fotos in sozialen Netzwerken „liest“ und welche Schlussfolgerungen daraus gezogen werden


I .: - Ich poste ein Foto auf Instagram. Darauf bin ich, sagen wir, vor dem Hintergrund eines Autos abgebildet, in der Nähe eines Hauses, ich bin in bestimmten Kleidern gekleidet. Wie sehen mich diese künstlichen Algorithmen an und was verstehen sie?
A. Kh .: - Okay, wir sind zur Seite gegangen, haben dieses Foto gesammelt. Das erste, was getan wird, ist, dass Ihr Gesicht hervorsticht, um zu verstehen, ob Sie es sind oder nicht, ob es Ihr Konto ist. Vielleicht hat jemand anderes das Foto gemacht, oder Sie haben ein Foto von jemandem gemacht. Der nächste Schritt sind tatsächlich "Faltungs" -Netzwerke zur Mustererkennung (Computer Vision). Unsere Aufgabe ist es zu verstehen, was auf dem Foto ist? Viele Dinge können nicht verstanden werden. Wir müssen das Auto, die Farbe und die Marke verstehen und dementsprechend die Nummer erkennen. Sie können die Farbe der Oberbekleidung verstehen; möglicherweise Stil; möglicherweise mit einer Genauigkeit von 70–80% Frisur. Irgendwie so. Wenn eine Person dieses Selfie gemacht hat, können Sie die Farbe der Augen bestimmen.
I .: - Und wie können wir eine Frisur verwenden?
A. Kh .: - Nun, die Länge der Haare ... Oh, Sie wissen, "Beauty" -Marken sind verrückt danach. Einige Shampoos werden an bestimmte Frauen mit einer bestimmten Haarfarbe verkauft.
I .: - Können Sie die Champagnermarke auf dem Tisch nennen?
A. Kh .: - Ja. Sie können nicht nur die Champagnermarke bestimmen. Sie können bestimmen, um welche Art von Alkohol es sich handelt. Das heißt, ein Glas Wein kann identifiziert werden. Wenn keine Flasche vorhanden ist, kann die Marke nicht bestimmt werden. Aber für die meisten Alkohole sind die Flaschen spezifisch - dort Jack Daniels mit einer bestimmten Form ... und so weiter. Anhand der Bilder können Sie nachvollziehen, was es war, und eine Probe davon anfertigen, was die Leute trinken. Es gibt so viele gewerbliche Kunden, die nach Menschen fragen, die beispielsweise mit Coca-Cola und Jack Daniels eine Party zu Hause feiern möchten. und dann machen sie etwas mit ihnen. Irgendwie so.

Das heißt, eine Marke gibt einer Person ein Geschenk. Er denkt: „Oh, wie cool! Sie haben mich aus Versehen ausgewählt! “ Tatsächlich war das alles kein Zufall. Sein Potenzial wurde geschätzt, um ein neues Publikum anzuziehen, Kommunikation, Geschwindigkeit der Verteilung von Inhalten, 50 verschiedene Metriken.

Welche künstliche Intelligenz denkt über Timatis Wohlstand nach, wenn er sein Foto mit Lada Priora betrachtet


Hören Sie, ich biete Ihnen ein kleines Spiel an. Ich zeige Ihnen Fotos, die für Instagram beliebt oder typisch sind, und Sie sagen mir, welche künstliche Intelligenz darauf zu sehen ist und welche Schlussfolgerungen zu ziehen sind. Beginnen wir: zuerst.



A. Kh .: - Ich denke, der Kleidungsstil, die Marke des Autos, der Ort können verstanden werden. Hier gibt es einen Feuerlöscher. Sie können 100% verstehen, dass dies Parken ist. Supermarktparken, beurteilt anhand des Fotos, beurteilt anhand des Pakets. Ich würde anstelle von künstlicher Intelligenz 100% in Taxifahrern aufgezeichnet werden. Aber „klug“, sagen wir mal so, sein Aussehen (was Kleidung bedeutet), seine Automarke und seine blauen Taschen würden in eine bestimmte Bevölkerungsklasse mit einem Einkommen von 50-80.000 fallen ...
I .: - Mikrokredite, ein preiswertes Auto ...
A. Kh .: - Ja, ja, ja.

Wie kann ich Daten über eine Person sammeln, die noch nicht geboren wurde?


I .: - Eines der beliebtesten Fotos auf Instagram - Es war das erste bis letztes Jahr, als etwas anderes populäreres auftauchte.



A. Kh .: - Hier ist alles klar. Hier ist die Hauptschlussfolgerung, die gemacht wird, Schwangerschaft. Der Algorithmus bewertet den Monat dieses Mädchens entweder anhand eines Fotos oder höchstwahrscheinlich anhand von ... Schwangere Frauen machen mindestens einmal einen Text wie "Jungs, wir sind im dritten Monat" oder "Wir warten auf ein Wunder". Aber das Gleiche kann man mit der Fotografie machen.
I .: - Ist es möglich, den Monat durch den Text oder das Volumen des Abdomens zu bestimmen?
A. Kh .: - Ja, ja. Ja Es wird eine sehr kleine medizinische Probe gemacht ... Für das, was gemacht wird: Wir bestimmen das Datum der geplanten Geburt. Dementsprechend werden wir wissen, wann das Kind sechs Monate, acht Monate, ein Jahr, zwei, drei, fünf Jahre alt sein wird ...
Ich.: - Und fünfundzwanzig!
A. Kh .: - Ja, ja. Und in jedem dieser Momente wird Mutter bestimmtes Material angeboten: Babykleidung, Windeln für Zweijährige, für Zweimonatige und so weiter und so fort. Vor allem aber, eine gewisse Reserve für die Zukunft, werden wir das Geburtsdatum des Kindes bereits kennen. Zuerst Plus oder Minus, dann haben wir bereits damit begonnen, Daten über dieses Kind zu sammeln, wenn sie eine zusätzliche Veröffentlichung zur Klärung liefern. Er wurde noch nicht geboren und wir hatten bereits einige Kenntnisse über ihn. Dies ist natürlich eine schreckliche Geschichte in Bezug auf einen schwarzen Spiegel.

Welche Daten werden von einem Foto von Ramzan Kadyrov gesammelt


I .: - Was kann man von diesem Foto verstehen?



A. Kh.: - Tatsächlich werden die Menschen hier auf Kosten der Waffen sofort ihr "Gewicht des Extremismus" erlangen. Das Erkennen von Waffen auf Fotografien, das sofortige Erkennen von Waffen auf Fotografien wird in der "Geschichte" sehr häufig verwendet. Das heißt, sie haben sofort ein Häkchen angezeigt, dass sie mit der Waffe "ein Foto gemacht" haben. Und wenn diese Person ein gewisses Maß an Gefahr erlangt, werden diese Signale sofort an die Behörden gesendet, die den Waffenumlauf kontrollieren, denn ... Das ist "Kalaschnikow", verstehe ich das richtig? Es ist wie eine Schusswaffe, die hier verboten ist. Na trotzdem. Ja, ein paar Leute. Ich weiß nicht, ob der Benutzer hier einen Avatar hat.
I .: - Der Benutzer ist tatsächlich Ramzan Kadyrov selbst, aber er hat sein Profil gelöscht.
A. Kh .: - Ja, okay. Nun, das ist in der Geschichte, dementsprechend wird alles bleiben. Dieses Maschinengewehr ist nicht zu erkennen, aber diese "Kalaschnikow" ist definitiv möglich.
I .: - Und wenn es ein Spielzeug ist?
A. Kh .: - Nun, es gibt noch bestimmte Dinge. Bei Spielzeug ist der Gürtel in der Regel nicht so grün ... Ich bin kein Experte in diesem Bereich. Ich weiß, dass wir eine ziemlich gut geschärfte Anerkennung von Waffen haben. Hier, so scheint es mir, ist etwas Horn modifiziert, das heißt, es gibt ungefähr zehntausend Parameter, es gibt verschiedene Waffen zum Erkennen ... eingeschnitten, modifiziert - irgendwie gibt es immer noch ... Ich bin auf diesem Gebiet nicht besonders.

Warum es schlecht ist, mit anderen Autos zu fotografieren


I .: - Ein Mädchen mit einem teuren Oldtimer.



A. Kh .: - Mit einem teuren Oldtimer ohne Kennzeichen. Höchstwahrscheinlich kann das Automodell erkannt werden. Aber hier ist es deutlich sichtbar - es gibt Algorithmen, die den Horizont nach Geschlecht erkennen. Das heißt, hier ist deutlich zu erkennen, dass sich das Auto deutlich über dem Boden befindet, das heißt, es wird angezeigt, und es gibt keine Nummer. Außerdem ist dies höchstwahrscheinlich das einzige Foto mit diesem Auto, und höchstwahrscheinlich befindet sich dasselbe Auto auf anderen Fotos in dieser Geolokalisierung wird nicht als ihr anerkannt. Ich sehe, dass man hier im Hintergrund verstehen kann, was für ein Land es ist, weil es eine bestimmte Sprache ist. Ich verstehe, dass dies eine Art Tschechische Republik ist, oder? Plaza de Skopice ... Nun, so etwas ist es. Aus dem Text, aus der Linguistik, können Sie verstehen, was für ein Land dies ist, wenn es dort keinen Geographen gibt. Über eine Person kann nicht mehr gesagt werden, außer über Kleidung und so weiter. Aber auch dies ist der Rest eines solch bedingt städtischen Touristentyps, der es liebt zu reisen. Irgendwie so. Tatsächlich unterschätzen Menschen, die auf diese Weise mit teuren Geschenken, mit teuren Autos fotografiert werden, immer das Niveau des Wohlstands. Ich weiß nicht warum, aber statistisch gesehen ist dies in der Regel der Fall.
I .: - Weiter. Instagram.

Was sagt Instagram Medwedew?




A. Kh .: - Zwei Männer. Das erste, was wir feststellen müssen, ist, wessen Konto es ist. Das sind ganz normale Leute. Welches Wissen wird also gewonnen? Dass diese Menschen sich in der Natur entspannen, ist eine weit verbreitete Kategorie für Menschen, die sich gerne in der Natur entspannen. Dementsprechend können sie in sehr seltsame Segmente fallen - zum Beispiel Sommerbewohner. Sie haben eine Sommerhäuschensaison - ich weiß es nicht, sie verkaufen Videoüberwachung und juristische Dienstleistungen. Nun, im Allgemeinen haben die Sommerbewohner ein bestimmtes Verhaltensmuster.
I .: - Sie sagten: Bestimmen Sie den Besitzer des Kontos. Vladimir Putin hat kein Instagram und es gibt keine öffentlich zugänglichen Daten.
A. Kh .: - Und so wäre er auch im Sommer Bewohner. Nun, wenn es nicht Wladimir Putin gewesen wäre, sondern eine andere Person, die beispielsweise sein Freund fotografiert hatte, dann wäre auch sein Wissen über ihn aufgetaucht.

Was können wir über soziale Netzwerke über Putin lernen?


I .: - Wenn wir die im Netzwerk bekannten Informationen über ihn unter Verwendung aller möglichen Algorithmen analysieren, was könnten wir aus den Ergebnissen dieser Studie über Wladimir Putin lernen?
A. Kh .: - Mir scheint, wir hätten tatsächlich zu viel gelernt. Die Kosten (bezogen auf die Maschinenstunden) für die Verarbeitung aller Informationen über Wladimir Putin würden die wirtschaftliche Wirksamkeit dieser Anfrage übersteigen.
I .: - Aber wenn wir die Personen, die auf seinen Fotografien, einigen Objekten usw. abgebildet sind, aufnehmen und analysieren, können wir diese Daten vergleichen und ein interessantes Ergebnis erzielen. Was denken Sie?
A. Kh.: - Es ist für Vladimir Vladimirovich nicht besonders interessant, aber wir haben solche Studien viele Male an verschiedenen Beamten durchgeführt (ich kann Ihnen später ein Beispiel der Studie zeigen): Wir haben zehntausend der größten öffentlichen Beschaffungen von Unserem Russland, Volk, abgenommen welche diese Käufe platzieren, produzieren; und da haben sie versucht, aus den zehntausend Staatskäufen eine Karte aus Fotos und Mitteilungen zu erstellen (ich habe ein solches Projekt - "Interaktive Karte") - es ist dort sehr interessant (ich werde es Ihnen später zeigen). Dort gruppieren sich alle Menschen zu solchen Haufen, Clustern und handeln nur noch untereinander. Aus irgendeinem Grund stimmte ihre Präsenz auf allen möglichen Fotografien, Yachten, Mitteilungen usw. mit der Art und Weise überein, wie sie Regierungskäufe tätigten. Warum es passiert ist, wissen wir nicht.

Wo verkaufen wir unsere Daten und warum?


I .: - Wir haben herausgefunden, dass diese Informationen aus dem Netzwerk entnommen werden können. Wie kann es verwendet werden?
A. Kh .: - Es gibt viele verschiedene Fälle - gut, schlecht und so weiter. Die meisten Leute auf der ersten Ebene versuchen, einige Kontaktinformationen zu sammeln, eine bedingte Spam-Datenbank zu sammeln, sie an jemanden dort zu verkaufen, irgendwo dort und so weiter. – - , , . – . - - , , - , , . , , , , , , , . .


.: - . , , , , , , , ? .



. .: – , . , ( «» )… , , , , , . , .
.: – ? ?


. .: – , , – , . . , . , - , , . - – , «», - , , , ( «» – ). , , , .

«» , «» « », , « » (4400 )… - 600 – , . : - 70–75 , – - , - – «», - – . , .

, : , . , , – , , .

.: – , , , ? , , .

. .: – , , . : , , ? , : , , , . , , , , – . , , , , , , -, , «», , , – . , .


.: – , , , , , – , , , , .

. .: – . , : - – . : - : , «» , – «» , «» . , , - .
.: – «» – ?
. .: – , . , : , , . «» - ! , , . , , . , , , . , , , , , «».


( ). « . : « , ». : , - . - , : , . ( , «» , ), . , , , , – «» . , 5- « – , , », - …

, , . – , , , … , … . , «»? , , ? , - .



.: – , , , … - « »?
. .: – , «» : 30 , - , : , , ( - ). , , - 99,8% : , ? , : , , . , . , – , , - . – , .


.: – , , «», …
. .: – -.
.: – «», … , , ?
. .: – , , , , , «» «» . , , , . , , .


( , ). «» – -. . : — , , – , , -. , . , .

.: – , …
. .: – . - , , , . , «» . , .


.: – «» – .
. .: – , . – «» «» «», , , : , … - . , , , . , , , – . Irgendwie so. . … , .
.: – ?
. .: – , . . , . … , , . .


.: – – , ? .
. .: – , , .
.: – , – Big data?
. .: – , -. : , – , , , . , – , - , , . . , , – , , – , . - , , - . , - .


, , , : -, ; -, - . , 30-40% , .

.: – , ?
. .: – . «-» , - - , : . «», - «»… , . . : . , - - , , – , . , – , : , , - – , : , , () , – () .

, , - , , .


Ich.: - Sagen Sie mir bitte, wie suchen Sie nach unsozialen Elementen - Pädophilen, Wahnsinnigen, Mördern? Ist es überhaupt möglich vorherzusagen, dass dies passieren wird, dass eine Person ein Verbrechen begeht oder wie man es effektiv verhindert?

A. Kh .: - Das Thema Kriminalprävention ist heute eines der aktivsten der Welt. Wir investieren sehr aktiv in diese Geschichte und versuchen, sie zu transformieren. Der Hauptfall, den wir haben, ist ein System für die Vermittlung von Lehrkräften. Dies ist ein Algorithmus, der morgens Informationen "generiert", wo der Patrouillendienst abhängig von der Aufgabe platziert werden soll. Ob wir aus den Fans Kapital schlagen wollen oder die kriminogene Aktivität (Diebstahl, Gewalt) reduzieren wollen oder ob wir Drogenhändler fangen wollen. Das heißt, wir sammeln eine Reihe von Daten, ziehen daraus Schlussfolgerungen, sehen uns unsere historischen Statistiken an und sagen: Hier, hier, hier, zu dieser und jener Zeit sollten sie diesen Weg gehen; und wir reduzieren unser Ziel.

Unser Maximum in den Vororten ... Wie viel haben wir getan? Naja, irgendwo um die 7-8% - wir haben die kriminellen Aktivitäten irgendwo reduziert - das sind Hausdiebstähle, das sind Straßenüberfälle. Dies ist der maximale Indikator, den wir bisher erreicht haben.

Was die Wahnsinnigen und all die anderen betrifft, wenn wir zusätzliche Beweise sammeln - hier ist der Standardfall: Hier ist der durchschnittliche Ermittler, er hat eine Art Mord; Alles, was er von einem Mobilfunkbetreiber verlangen kann, wenn der Test anderthalb Jahre nach dem Test stattfindet, wird er es erhalten. Ich weiß nicht ... 300.000 Handynummern um einen bestimmten Geo-Punkt. Er kann nichts mit ihnen machen. Er lädt uns diese Nummern hoch, wir können dementsprechend 5-7 von ihnen Personen zurücklassen, die irgendwie verbunden waren, in ihrer Nähe waren, mit denen man reden kann und so weiter. Und alles andere, vielleicht fuhren sie nur an Autos vorbei.

Es gibt auch eine Geschichte über Fans, auch eine sehr beliebte Geschichte. Im Moment vor der Meisterschaft kaufen die Stadien von uns Fernerkennungssysteme, um: Wenn ein verprügelter Fan das Gelände besucht - und sie sagen ihm -, dass es keine Tickets gibt oder er später ins Stadion kommt, erkennen sie ihn dort und lassen ihn nicht herein, weil er schrieb in seinem Instagram, dass "wir morgen die Russen nass machen werden", dort auf der "Lokomotive" ... Das ist so etwas.

Was Pädophile betrifft, sind wir leider schon lange mit diesem Thema beschäftigt, und es gibt ein sehr großes Problem. Vor ungefähr vier Jahren haben wir damit begonnen: Wir haben Bots erstellt, die im Internet surfen, mit älteren Männern in bestimmten Foren kommunizieren und versuchen, irgendwie mit ihnen zu kommunizieren. Einige Faktoren heben deren Verhalten, Anforderungen usw. hervor. Es hat zu gut funktioniert: Es wurden zu viele Personen gefunden - so viele Personen, die unser Strafverfolgungssystem nicht durchlassen kann. Und am wichtigsten ist, dass nach der aktuellen Gesetzgebung eine Person nicht wie in sozialen Netzwerken angelegt werden kann, und das ist gut, betone ich - gut. Und egal wie Sie eine Person hinter die Absicht setzen können, eine Handlung zu begehen. Das heißt, in diesem Fall können wir nur eine Empfehlung generieren, und dann sollte der Bezirkspolizist gehen und jemandes Hand fangen. Und das funktioniert 100.000 Mal langsamer als der Algorithmus.

Kann ich meine Daten dauerhaft aus dem Internet löschen?


I .: - Kann ich etwas aus dem Internet entfernen oder ist es absolut? ..
A. Kh .: - Dies ist fast unmöglich, da es notwendig sein wird, mit jedem Besitzer jeder Ressource zu kommunizieren. Es gibt ein sogenanntes Vergessensgesetz, das jeden dazu zu zwingen scheint, aber rechtlich nur für Suchmaschinen gilt. Wir haben persönlich ein Formular auf der Website, mit dem wir Daten über uns selbst löschen können, aber wir können die Erfassung dieser Daten über Personen auch in Zukunft nicht verbieten, da die derzeitige Gesetzgebung nicht sehr gut funktioniert.

Wie können soziale Netzwerke helfen, mein Passwort zu verlieren?


Solche Statistiken sind nach wie vor interessant: Zu Beginn dieses Jahres hat der Internationale Bankenverband erneut einen Überblick über die Informationssicherheit gegeben - ein so interessanter Indikator: Diebstähle von Geldkonten nahmen sechsmal zu, als ein geheimes Passwort geknackt wurde. Das heißt: Denken Sie jetzt über Ihr geheimes Passwort nach ... Was bedeutet es - den Spitznamen des Mädchennamens der Mutter des Tieres und überlegen Sie, ob ich diese Daten aus offenen Quellen herausfinden kann? Kann ich den Spitznamen des Haustiers, das Lieblingsgericht oder den Mädchennamen der Mutter aus offenen Quellen erkennen? Dementsprechend kann ich zur Bank gehen, das Passwort wiederherstellen und Ihre Bank knacken. Hier hat die European Association - sie hat die Diebstähle genau für diesen Artikel 6-mal erhöht, weil die Leute die Antwort "Kosename" eingeben und dann auf Facebook den Namen des Haustieres schreiben. Eigentlich so etwas. Mir scheint, dass in fünf Jahren der Albtraum überhaupt noch passieren wird, denn die aktuelle Generation - sie versteht nicht, dass soziale Netzwerke für immer bestehen, dass es offen ist, dass wenn jetzt ein Mädchen betrunken auf dem Tisch tanzt und sie nach 20 Jahren Klassenlehrerin wird , dann können alle Kinder dieses Video aus den Archiven finden und dann mit der Erpressung beginnen.

I .: - Sie fühlen sich nicht so ... ein böses Genie, weil Sie die Daten von Menschen nicht im eigenen Interesse verarbeiten, sondern von einem so bedingten "großen Bruder"?

A. Kh .: - Es gibt so etwas, ja, aber ich habe so eine Entschuldigung, dass ich mein eigenes Gewissen beruhige: Nehmen Sie zum Beispiel einen Fall - eine Person wird wegen Schwellung gefeuert (dies ist eine absolut reale Geschichte), die Person wurde gefeuert (Nun, da hat er den Betrunkenen in die Geschichte gesetzt und ihn verbrannt und gefeuert). Mein Konzept lautet wie folgt: Wenn der Arbeitgeber ihm folgen möchte, folgt er ihm, Open Source oder Closed Source. Wenn der Staat eine Person überwachen will, kann er dies auf irgendeine Weise tun - er kann sie abhören oder seine öffentlichen Fotos sehen. In diesem Fall bin ich die Marke Kalaschnikow. Sie können tausend Menschen mit einem Bleistift töten oder sie mit einem Maschinengewehr abschießen. Schlimm, traurig, aber ich als Ingenieur halte mich an das Konzept, dass nicht Waffen Menschen töten, sondern Menschen. Die Frage ist, wer diese Daten erhält und wie er darüber verfügt.

Aber natürlich sind alle mit meinem Konzept nicht einverstanden. Sie glauben (zitiere ich aus den Kommentaren auf Facebook): "Hitler hat sich in gleicher Weise gerechtfertigt!" oder "Auf die gleiche Weise, wie die Essessen Ausreden machten!" Die Daten, mit denen wir arbeiten - die Leute selbst haben sie an die Öffentlichkeit geschickt; Wir haben gerade gelernt, wie man daraus Fakten gewinnt.

Wie Dating-Apps effektiver werden


Ich.: - Es scheint mir, dass Sie noch mehr Geld verdienen können, wenn Sie nur ein Paar für Leute suchen, die auf einer steileren Ebene perfekt sind als Tinder oder irgendjemand anderes.
A. Kh .: - Ja, warte bis zum Ende des Jahres - wir arbeiten gerade an einem Dating-Antrag.
Ich.: - Das heißt, die Menschen werden immer noch glücklicher sein, glücklicher? ..
A. Kh.: - Meine ideale Bewerbung für Dating ist nicht Zunder, keine Fleischerei, meine ideale Bewerbung ist, wenn Sie sich eingeloggt, in einem sozialen Netzwerk eingeloggt (wir haben ein Minimum an Informationen erhalten) und sofort ideale Kandidaten angeboten wurden. In diesem Fall besteht unser Hauptproblem darin, die aktuelle emotionale und mentale Phase eines Menschen zu bestimmen, um zu verstehen, wen er speziell auswählen sollte. Was er jetzt braucht: Sex auf einmal, die Liebe seines Lebens und so weiter. Wir arbeiten schon seit geraumer Zeit an diesem Thema.

Unerwartete Ergebnisse der Prostituiertenforschung


Ich.: - Hören Sie, wie können Sie eine Person, die sofort Sex braucht, in ihren sozialen Netzwerken auf Fotos identifizieren?
A. Kh .: - Fotos ... Nun, es ist schwer zu sagen. Es gibt so einen Durchschnitt, vielleicht eine Idee von jemandem: Bilder von Alkohol sind ein einsamer Junggeselle, der sich Pornos ansieht ... Wir haben lange geforscht: Wir haben 20 bis 30.000 Prostituierte von verschiedenen Standorten genommen, sie wurden in sozialen Netzwerken „verglichen“ und recherchiert. welche Universitäten sie absolvierten. Nun, dementsprechend haben wir beobachtet, wie sie mit Menschen kommunizieren.
I .: - Sie suchten also eine Beziehung zwischen Bildung und ihrer Situation?
A. Kh. - Ja. Es gibt wirklich keine Sucht. Im Allgemeinen. Wie in MGIMO gibt es solche Mädchen und Jungen, so in irgendeiner Universität von Uryupinsky. Es gibt keine Sucht.
I .: - Ist es ein nationaler Beruf?
A. Kh .: - Ja. Der älteste Volksberuf.


Fernsehserie im Thema


Nachdem ich das Interview gelesen habe, erinnere ich mich unfreiwillig an die Serie - Person of Interest . Wir empfehlen es allen anzusehen.



Vielleicht ist die Zukunft schon gekommen und wir sind alle in Sicht, Verdächtige.

Ein bisschen Werbung :)


Vielen Dank für Ihren Aufenthalt bei uns. Mögen Sie unsere Artikel? Möchten Sie weitere interessante Materialien sehen? Unterstützen Sie uns, indem Sie eine Bestellung aufgeben oder Ihren Freunden empfehlen, Cloud-VPS für Entwickler ab 4,99 US-Dollar , ein 30-prozentiger Rabatt für Habr-Benutzer auf ein einzigartiges Analogon von Einstiegsservern, das wir für Sie erfunden haben: Die ganze Wahrheit über VPS (KVM) E5-2650 v4 (6 Kerne) 10 GB DDR4 240 GB SSD 1 Gbit / s ab 20 US-Dollar oder wie man einen Server freigibt? (Optionen sind mit RAID1 und RAID10, bis zu 24 Kernen und bis zu 40 GB DDR4 verfügbar).

Dell R730xd 2 mal günstiger? Nur wir haben 2 x Intel TetraDeca-Core Xeon 2 x E5-2697v3 2,6 GHz 14C 64 GB DDR4 4 x 960 GB SSD 1 Gbit / s 100 TV ab 199 US-Dollar in den Niederlanden! Dell R420 - 2x E5-2430 2,2 GHz 6C 128 GB DDR3 2x960 GB SSD 1 Gbit / s 100 TB - ab 99 US-Dollar! Lesen Sie mehr über das Erstellen von Infrastruktur-Bldg. Klasse mit Dell R730xd E5-2650 v4 Servern für 9.000 Euro für einen Cent?

Source: https://habr.com/ru/post/de475130/


All Articles