Bekanntschaften oder Dating sind ewig, sie werden immer in verschiedenen Formen existieren: auf der Straße, im Internet, auf Websites oder in mobilen Anwendungen. Die Menschen werden immer den Wunsch haben, jemanden zu treffen, und jeder wird den für sich bequemsten Weg wählen. Einige lernen sich weiterhin in Bars, Cafés und auf der Straße kennen, andere nutzen moderne Technologien und lernen sich online kennen. Jeder hat seine eigene Wahl und wir werden keine Seite beurteilen, aber die weitere Diskussion dreht sich um Online-Dating.
Beispiele für Dating-AnwendungenWenn Sie nicht auf eine große Anzahl von Betrügereien, Gaunern, Spammern in diesem Segment eingehen, dann suchen die Leute auf Websites oder in mobilen Anwendungen nach einem Paar, und es ist wünschenswert, dass ihr Interesse aneinander wechselseitig ist. Alles, was dieses Kriterium nicht erfüllt, ist Zeitverschwendung auf der einen Seite. Der aus Sicht der Informationsübermittlung am weitesten verbreitete Ansatz sind „Flugblätter“, in denen ein Profil angezeigt wird und der Betrachter entscheiden muss, ob er es mag oder nicht (mögen, nicht mögen). Wenn Ihnen der Fragebogen gefällt, wird sie benachrichtigt, und wenn sie sich gegenseitig interessiert, ist es möglich, einen Dialog zu beginnen. Abweichungen von diesem Schema sind in verschiedenen Anwendungen und an verschiedenen Standorten möglich, das allgemeine Funktionsprinzip sollte jedoch klar sein.
Wie sich herausstellte, vor vielen Jahren von Facebook eingeführt, war es ein sehr leistungsfähiges, motivierendes und praktisches Werkzeug. Ohne Dialog lässt er zu, dass er Interesse an jemandem zeigt und je nach Reaktion nicht auf eine Antwort wartet, sondern weiter sucht. Wenn es eine Reaktion gibt, kann ein Dialog beginnen, aber sein Wert ist viel höher als nur vereinzelte "Grüße", ohne die Gegenseitigkeit zu berücksichtigen.
Ja, Likes haben geholfen, und die Verwendung von gegenseitigem Mitgefühl hat sich auch in den letzten 15 Jahren auf dem Dating-Markt wenig geändert, und dies ist seltsam für die IT-Branche, in der sich auch Online-Dating entwickelt.
Was ist eigentlich das Problem?
Laut Statistik kommen im Durchschnitt 17 Likes auf 100 Abneigungen. Das heißt, eine Person leistet viel mehr nutzlose als nützliche Arbeit und erhält Inhalte, die für sie nicht von Interesse sind. Hierbei werden die aktuellen Filterparameter der Ergebnisse berücksichtigt (Suche nach Stadt, Alter, Interessen und anderen im Profil angegebenen Merkmalen). Es zeigt sich, dass die primäre Handlung der Person in Bezug auf den Fragebogen nicht mit der Kenntnis der Textinformationen zusammenhängt, die der Inhaber des Fragebogens über sich selbst ausgefüllt hat, sondern ausschließlich mit der Wahrnehmung des vorgestellten Fotos (insbesondere des Ganzen oder der Person) zusammenhängt. Eine weitere Bewertung des Gegners erfolgt bereits im nächsten Schritt, wenn sich gegenseitiges Mitgefühl gebildet hat.
Vorlieben, Abneigungen - was ist das Problem?Das ultimative Ziel ist es, die Anzahl der nutzlosen Aktionen der Benutzer zu reduzieren und eine Auswahl von Profilen mit einer besseren Datierungsqualität als zum gegenwärtigen Zeitpunkt zu treffen. Mit einer ausreichend großen Basis zum Erstellen von Statistiken, Analysieren und Testen von Hypothesen sowie zum Trainieren und Verwenden neuronaler Netze haben wir die folgenden zwei Annahmen getroffen und getestet:
- Aber was ist, wenn alle Personen ähnlich sind und wenn Sie die Ergebnisse ähnlicher Personen bei der Auswahl der Profile analysieren, können Sie dann die Qualität dieser Stichprobe verbessern und beeinflussen?
- Kann ein neuronales Netzwerk aus Fotos unsere Präferenzen basierend auf früheren Erfahrungen vorhersagen?
Neuronale Netze beim DatingIm Folgenden werden wir unsere Experimente am Beispiel von Daten aus einer der mobilen Anwendungen im Bereich der Datierung näher beschreiben. Vielen Dank an die Kollegen, die solchen Experimenten, Analysen und der Einführung neuer Technologien zugestimmt haben. Selbstverständlich verstoßen alle vorgenommenen Änderungen und die durchgeführten Versuche in keiner Weise gegen das Bundesgesetz über personenbezogene Daten und die DSGVO.
Lösung 1. Was ist, wenn alle Menschen gleich sind?
Die Annahme und die Hypothese lauten wie folgt: Wenn eine Person jemanden mag, der grundlegende Suchfilter wie Stadt, Altersgruppe und Geschlecht berücksichtigt, passen die Ergebnisse (Auswahl) eines anderen, der dieselbe Person mag, eher zu dem ersten und berücksichtigen Wenn man Hypothesen wiederholt und die Anzahl der Personen erhöht, verbessert sich die Qualität der Stichprobe.
Eine Erweiterung dieser Hypothese ist die Minimierung eingehender Filterparameter nach Geschlecht und Stadt sowie die Berücksichtigung nicht nur ausgehender Vorlieben der von Ihnen gesuchten Personen mit ähnlichen Präferenzen, sondern auch der Reaktionen auf die von ihnen gewünschten Profile.
Hypothesentest. Im Filter werden nur das Geschlecht und die Stadt angegeben. Stichprobenergebnisse mit Abneigungen am Anfang:
- Die ersten vier Profile, die nicht mögen
- Zuerst zwei Likes zu passenden Profilen
- Eine andere Abneigung
- Und bei der vierten Iteration erhält man eine Stichprobe von 5 geeigneten Profilen nach festgelegten Kriterien
Anhand des Experiments wird der Prozess der automatischen Generierung einer Suchabfrage anhand der Meinungen anderer Personen demonstriert, anhand derer die möglichen Präferenzen des aktiven Teilnehmers gebildet werden.
Als Erweiterung dieses Schemas können Abneigungen und Vorlieben in Betracht gezogen werden, um das Porträt der Person sowie das Alter und andere Merkmale der Profile, die in die Stichprobe fallen, zu verdeutlichen.
Verwendete Algorithmuseinstellungen beim Testen einer Hypothese:

Option 2. Und lassen Sie uns das neuronale Netzwerk lernen, um eine Entscheidung für uns zu treffen
Die Annahme und die Hypothese lauten wie folgt: Vielleicht spielt die Person auf dem Foto bei der Auswahl der Personen eine wichtigere Rolle als der allgemeine Hintergrund, der Standort, das Zubehör, die Aufnahmequalität und andere Faktoren. Zum Testen der Hypothese wurde ein Detektor auf Intel OpenVINO mit 1 Million Fotos verwendet. Die Ergebnisse wurden aus den allgemeinen Fotos von Benutzern mit einer parallelen Datenbank von Likes (wer mochte wen und wo diese Likes sind gegenseitig) ermittelt. Das Ergebnis des Detektors und das Aufbringen der wichtigsten Gesichtspunkte auf das Originalbild:

Während des Lernprozesses wurden außerdem im Verlauf des Trainings Paare von Fotografien in verschiedenen Variationen an neuronale Netze übertragen:
- Das erste Foto (Profil) wie das zweite
- Das erste Foto (Profil) wie das zweite und das zweite zuerst
- Das erste Foto (Profil) mag das zweite nicht, und das zweite mag das erste nicht
Das Trainingsbeispiel für den Vergleich anhand von Likes in der Datenbank ist unten dargestellt. Zwei Eingaben in Form von Fotos, die nur dann an das Netzwerk übertragen werden, wenn eine Gleichheit von der ersten zur zweiten eingeht, wenn eine Gleichheit besteht oder wenn keine Gleichheit besteht (für drei verschiedene Netzwerke mit ihrem sequentiellen Training).
Das Ergebnis waren drei neuronale Netze, die mit einer bestimmten Wahrscheinlichkeit die Kompatibilität von Personen auf Fotografien bestimmen können. Der Vorteil dieser Option gegenüber der ersten ist die hohe Suchgeschwindigkeit nach Einstellungen in Fotos und die minimale Anzahl von Abfragen und Abhängigkeiten auf der Ebene der SQL-Abfrage. Mit anderen Worten, die resultierende Lösung ist bei hoher Geschwindigkeit und geringem Verbrauch und Ressourcenbedarf im Inferenzprozess hochproduktiv (nicht zu verwechseln mit dem Lernprozess, bei dem die maximale Leistung von Computersystemen und die Beteiligung vieler GPUs am Prozess erforderlich sind).
Schlussfolgerungen
Wir haben beide Optionen implementiert und sammeln derzeit Statistiken über ihre Wirksamkeit. Es ist merkwürdig, dass sich beide Schemata als wirksam erwiesen haben und das Ergebnis der Ausstellung erheblich verbessern konnten, wodurch die Anzahl der nutzlosen Aktionen seitens der Benutzer verringert wurde. Das Endergebnis für das Unternehmen ist eine Zunahme des Nutzerengagements, eine Zunahme der Gesamtzahl der gegenseitigen Vorlieben und infolgedessen die Anzahl der Käufe von bezahlten Konten.
Jetzt ist die Testbetriebsphase beider Lösungen im Gange und die Algorithmen werden den Benutzern selektiv zur Verfügung gestellt. Wenn Sie jedoch die erste oder zweite Hypothese selbst anhand von Fragebögen testen möchten, registrieren Sie sich in der Anwendung und senden Sie eine E-Mail an dushin@combox.io. Geben Sie Ihren Benutzernamen in der Anwendung in dem Brief an. Zugang gewähren.