Häufigkeit der Verwendung anderer Wörter für Drogenabhängige / Alkoholiker / Tabakraucher im Vergleich zu anderen PersonenLaut amerikanischer Statistik leiden 10% der US-Bevölkerung ab 12 Jahren an irgendeiner Form von Sucht - in der offiziellen Terminologie wird dies als
Substanzstörung (SUD) (Sucht) bezeichnet. Wahrscheinlich ist dieser Indikator in der Russischen Föderation viel höher. Laut
RBC nehmen hier 10% der Bevölkerung Ersatzgetränke (medizinische Lotionen, Weißdorn, Glaswaschmaschinen, Palette usw.) und viele weitere Menschen trinken legalen Alkohol.
In den letzten Jahren verbrachten die Menschen viel Zeit in sozialen Netzwerken, wo sie kommunizieren, Gedanken austauschen usw. Dies ist eine große Menge an Informationen, die für ein maschinelles Lernsystem ausreichen. Und es gibt viele süchtige Menschen in sozialen Netzwerken. Dank der Leistungen von Wissenschaftlern ist es möglich geworden, Drogenabhängige, Alkoholiker und Raucher automatisch anhand ihres Wortschatzes und ihrer kulturellen Interessen (Musik, Filme) zu identifizieren.
Vielleicht wird in Zukunft sogar die automatische Filterung von Drogenabhängigen im Internet beginnen. Beispielsweise ist es ihnen untersagt, sich auf einigen Websites zu registrieren, oder ihnen wird ein spezielles Symbol im Profil zugewiesen.
Spezialisten des Instituts für Informationssysteme der University of Maryland und des Forschungszentrums für Suchterholung am Carillon Research Institute der Virginia Polytechnic University haben
ein maschinelles Lernsystem entwickelt , das süchtig machende Personen sowie suchtgefährdete Personen (dh Bürger mit schwachen Interessen) automatisch identifiziert anders als echte Drogenabhängige und Alkoholiker).
Wie Sie wissen, wirkt sich die Abhängigkeit von bestimmten Substanzen unweigerlich auf die soziale Aktivität eines Menschen aus und korreliert mit seinen Persönlichkeitsmerkmalen. Beispielsweise zeigen Menschen, die ständig Tabak rauchen, einen signifikant höheren Indikator für „Offenheit für Erfahrungen“, aber einen signifikant niedrigeren Indikator für „Treu und Glauben“ als Nichtraucher (siehe
Campbell et al., 2014 ). Alkoholkonsum korreliert positiv mit Sozialität und Extroversion (eine
Studie von Cook et al., 1998 ).
Dutzende anderer wissenschaftlicher Arbeiten haben ebenfalls einen Zusammenhang zwischen dem ständigen Konsum einer Droge und den Merkmalen der Persönlichkeit und des Sozialverhaltens aufgezeigt. Sehr oft korreliert der Gebrauch von Substanzen mit einer verminderten "Gewissenhaftigkeit" - dies ist ein Persönlichkeitsmerkmal, das mit Selbstdisziplin, gewissenhafter Erfüllung von Pflichten und dem Wunsch, ein Ziel zu erreichen, verbunden ist. Eine solche Korrelation ist verständlich, weil es diese Charaktereigenschaften sind, die erforderlich sind, um die Drogenabhängigkeit loszuwerden.
Andererseits kennt die Wissenschaft auch Risikofaktoren, die die Wahrscheinlichkeit einer Sucht erhöhen - dies sind Alter, Geschlecht, Impulsivität, das Verlangen nach Vergnügen, eine Reaktion auf Neuheit, eine Tendenz zur Bewegung und eine schlanke Umgebung (
Studie von Carroll et al., 2009 ). Andere Faktoren, die das Risiko erhöhen, sind bekannt, darunter das soziale Umfeld (Nachbarn), das familiäre Umfeld (Verwandte) und soziale Normen.
Früher haben Wissenschaftler solche Studien mithilfe von sozialen Umfragen durchgeführt. Dank der großen Menge an Informationen in sozialen Netzwerken können Sie jetzt das Verhalten von Menschen untersuchen, ohne Ihren Computer zu verlassen. Für das maschinelle Lernsystem verwendeten amerikanische Forscher die Datenbank, die im Rahmen des myPersonality-Projekts von 2007 bis 2012 gesammelt wurde. Es war eine beliebte Anwendung für Facebook, bei der Menschen psychologische Tests bestanden und ausführlich über ihre Persönlichkeit und Gewohnheiten sprachen, darunter Drogenabhängige, Alkoholiker und Raucher.
Mit den psychologischen Profilen der Facebook-Nutzer war ihre Aktivität im sozialen Netzwerk verbunden - 22 Millionen Statusaktualisierungen von 153.000 Nutzern. Durchschnittlich 143 Beiträge von jedem Benutzer, und die durchschnittliche Anzahl von Wörtern beträgt 1730 pro Person. Nicht englischsprachige Benutzer und Benutzer, die weniger als 500 Wörter geschrieben haben, wurden aus der Datenbank ausgeschlossen. Es gab 21 Millionen Beiträge von 106.509 Personen. Nach dem Filtern von niederfrequenten Wörtern (mit einer Häufigkeit von weniger als 50 in der Datenbank) betrug der Wörterbuchkorpus 73.935 Wörter.
Die Forscher berücksichtigten die Erfahrungen ihrer Vorgänger, die bewiesen, dass die Persönlichkeit eines Menschen nicht durch seine Worte, sondern durch seine Vorlieben leichter zu lernen ist. Daher haben sie auch eine Likes-Datenbank für 5,1 Millionen Benutzer erstellt.
Nach dem Training konnte das System das Vorhandensein einer Sucht bei einer Person mit großer Genauigkeit vorhersagen, unabhängig davon, ob sie psychologische Tests bestanden hatte. Die Wahrscheinlichkeit des Tabakrauchens wird also mit der größten Genauigkeit von 86% bestimmt, die Wahrscheinlichkeit des Drogenkonsums beträgt 84%, die Wahrscheinlichkeit des Alkoholkonsums beträgt 81%.
Darüber hinaus sind die Ergebnisse der Analyse von Vorlieben und Häufigkeit von Wörtern bei Drogenabhängigen und Alkoholikern von echtem wissenschaftlichem Interesse. Sie zeigen, in welchem spezifischen Verhältnis sich die Interessen und das Verhalten der abhängigen Person von den Interessen und dem Verhalten derjenigen unterscheiden, die keine Substanzen verwendet.
Je nach Häufigkeit des Wortgebrauchs ist Sucht (Fick, Scheiße) bei süchtigen Menschen (Drogen, Tabak) häufiger. Unter den Interessen von Alkoholikern führt der Film „V is Vendetta“, und Drogenabhängige hören gerne die Musikbands Radiohead, The Cure und Depeche Mode.

Der wissenschaftliche Artikel wurde am 16. Mai 2017 auf der Preprint-Website arXiv.org (arXiv: 1705.05633) veröffentlicht.