Frekuensi menggunakan kata-kata yang berbeda untuk pecandu narkoba / alkoholik / perokok tembakau dibandingkan dengan orang lainMenurut statistik Amerika, 10% dari populasi AS berusia 12 dan lebih tua menderita beberapa bentuk kecanduan - dalam terminologi resmi ini disebut
gangguan penggunaan zat (SUD) (kecanduan). Mungkin, di Federasi Rusia indikator ini jauh lebih tinggi. Menurut
RBC , di sini 10% populasi mengambil minuman pengganti (lotion medis, hawthorn, mesin cuci kaca, palet, dll.), Dan banyak lagi orang yang minum alkohol legal.
Dalam beberapa tahun terakhir, orang-orang mulai menghabiskan banyak waktu di jejaring sosial, tempat mereka berkomunikasi, bertukar pikiran, dll. Ini adalah sejumlah besar informasi yang cukup untuk sistem pembelajaran mesin. Dan ada banyak orang yang kecanduan di jejaring sosial. Berkat pencapaian para ilmuwan, menjadi mungkin untuk secara otomatis mengidentifikasi pecandu narkoba, alkoholik dan perokok dengan kosa kata dan minat budaya mereka (musik, film).
Mungkin di masa depan bahkan penyaringan otomatis para pecandu narkoba di Internet akan dimulai. Misalnya, mereka akan dilarang mendaftar di beberapa situs atau akan diberi ikon khusus di profil.
Spesialis dari Departemen Sistem Informasi di University of Maryland dan Pusat Penelitian untuk Pemulihan Kecanduan di Carillon Research Institute di Virginia Polytechnic University telah mengembangkan
sistem pembelajaran mesin yang secara otomatis mengidentifikasi orang-orang yang kecanduan, serta orang-orang dengan risiko kecanduan (yaitu, warga negara yang lemah dalam minat mereka. berbeda dengan pecandu narkoba dan alkoholik sejati).
Seperti yang Anda ketahui, kecanduan zat tertentu tak terhindarkan memengaruhi aktivitas sosial seseorang dan berkorelasi dengan ciri kepribadiannya. Misalnya, orang yang terus-menerus merokok tembakau menunjukkan indikator "keterbukaan terhadap pengalaman" yang jauh lebih tinggi, tetapi indikator "niat baik" yang jauh lebih rendah daripada yang bukan perokok (lihat
Campbell et al., 2014 ). Penggunaan alkohol berkorelasi positif dengan sosialitas dan ekstroversi (sebuah
studi oleh Cook et al., 1998 ).
Lusinan karya ilmiah lain juga mengungkapkan hubungan antara penggunaan obat secara konstan dan karakteristik kepribadian dan perilaku sosial. Sangat sering, penggunaan zat berkorelasi dengan berkurangnya "kesadaran" - ini adalah sifat kepribadian yang terkait dengan disiplin diri, kinerja tugas yang cermat dan keinginan untuk mencapai tujuan. Korelasi semacam itu dapat dipahami, karena sifat-sifat karakter inilah yang diperlukan untuk menghilangkan kecanduan narkoba.
Di sisi lain, ilmu pengetahuan juga mengetahui faktor-faktor risiko yang meningkatkan kemungkinan kecanduan - ini adalah usia, jenis kelamin, impulsif, keinginan untuk kesenangan, reaksi terhadap kebaruan, kecenderungan untuk berolahraga, dan lingkungan yang buruk (
studi oleh Carroll et al., 2009 ). Faktor-faktor lain yang meningkatkan risiko diketahui, termasuk lingkungan sosial (tetangga), lingkungan keluarga (kerabat), dan norma sosial.
Sebelumnya, para ilmuwan melakukan penelitian dengan menggunakan survei sosial, tetapi sekarang, berkat banyaknya informasi di jejaring sosial, Anda dapat mempelajari perilaku orang tanpa meninggalkan komputer Anda. Untuk sistem pembelajaran mesin, peneliti Amerika menggunakan database yang dikumpulkan dalam kerangka proyek myPersonality dari 2007 hingga 2012. Itu adalah aplikasi populer untuk Facebook, di mana orang lulus tes psikologi dan berbicara secara rinci tentang kepribadian dan kebiasaan mereka, di antaranya adalah pecandu narkoba, pecandu alkohol, dan perokok.
Dengan profil psikologis pengguna Facebook, aktivitas mereka di jejaring sosial dikaitkan - 22 juta pembaruan status dari 153 ribu pengguna. Rata-rata 143 posting dari setiap pengguna, dan jumlah rata-rata kata adalah 1730 per orang. Pengguna yang tidak berbahasa Inggris dan mereka yang menulis kurang dari 500 kata dikecualikan dari database. Ada 21 juta posting dari 106.509 orang. Setelah memfilter kata-kata frekuensi rendah (dengan frekuensi kurang dari 50 dalam database), kamus korpus berjumlah 73.935 kata.
Para peneliti memperhitungkan pengalaman para pendahulu mereka, yang membuktikan bahwa kepribadian seseorang lebih mudah dipelajari bukan dengan kata-katanya, tetapi oleh kesukaannya. Oleh karena itu, mereka juga membuat database suka untuk 5,1 juta pengguna.
Setelah pelatihan, sistem dapat memprediksi dengan sangat akurat adanya kecanduan pada seseorang, terlepas dari apakah ia lulus tes psikologi. Jadi, probabilitas merokok tembakau ditentukan dengan akurasi terbesar 86%, probabilitas penggunaan narkoba adalah 84%, probabilitas konsumsi alkohol 81%.
Selain itu, hasil analisis suka dan frekuensi kata di antara pecandu narkoba dan pecandu alkohol adalah kepentingan ilmiah nyata. Mereka menunjukkan dalam hubungan spesifik apa minat dan perilaku orang yang bergantung berbeda dari minat dan perilaku orang yang tidak menggunakan zat.
Menurut frekuensi penggunaan kata-kata, kecanduan (bercinta, sial) lebih sering terjadi pada orang yang kecanduan (narkoba, tembakau). Di antara minat para pecandu alkohol, film "V is Vendetta" lead, dan pecandu narkoba suka mendengarkan band musik Radiohead, The Cure dan Depeche Mode.

Artikel ilmiah ini
diterbitkan 16 Mei 2017 di situs pracetak arXiv.org (arXiv: 1705.05633).