Frequência de uso de palavras diferentes para viciados em drogas / alcoólatras / fumantes de tabaco em comparação com outras pessoasSegundo as estatísticas americanas, 10% da população dos EUA com 12 anos ou mais sofre de alguma forma de dependência - na terminologia oficial, isso é chamado de
transtorno de uso de substâncias (SUD) (dependência). Provavelmente, na Federação Russa, esse indicador é muito maior. Segundo a
RBC , aqui 10% da população toma bebidas substitutas (loções médicas, espinheiro, lavadoras de vidro, paleta etc.), e muitas outras pessoas bebem álcool legal.
Nos últimos anos, as pessoas começaram a gastar uma quantidade enorme de tempo nas redes sociais, onde se comunicam, trocam idéias etc. Essa é uma quantidade enorme de informações suficientes para um sistema de aprendizado de máquina. E há muitas pessoas viciadas nas redes sociais. Graças às conquistas dos cientistas, tornou-se possível identificar automaticamente viciados em drogas, alcoólatras e fumantes por seu vocabulário e interesses culturais (música, filmes).
Talvez no futuro comece a filtragem automática de viciados em drogas na Internet. Por exemplo, eles serão proibidos de se registrar em alguns sites ou receberão um ícone especial no perfil.
Especialistas do Departamento de Sistemas de Informação da Universidade de Maryland e do Centro de Pesquisa para Recuperação de Dependências do Carillon Research Institute da Virginia Polytechnic University desenvolveram
um sistema de aprendizado de máquina que identifica automaticamente as pessoas que são viciadas, bem como as pessoas com risco de dependência (ou seja, cidadãos que são fracos em seus interesses diferente dos verdadeiros viciados em drogas e alcoólatras).
Como você sabe, o vício em certas substâncias afeta inevitavelmente a atividade social de uma pessoa e se correlaciona com seus traços de personalidade. Por exemplo, pessoas que fumam tabaco constantemente mostram um indicador significativamente mais alto de “abertura para experimentar”, mas um indicador significativamente mais baixo de “boa fé” do que os não fumantes (ver
Campbell et al., 2014 ). O uso de álcool está positivamente correlacionado com a socialidade e a extroversão (um
estudo de Cook et al., 1998 ).
Dezenas de outros trabalhos científicos também revelaram uma conexão entre o uso constante de uma droga e as características de personalidade e comportamento social. Muitas vezes, o uso de substâncias se correlaciona com a reduzida "consciência" - esse é um traço de personalidade associado à autodisciplina, ao desempenho consciente dos deveres e ao desejo de atingir uma meta. Essa correlação é compreensível, porque são esses traços de caráter que são necessários para se livrar do vício em drogas.
Por outro lado, a ciência também conhece fatores de risco que aumentam a probabilidade de dependência - idade, sexo, impulsividade, desejo de prazer, reação à novidade, tendência ao exercício e ambiente enxuto (
estudo de Carroll et al., 2009 ). Outros fatores que aumentam o risco são conhecidos, incluindo o ambiente social (vizinhos), o ambiente familiar (parentes) e as normas sociais.
Anteriormente, os cientistas realizavam esses estudos usando pesquisas sociais, mas agora, graças à enorme quantidade de informações nas redes sociais, você pode estudar o comportamento das pessoas sem sair do computador. Para o sistema de aprendizado de máquina, os pesquisadores americanos usaram o banco de dados coletado no âmbito do projeto myPersonality de 2007 a 2012. Era um aplicativo popular para o Facebook, onde as pessoas passavam em testes psicológicos e conversavam detalhadamente sobre sua personalidade e hábitos, entre eles toxicodependentes, alcoólatras e fumantes.
Com os perfis psicológicos dos usuários do Facebook, foram associadas suas atividades na rede social - 22 milhões de atualizações de status de 153 mil usuários. Uma média de 143 postagens de cada usuário e o número médio de palavras é 1730 por pessoa. Usuários que não falam inglês e aqueles que escreveram menos de 500 palavras foram excluídos do banco de dados. Havia 21 milhões de posts de 106.509 pessoas. Depois de filtrar as palavras de baixa frequência (com uma frequência inferior a 50 no banco de dados), o corpus do dicionário totalizou 73.935 palavras.
Os pesquisadores levaram em conta a experiência de seus antecessores, que provaram que a personalidade de uma pessoa é mais fácil de aprender, não por suas palavras, mas por seus gostos. Portanto, eles também criaram um banco de dados de curtidas para 5,1 milhões de usuários.
Após o treinamento, o sistema foi capaz de prever com grande precisão a presença de dependência em uma pessoa, independentemente de ter passado nos testes psicológicos. Portanto, a probabilidade de fumar tabaco é determinada com a maior precisão de 86%, a probabilidade de uso de drogas é de 84%, a probabilidade de consumo de álcool é de 81%.
Além disso, os resultados da análise de gostos e frequência de palavras entre viciados em drogas e alcoólatras são de real interesse científico. Eles mostram em que relação específica os interesses e o comportamento da pessoa dependente diferem dos interesses e do comportamento daquele que não usa substâncias.
De acordo com a frequência de uso das palavras, o vício (foda-se, merda) é mais comum entre os viciados (drogas, tabaco). Entre os interesses dos alcoólatras, o filme “V is Vendetta” lidera, e os viciados em drogas gostam de ouvir as bandas de música Radiohead, The Cure e Depeche Mode.

O artigo científico foi
publicado em 16 de maio de 2017 no site de pré-impressão arXiv.org (arXiv: 1705.05633).