根据社交网络中的行为计算出的吸毒者和酗酒者


与其他人相比,吸毒者/酗酒者/吸烟者使用不同词语的频率

根据美国的统计资料,美国12岁以上的人口中有10%患有某种形式的依赖-在官方术语中,这称为物质使用障碍(SUD) (依赖)。 在俄罗斯联邦,该指标可能更高。 根据RBC的说法,这里有10%的人口服用替代饮料(医用洗剂,山楂,玻璃清洗剂,调色板等),还有更多人饮用合法酒精。

近年来,人们开始在社交网络上花费大量时间,进行交流,交流思想等。这对于机器学习系统来说是足够的信息。 社交网络上有很多上瘾的人。 多亏了科学家的成就,才有可能根据他们的词汇和文化兴趣(音乐,电影)自动识别吸毒者,酗酒者和吸烟者。

也许将来甚至会开始自动过滤互联网上的吸毒者。 例如,将禁止他们在某些网站上注册,或在配置文件中分配一个特殊的图标。

马里兰大学信息系统系和弗吉尼亚理工大学卡里隆研究所成瘾恢复研究中心的专家开发了一种机器学习系统 ,该系统可以自动识别上瘾的人以及有上瘾风险的人(即,对自己的兴趣薄弱的公民)与真正的吸毒者和酗酒者不同)。

如您所知,对某些物质的依赖不可避免地会影响一个人的社交活动,并与他的人格特质相关。 例如,与不吸烟者相比,经常吸烟的人显示出“开放的经验”要高得多,而“诚信”则要低得多(参见Campbell等,2014 )。 饮酒与社交和性格外向呈正相关( Cook等人,1998年的一项研究 )。

数十项其他科学著作还揭示了不断使用毒品与人格特征和社会行为之间的联系。 很多时候,物质的使用与减少的“尽责性”相关-这是一种人格特质,与自律,尽职尽责以及实现目标的愿望有关。 这种关联是可以理解的,因为摆脱吸毒成瘾需要这些性格特征。

另一方面,科学也知道增加成瘾可能性的风险因素-这是年龄,性别,冲动,对娱乐的渴望,对新事物的反应,运动的倾向以及恶劣的环境( Carroll等人,2009年研究 )。 已知增加风险的其他因素,包括社会环境(邻居),家庭环境(亲戚)和社会规范。

以前,科学家使用社交调查进行了此类研究,但是现在,由于社交网络中的大量信息,您无需离开计算机就可以研究人们的行为。 对于机器学习系统,美国研究人员使用了2007年至2012年myPersonality项目框架中收集的数据库。 这是Facebook上的一个流行应用程序,人们通过了心理测验并详细谈论了他们的性格和习惯,其中包括吸毒者,酗酒者和吸烟者。

根据Facebook用户的心理状况,他们在社交网络中的活动相关联-来自15.3万用户的2200万状态更新。 每个用户平均发143条帖子,每人平均单词数为1730。 数据库中排除了非英语用户和少于500个单词的用户。 来自106,509人的2100万个帖子。 在过滤了低频词(数据库中频率小于50的词)之后,字典语料库达到73,935个词。

研究人员考虑了他们前任的经验,这些经验证明,一个人的性格更容易学习,而不是通过言语,而是通过喜欢。 因此,他们还为510万用户组成了一个喜欢数据库。

训练后,该系统可以非常准确地预测一个人是否存在成瘾,无论他是否通过了心理测验。 因此,确定吸烟的概率的最高准确度为86%,吸毒的概率为84%,饮酒的概率为81%。

此外,对吸毒者和酗酒者的喜好和单词频率的分析结果具有真正的科学意义。 它们表明,被抚养人的利益和行为与不使用药物的人的利益和行为之间有什么特定的关系。

根据单词使用的频率,成瘾者(毒品,烟草)成瘾(他妈的,狗屎)在成瘾者中更为普遍。 在酗酒者的兴趣中,电影《 V是仇杀队》的主角和吸毒者喜欢听音乐乐队Radiohead,The Cure和Depeche Mode。



该科学文章于2017年5月16日发布在预印本网站arXiv.org(arXiv:1705.05633)上。

Source: https://habr.com/ru/post/zh-CN404209/


All Articles