乐观主义者不佳:科学家已经确定了推文内容与用户收入之间的联系

一组科学家,来自美国和英国几所大学的IT专家以及Microsoft Research已经确定了Twitter消息的内容和情感色彩与用户收入之间的联系。高收入者发布有关政治的新闻并表达愤怒,而少之又少用肮脏的语言发表乐观的信息。

图片

在英国,有“标准职业分类”,该系统根据工人的复杂性和资格对工人进行分类。该层次结构包括九个类。科学家们选择了代表所有九个类别的五千个帐户,并处理了一千万条推文的数据库。

在处理推文的过程中,科学家选择了特定的词,这些词最常见于每个类别中。对于每个类别,算法选择的单词在使用频率上与其他类别的频率有很大不同。然后,研究人员按类别和情感色彩将结果手动分组。

收入较高的人不太可能表现出宗教信仰,行为举止更加镇定。与收入较少的用户相比,他们拥有更多的关注者和转发者,尽管他们发送的消息和链接也更少。对这种语言的自动分析显示,高收入人群更有可能表达愤怒和恐惧,发布有关政治,非政府组织和公司信息的新闻。

收入较低的人经常使用粗话,但他们的信息更为乐观。他们使用Twitter交流日常话题。

所获得的数据将使我们能够解决反问题-至少在英国猜测Twitter上的用户收入。

图片
样本中用户的收入(按人数)。该研究涉及5191个帐户。

通过在Twitter上处理大量消息,科学家可以进行各种科学领域的研究。以前,心理学家证明负面情绪会导致心脏病然后,研究人员分析了来自美国1347个不同地区的用户的1.48亿条推文,突出了负面情绪的迹象-提及灾难,犯罪和疾病,缺乏睡眠的投诉和其他标记词。然后,科学家将结果与心血管疾病的实际地理分布进行了比较。事实证明,两张卡彼此相似。

图片

Source: https://habr.com/ru/post/zh-CN384831/


All Articles