Pauvres optimistes: les scientifiques ont identifié un lien entre le contenu des tweets et les revenus des utilisateurs

Une équipe de scientifiques, d'experts en informatique de plusieurs universités américaines et britanniques et Microsoft Research ont identifié un lien entre le contenu et la couleur émotionnelle des messages Twitter et les revenus des utilisateurs. Les gens à hauts revenus publient des nouvelles sur la politique et expriment leur colère, et avec des revenus moindres, ils utilisent un langage obscène et publient des messages optimistes.

image

Au Royaume-Uni, il existe la Classification type des professions, un système qui classe les travailleurs en fonction de leur complexité et de leurs qualifications. Cette hiérarchie comprend neuf classes. Les scientifiques ont sélectionné cinq mille comptes représentant les neuf classes et ont traité une base de données de dix millions de leurs tweets.

Dans le processus de traitement des tweets, les scientifiques ont sélectionné des mots spécifiques, le plus souvent trouvés dans chaque classe. Pour chaque classe, l'algorithme a sélectionné des mots dont la fréquence d'utilisation est très différente de la fréquence des autres classes. Les chercheurs ont ensuite regroupé manuellement les résultats par catégorie et par couleur émotionnelle.

Les personnes à revenu plus élevé sont moins susceptibles d'exprimer leur religiosité et de se comporter plus calmement. Ils ont plus d'abonnés et de retweets que les utilisateurs avec moins de revenus, bien qu'ils envoient moins de messages et moins de liens. Une analyse automatique de la langue a révélé que les personnes à revenu élevé sont plus susceptibles d'exprimer leur colère et leur peur, de publier des informations sur la politique, les ONG et les messages des entreprises.

Les personnes à faible revenu utilisent souvent un langage grossier, mais leurs messages sont plus optimistes. Ils utilisent Twitter pour communiquer sur des sujets quotidiens.

Les données obtenues nous permettront de résoudre le problème inverse - de deviner le revenu des utilisateurs sur Twitter, au moins au Royaume-Uni.

image
Les revenus des utilisateurs de l'échantillon par leur nombre. L'étude portait sur 5191 comptes.

Le traitement de grands tableaux de messages sur Twitter permet aux scientifiques de mener des recherches dans divers domaines scientifiques. Auparavant, les psychologues ont prouvé que les émotions négatives entraînent des maladies cardiaques . Ensuite, les chercheurs ont analysé 148 millions de tweets d'utilisateurs de 1347 régions différentes des États-Unis, mettant en évidence des signes d'émotions négatives - mention de catastrophes, crimes et maladies, plaintes pour manque de sommeil et autres mots marquants. Ensuite, les scientifiques ont comparé le résultat avec la répartition géographique réelle des maladies cardiovasculaires. Il s'est avéré que les deux cartes sont similaires.

image

Source: https://habr.com/ru/post/fr384831/


All Articles