Bonjour à tous! Nous développons les idées du
premier article et continuons de visualiser et d'étudier les commentaires sur YouTube. Cette fois, nous travaillerons avec les communautés YouTube mondiales et locales. Comment les commentateurs qui écrivent dans différentes langues interagissent-ils? Une communauté mondiale unique est-elle issue de nombreux groupes locaux, ou est-ce plus compliqué qu'il n'y paraît? Et d'où vient le projet Touhou? Voyons.

Commentaires et communautés - spécificités de genre, nombres, spectre linguistique
Pour répondre à ces questions, nous avons exploré les relations entre des groupes de commentateurs de chaînes YouTube appartenant à la communauté du
projet Touhou (le projet East). En règle générale, ces chaînes sont associées à une série de jeux informatiques du même nom dans le genre Dammaku (tireurs verticaux avec un grand nombre de balles). Basé sur les jeux a créé une grande quantité de fan art. À partir du fan art, le contenu principal des chaînes YouTube est formé - jeux liés, jeux, streams, musique, animation, etc.
L'audience de ces chaînes est relativement faible, par conséquent, d'une part, les données sont faciles à traiter et à visualiser, et, d'autre part, les résultats ne peuvent être extrapolés qu'à de petites communautés thématiques YouTube.
Pour l'étude, les commentaires de trois communautés linguistiques locales - russe, espagnol et coréen - ont été sélectionnés (les noms sont basés sur les langues prévalant dans les commentaires). Dans la catégorie de la communauté internationale conditionnelle, les commentaires ont été examinés en anglais et partiellement en japonais. Depuis que le projet Touhou a été initialement produit au Japon, Kana, par exemple, est utilisé comme élément de description dans toutes les autres langues.
Données communautaires
Toutes les données de canal ont été encodées. Un millième numéro unique a été attribué à chaque canal, et un numéro de canal + numéro de série du clip a été attribué à chaque clip.
La communauté internationale est représentée par 25 chaînes. Un total de 243281 commentaires ont été traités. Code: 1000-25000.
(
1000 ,
2000 ,
3000 ,
4000 ,
5000 ,
6000 ,
7000 ,
8000 ,
9000 ,
10000 ,
11000 ,
12000 ,
13000 ,
14000 ,
15000 ,
16000 ,
17000 ,
18000 ,
19000 ,
20000 ,
21000 ,
22000 ,
23000 ,
24000 ,
25000 )
2) La communauté russe est représentée par 9 chaînes. Un total de 6417 commentaires ont été traités. Code: 30000 - 38000
(
30000 ,
31000 ,
32000 ,
33000 ,
34000 ,
35000 ,
36000 ,
37000 ,
38000 )
3) La communauté espagnole est représentée par 8 chaînes. Au total, 14 483 commentaires ont été traités. Code: 40000 - 47000
(
40000 ,
41000 ,
42000 ,
43000 ,
44000 ,
45000 ,
46000 ,
47000 )
4) La communauté coréenne est représentée par 8 chaînes. Au total, 12968 commentaires ont été traités. Code: 50000 - 57000
(
50000 ,
51000 ,
52000 ,
53000 ,
54000 ,
55000 ,
56000 ,
57000 )
Résultats de visualisation
1)
Communauté internationale : graphe orienté sur 50552 nœuds et 117906 arêtes.

Malgré l'homogénéité générale du champ de commentaire, deux régions autonomes aux contours clairs et une diffuse sont perceptibles.
Région grise autonome à l'ouest - commentaires sur les publicités du canal 8000.

La région isolée correspond au contenu non touhou du canal 8000. Fondamentalement, ce sont des vidéos avec des bandes sonores pour le jeu
Final Fantasy (par exemple,
celui-ci ).
Région verte autonome dans le nord-est - commentaires sur les vidéos de la chaîne 7000.

Roller
7024 a rassemblé de nombreux commentateurs uniques. Le contenu de la vidéo est le passage du jeu
Undertale . Ce jeu a sa propre communauté de fans. Des commentateurs probablement uniques sont venus de là.
La région beige éparse au sud est le canal 3000.

Les régions les plus isolées sont des vidéos sur GTA et d'autres jeux non Touhou (
3015 ,
3036 ,
3038 ,
3049 ,
3051 ,
3063 et autres).
Autrement dit, la plupart des régions isolées de la communauté internationale sont des contenus non liés à Touhou.
2)
Communauté russe : graphe orienté sur 3655 nœuds et 5180 arêtes.

Il y a un champ de commentaire commun, qui a tendance à être divisé en deux parties, et une région en surbrillance (violette).
La région violette en surbrillance - la
vidéo de 38000 canaux, qui représente le contenu original - préparée par les auteurs des sous-titres anglais de la chaîne pour la composition en japonais. Les commentaires sur la vidéo en anglais, les commentateurs de cette chaîne sont pour la plupart uniques.
3)
Communauté espagnole : graphique orienté avec 5866 nœuds et 9843 arêtes.

On observe trois régions autonomes. La région rouge est le canal 40 000. La région orange-noir est le canal 45 000. La région bleu-violet-vert est le canal 46000.
Le contenu des trois chaînes est représenté par du fan art. La division en régions isolées est probablement liée aux spécificités de la division au sein de la communauté. Par exemple, le contenu du canal 40 000 est principalement lié au cosplay, et les liens vers celui-ci conduisent également à des canaux de cosplay.
4) La
communauté coréenne : graphique focalisé sur 4113 nœuds et 6763 arêtes.

On observe deux grandes (violet-bleu et vert-noir), ainsi que plusieurs petites régions autonomes (framboise, orange, vert foncé, etc.).
Région violet-bleu: canal 57000. Région vert-noir - canaux 51000, 52000 et 53000.
En général, toutes les régions sont représentées par des commentaires sur le contenu lié à Touhou. Au loin, parfois, des commentaires de vidéos avec un contenu non touhou, par exemple
52003 , apparaissent.
Les communautés espagnole et coréenne sont similaires: la plupart des commentateurs accumulent des chaînes avec beaucoup de contenu, les chaînes restantes en sont clairement séparées. En comparaison, la communauté russe interagit plus fortement, comme on peut le voir dans la région générale des commentaires. Cela est dû au fait que la plupart des chaînes YouTube russes représentées dans l'échantillon sont connectées les unes aux autres via des liens placés sur les chaînes.
5)
Toutes les communautés - linguistique locale (2, 3, 4) et internationale (1) : graphique orienté avec 62340 nœuds et 185412 arêtes.

Il y a une accumulation générale de commentaires et de branches qui s'en éloignent.
La branche vert foncé dans la direction nord-ouest est la communauté russe.

Communauté espagnole (couleur grise): sa partie principale est concentrée dans le sud-ouest.

Une branche distincte de la communauté espagnole, représentée par le canal 40 000, se trouve dans la direction nord-est.

La branche noire dans la direction sud-est est la communauté coréenne.

Il est à noter que la communauté coréenne est plus étroitement liée à la communauté internationale, sa partie principale (canal 57000) a pratiquement fusionné avec la région du canal 13000.

La situation est similaire avec la communauté espagnole, sa branche sud-ouest (canal 46000) est combinée avec la région internationale (canal 20 000).

La partie principale de la communauté russe (canal 38000) est située à une grande distance de la région internationale la plus proche.

Classement des canaux par degré d'interaction
Pour conclure notre examen, parlons d'une chose comme le classement des chaînes. Notre approche est basée sur une observation très simple. Si nous permettons une corrélation entre l'arrangement spatial des commentaires et leur intersection avec de nombreux autres commentaires, alors plus un commentaire est proche du cluster central, plus cette intersection est grande.
Sur cette base, vous pouvez classer les commentaires des chaînes et vidéos individuelles, à la fois en langue locale et internationale. Un exemple de classement des canaux en fonction de la proximité / distance des commentaires d'un centre mondial commun est présenté dans le tableau (les canaux sont répartis vers le bas par ordre décroissant d'interaction).

Il convient de préciser qu'il ne s'agit que d'une des options de classement les plus simples lorsque les groupes locaux dépendent directement de la région mondiale. Cependant, la visualisation des groupes locaux a montré une hétérogénéité dans la distribution des commentaires externes (globaux) et internes (locaux) des commentateurs. La connectivité élevée de certains canaux des communautés espagnole et coréenne les fait pratiquement faire partie de la région mondiale, mais ils sont peu connectés avec d'autres canaux locaux. Par exemple, la communauté espagnole, avec une intégration relativement élevée à la région mondiale, est divisée en deux régions pratiquement non connectées de l'intérieur. La communauté russe est relativement éloignée de la région internationale et montre une forte connexion de l'intérieur. Ces exemples montrent les limites d'un modèle simple de classement des groupes locaux par rapport à un centre mondial commun. Cela indique également la possibilité de créer un modèle qui inclut la spécificité locale comme critère d'évaluation. De toute évidence, cette tâche nécessite une étude distincte, ce que nous ferons.