Bonjour à tous! Tanner Stokes a
écrit un add-on qui a refait le texte des commentaires sur YouTube dans "herp derp". Cela a rendu la vie bien meilleure pour certains. Nous avons suivi le même chemin, mais nous avons légèrement changé le concept. Nous présentons des commentaires YouTube sous forme d'images, ou plutôt de graphiques avec des sommets et des bords. Et nous visualisons tous les types d'objets - des vidéos et des chaînes aux intersections inter-genres. Comment fait-on cela? Voyons.

Pourquoi visualisons-nous
Les philosophes disent que ce ne sont pas les faits qui sont importants, mais leur comparaison. Il est également important pour nous de ne pas commenter la vidéo elle-même, mais de comparer les actions des commentateurs dans différentes vidéos. Les situations reproductibles de façon durable correspondent aux motifs visibles dans la visualisation. La tâche principale que nous avons choisie est la visualisation et la détection des régions - des modèles sur leur base, ainsi qu'une cartographie générale de l'interaction des commentateurs sur YouTube afin de compiler un atlas de commentaires.
Logiciels
Jusqu'à récemment, nous
utilisions le service Web
Youtube Comment Scraper pour
dégonfler les commentaires , mais il semble qu'il ne soit plus pris en charge, vous pouvez donc utiliser
ce service.
Maintenant, nous utilisons notre propre outil, qui nous permet de pomper les commentaires d'une ou plusieurs chaînes dans leur ensemble, ce qui est beaucoup plus pratique pour nos besoins.
Pour la visualisation des données, nous utilisons
Gephi v. 0.9.2 . Pour empiler les sommets et les arêtes, nous utilisons l'algorithme Force Atlas 2. Pour afficher les statistiques, les fonctions «Degré moyen (pondéré)» et «Modularité» sont utilisées.
Algorithme
La question se pose, mais comment suivre les commentaires, quels indicateurs objectifs faut-il prendre pour cela? Nous avons essayé de lier les noms d'utilisateur aux identifiants des vidéos - dans notre cas, leur numérotation séquentielle, par exemple, «OverlordXXX» - «1»; "Overlord XXY" - "2" et ainsi de suite. Ensuite, créé deux fichiers, "Nodes" et "Edges", selon
ce manuel .
La visualisation dans Gephi est la suivante. Les commentateurs (1) sont connectés aux rouleaux (2), ce qui est un commentaire. Si le commentateur a commenté plus d'un clip, il est associé à tous les clips qu'il a commentés (3).

Visualisation des commentaires vidéo
Pour comparer les commentateurs, trois vidéos ont été sélectionnées (
1 ,
2 ,
3 ).
Le résultat de la visualisation des commentaires vidéo dans Gephi:

Les commentaires sur les vidéos sont présentés sous la forme d'un graphique orienté avec 10 462 sommets et 10 692 arêtes. La visualisation montre que l'interaction des commentateurs entre les trois vidéos est mal manifestée. Cela correspond en grande partie à la différence de contenu des vidéos, qui se reflétait dans le commentaire de chacune d'elles. La première vidéo montre l'expérience avec un magnétron. La deuxième vidéo comprend à la fois l'expérience et la couverture d'événements non directement liés à l'expérience. La troisième vidéo est consacrée uniquement aux événements sans référence aux expériences.
Pour la mesure de contrôle, des rouleaux du même canal ont été utilisés (
1 ,
2 ,
3 ), mais contrairement aux précédents, ils sont plus proches les uns des autres dans un contexte similaire (expériences impliquant un cascadeur mémétique).
Résultats de visualisation:

Les commentaires sur les vidéos sont présentés sous la forme d'un graphique dirigé avec 10108 sommets et 10857 arêtes. Le contexte général correspond à la forte interaction des commentateurs dans au moins deux des trois vidéos.
Autrement dit, la différence, ou vice versa, la communauté des commentateurs dans différentes vidéos est en corrélation avec le contexte global différent ou vice versa des vidéos. Fait intéressant, la visualisation, même sans vous familiariser au préalable avec le contenu, le capte très bien.
Visualisation des commentaires de la chaîne YouTube
Pour la visualisation, 472 286 commentaires de 172 vidéos de chaînes ont été sélectionnés:

Un nuage de commentaires commun relie la plupart des vidéos. Sur cette base, nous pouvons parler du canal comme d'une intégrité sémantique (sémantique et contextuelle). Mais il existe également des caractéristiques régionales intéressantes. Il est facile de voir les régions de deux ensembles de commentaires symétriques mis en évidence en haut de l'image, peints en vert et bleu:

Il s'est avéré qu'ils sont formés par des commentaires sur quatre vidéos sur les pétards (
1 ,
2 ,
3 ,
4 ), où un dessin pyrotechnique a été tenu.
On peut supposer que la connectivité relativement faible de ces vidéos avec le reste est due à la transition vers celles-ci via des liens externes et, par conséquent, à l'apparition d'un public spécifique qui est indirectement lié au reste du contenu de la chaîne.
Conclusion préliminaire - dans la visualisation des commentaires, la sélection des régions fonctionne bien. Et puis, vous pouvez explorer une région distincte à l'aide de méthodes qualitatives - par exemple, l'analyse de contenu et l'ethnographie.
Visualisation des commentaires sur YouTube: critique du film
Neuf chaînes YouTube (
1 ,
2 ,
3 ,
4 ,
5 ,
6 ,
7 ,
8 ,
9 ) ont été utilisées pour travailler avec le domaine du genre, dont les auteurs ont indiqué une critique des films comme principal type de contenu dans la description.
Visualisation de 1 920 865 commentaires sur les vidéos de toutes les chaînes:

La visualisation a montré que deux grandes chaînes (à partir d'un million d'abonnés) absorbent littéralement sept petites chaînes (jusqu'à 500 000 abonnés). En fait, les petits canaux sont devenus des régions de grands canaux, ce qui est visible dans l'image comme la couleur correspondante de la région. On peut supposer que les commentateurs des petites chaînes sont pour la plupart parmi les commentateurs des grandes chaînes. Autrement dit, les diagrammes de Venn sont plus adaptés à leurs recherches, par exemple, où vous pouvez voir exactement combien d'entre eux et dans quelles proportions ils sont présentés dans différents canaux.
Pour la comparaison des contrôles, 513282 commentaires de huit canaux (
1 ,
2 ,
3 ,
4 ,
5 ,
6 ,
7 ,
8 ) du genre blog beauté ont été visualisés:

Une forte intersection des canaux n'est observée que dans deux sous-ensembles, tandis que deux canaux (noir et lilas) sont relativement faiblement connectés les uns aux autres. Contrairement au premier exemple, les commentateurs de blogs de beauté sont moins susceptibles d'interagir et, dans certains cas, sont des publics relativement isolés. Par conséquent, cela doit être pris en compte lors de la définition de la couverture maximale de l'audience des chaînes, par exemple à des fins publicitaires. Si dans le cas des critiques de films, il suffit de commander de la publicité sur plus d'un million de chaînes, alors dans le cas des blogs de beauté, vous devez commander de la publicité, y compris sur des chaînes isolées, sinon leur public ne sera pas couvert.
Visualisation des commentaires d'intersection inter-genres
Pour visualiser l'intersection inter-genres, trois chaînes ont été sélectionnées dans les genres du blog beauté (
1 , 14 231 commentaires sur 115 clips), des expériences (
2 , 72 163 commentaires sur 81 clips) et des voyages (
3 135 135 403 commentaires sur 482 clips).
1) Visualisation de l'intersection des commentateurs et des expériences du blog beauté:

2) Visualisation des commentateurs sur les expériences et les voyages:

3) Visualisation du blog beauté et des commentateurs de voyage:

4) Visualisation des commentateurs de tous les canaux:

Visuellement, vous pouvez voir que les commentateurs de canaux sur les voyages et les expériences ont un certain nombre d'intersections, et les commentateurs de blogs de beauté, bien qu'ils soient isolés des autres, sont plus associés aux commentateurs de voyage qu'aux commentateurs d'expériences.
Résultats préliminaires
La tendance générale à la visualisation se justifie dans le cas de l'étude des commentaires.
Dans le cas de l'étude de chaînes ou de vidéos individuelles, la visualisation permet de mettre en évidence et de détailler les régions d'intérêt pour le chercheur. Cela simplifie considérablement l'étude qualitative ultérieure des commentaires et du contenu vidéo sur les chaînes YouTube.
Sur le plan pratique, la visualisation de l'intersection de l'audience active de la chaîne (commentateurs) peut être utile, par exemple, en cas d'optimisation de la publicité sur les chaînes. Si, pendant la visualisation, une intersection forte et stable de commentateurs de chaîne / ensembles de chaînes est détectée, cela vous permet de distribuer correctement la publicité et, par conséquent, d'économiser sur son placement.