Olá pessoal! Desenvolvemos as ideias do
primeiro post e continuamos a visualizar e estudar os comentários no YouTube. Desta vez, trabalharemos com comunidades globais e locais do YouTube. Como os comentaristas que escrevem em diferentes idiomas interagem? Uma comunidade global única se reúne de muitos grupos locais ou é mais complicada do que parece? E de onde vem o Projeto Touhou? Vamos descobrir.

Comentários e comunidades - detalhes de gênero, números, espectro de idiomas
Para responder a essas perguntas, exploramos as relações entre grupos de comentaristas de canais do YouTube pertencentes à comunidade do
Projeto Touhou (o projeto Leste). Como regra, esses canais estão associados a uma série de jogos de computador com o mesmo nome no gênero Dammaku (atiradores verticais com um grande número de balas). Com base nos jogos criou uma grande quantidade de arte dos fãs. A partir da arte dos fãs, o conteúdo principal dos canais do YouTube é formado - jogos, peças, transmissões, músicas, animações e assim por diante.
O público desses canais é relativamente pequeno, portanto, por um lado, os dados são fáceis de processar e visualizar e, por outro lado, os resultados podem ser extrapolados apenas para pequenas comunidades temáticas do YouTube.
Para o estudo, os comentários de três comunidades de idiomas locais - russo, espanhol e coreano - foram selecionados (os nomes são baseados nos idiomas predominantes nos comentários). Na categoria comunidade internacional condicional, os comentários foram considerados em inglês e parcialmente em japonês. Desde que o Projeto Touhou foi originalmente produzido no Japão, Kana, por exemplo, é usado como elementos de descrição em todos os outros idiomas.
Dados da comunidade
Todos os dados do canal foram codificados. Um milésimo número exclusivo foi atribuído a cada canal e um número de canal + número de série do clipe foi atribuído a cada clipe.
A comunidade internacional é representada por 25 canais. Um total de 243281 comentários foram processados. Código: 1000 - 25000.
(
1000 ,
2000 ,
3000 ,
4000 ,
5000 ,
6000 ,
7000 ,
8000 ,
9000 ,
10000 ,
11000 ,
12000 ,
13000 ,
14000 ,
15000 ,
16000 ,
17000 ,
18000 ,
19000 ,
20000 ,
21000 ,
22000 ,
23000 ,
24000 ,
25000 )
2) A comunidade russa é representada por 9 canais. Um total de 6417 comentários foram processados. Código: 30000 - 38000
(
30000 ,
31000 ,
32000 ,
33000 ,
34000 ,
35000 ,
36000 ,
37000 ,
38000 )
3) A comunidade espanhola é representada por 8 canais. Um total de 14.483 comentários foram processados. Código: 40000 - 47000
(
40000 ,
41000 ,
42000 ,
43000 ,
44000 ,
45000 ,
46000 ,
47000 )
4) A comunidade coreana é representada por 8 canais. Um total de 12968 comentários foram processados. Código: 50000 - 57000
(
50000 ,
51000 ,
52000 ,
53000 ,
54000 ,
55000 ,
56000 ,
57000 )
Resultados da visualização
1)
Comunidade internacional : gráfico orientado em 50552 nós e 117906 arestas.

Apesar da homogeneidade geral do campo de comentários, duas regiões autônomas com contornos claros e uma difusa são perceptíveis.
Região cinzenta autônoma no oeste - comentários sobre os comerciais do canal 8000.

A região isolada corresponde ao conteúdo não-Touhou do canal 8000. Basicamente, são vídeos com trilhas sonoras para o jogo
Final Fantasy (por exemplo,
este ).
Região verde autônoma do nordeste - comentários nos vídeos do canal 7000.

O rolo
7024 reuniu muitos comentaristas exclusivos. O conteúdo do vídeo é a passagem do jogo
Undertale . Este jogo tem sua própria comunidade de fãs. Provavelmente, comentaristas únicos vieram de lá.
A região bege espalhada no sul é o canal 3000.

Regiões mais isoladas são vídeos sobre o GTA e outros jogos que não são de Touhou (
3015 ,
3036 ,
3038 ,
3049 ,
3051 ,
3063 e outros).
Ou seja, a maioria das regiões isoladas da comunidade internacional é de conteúdo não relacionado a Touhou.
2)
Comunidade russa : gráfico orientado em 3655 nós e 5180 arestas.

Há um campo de comentário comum, que tende a ser dividido em duas partes, e uma região destacada (roxa).
A região roxa destacada - o
vídeo do canal 38000, que representa o conteúdo original - preparado pelos autores das legendas em inglês do canal para a composição em japonês. Comentários sobre o vídeo em inglês, os comentadores deste canal são em sua maioria exclusivos.
3)
Comunidade espanhola : gráfico orientado com 5866 nós e 9843 arestas.

Três regiões autônomas são observadas. A região vermelha é o canal 40.000, a região preto-laranja é o canal 45.000. A região azul-violeta-verde é o canal 46000.
O conteúdo dos três canais é representado pela arte dos fãs. Provavelmente, a divisão em regiões isoladas está relacionada às especificidades da divisão na comunidade. Por exemplo, o conteúdo do canal 40.000 é principalmente relacionado ao cosplay, e os links para ele também levam a canais de cosplay.
4) A
comunidade coreana : gráfico focado em 4113 nós e 6763 arestas.

São observadas duas grandes (azul violeta e verde-preta), bem como várias pequenas regiões autônomas (framboesa, laranja, verde escuro e assim por diante).
Região azul violeta: canal 57000. Região verde-preta - canais 51000, 52000 e 53000.
Em geral, todas as regiões são representadas por comentários sobre o conteúdo relacionado a Touhou. À distância do resto, às vezes são
exibidos comentários de vídeos com conteúdo não Touhou, por exemplo,
52003 .
As comunidades espanhola e coreana são semelhantes: a maioria dos comentaristas acumula canais com muito conteúdo, os canais restantes são claramente separados deles. A comunidade russa, em comparação, interage mais fortemente, como pode ser visto na região geral dos comentários. Isso se deve ao fato de a maioria dos canais russos do YouTube representados na amostra estarem conectados por meio de links colocados nos canais.
5)
Todas as comunidades - linguística local (2, 3, 4) e internacional (1) : gráfico orientado com 62340 nós e 185412 bordas.

Há um acúmulo geral de comentários e ramificações saindo dele.
O ramo verde escuro na direção noroeste é a comunidade russa.

Comunidade espanhola (cor cinza): sua parte principal está concentrada no sudoeste.

Um ramo separado da comunidade espanhola, representado pelo canal 40.000, fica na direção nordeste.

O ramo preto na direção sudeste é a comunidade coreana.

É notável que a comunidade coreana está mais intimamente ligada à internacional, sua parte principal (canal 57000) praticamente se fundiu à região do canal 13000.

A situação é semelhante com a comunidade espanhola, seu ramo sudoeste (canal 46000) é combinado com a região internacional (canal 20.000).

A parte principal da comunidade russa (canal 38000) está localizada a uma grande distância da região internacional mais próxima.

Classificação do canal por grau de interação
Para concluir nossa análise, vamos falar sobre classificação de canais. Nossa abordagem é baseada em uma observação muito simples. Se permitirmos uma correlação entre o arranjo espacial dos comentários e sua interseção com muitos outros comentários, quanto mais próximo um único comentário do cluster central, maior será essa interseção.
Com base nisso, você pode classificar os comentários de canais e vídeos individuais, no idioma local e internacional. Um exemplo de classificação de canal, dependendo da proximidade / distância dos comentários de um centro global comum, é apresentado na tabela (os canais são distribuídos para baixo em ordem decrescente de interação).

Deve-se esclarecer que essa é apenas uma das opções de classificação mais simples quando os grupos locais dependem diretamente da região global. No entanto, a visualização de grupos locais mostrou heterogeneidade na distribuição de comentários externos (globais) e internos (locais) dos comentaristas. A alta conectividade de alguns canais das comunidades espanhola e coreana praticamente os faz parte da região global, mas eles são fracamente conectados a outros canais locais. Por exemplo, a comunidade espanhola, com integração relativamente alta com a região global, é dividida em duas regiões praticamente desconectadas de dentro. A comunidade russa é relativamente distante da região internacional e demonstra uma forte conexão interna. Esses exemplos mostram as limitações de um modelo simples para classificar grupos locais em relação a um centro global comum. Isso também indica a possibilidade de criar um modelo que inclua especificidade local como critério de avaliação. Obviamente, essa tarefa requer um estudo separado, o que faremos.