Visualizar os comentários dos canais do YouTube de comunidades touhou internacionais e locais

Olá pessoal! Desenvolvemos as ideias do primeiro post e continuamos a visualizar e estudar os comentários no YouTube. Desta vez, trabalharemos com comunidades globais e locais do YouTube. Como os comentaristas que escrevem em diferentes idiomas interagem? Uma comunidade global única se reúne de muitos grupos locais ou é mais complicada do que parece? E de onde vem o Projeto Touhou? Vamos descobrir.



Comentários e comunidades - detalhes de gênero, números, espectro de idiomas


Para responder a essas perguntas, exploramos as relações entre grupos de comentaristas de canais do YouTube pertencentes à comunidade do Projeto Touhou (o projeto Leste). Como regra, esses canais estão associados a uma série de jogos de computador com o mesmo nome no gênero Dammaku (atiradores verticais com um grande número de balas). Com base nos jogos criou uma grande quantidade de arte dos fãs. A partir da arte dos fãs, o conteúdo principal dos canais do YouTube é formado - jogos, peças, transmissões, músicas, animações e assim por diante.

O público desses canais é relativamente pequeno, portanto, por um lado, os dados são fáceis de processar e visualizar e, por outro lado, os resultados podem ser extrapolados apenas para pequenas comunidades temáticas do YouTube.

Para o estudo, os comentários de três comunidades de idiomas locais - russo, espanhol e coreano - foram selecionados (os nomes são baseados nos idiomas predominantes nos comentários). Na categoria comunidade internacional condicional, os comentários foram considerados em inglês e parcialmente em japonês. Desde que o Projeto Touhou foi originalmente produzido no Japão, Kana, por exemplo, é usado como elementos de descrição em todos os outros idiomas.

Dados da comunidade


Todos os dados do canal foram codificados. Um milésimo número exclusivo foi atribuído a cada canal e um número de canal + número de série do clipe foi atribuído a cada clipe.

A comunidade internacional é representada por 25 canais. Um total de 243281 comentários foram processados. Código: 1000 - 25000.

( 1000 , 2000 , 3000 , 4000 , 5000 , 6000 , 7000 , 8000 , 9000 , 10000 , 11000 , 12000 , 13000 , 14000 , 15000 , 16000 , 17000 , 18000 , 19000 , 20000 , 21000 , 22000 , 23000 , 24000 , 25000 )

2) A comunidade russa é representada por 9 canais. Um total de 6417 comentários foram processados. Código: 30000 - 38000
( 30000 , 31000 , 32000 , 33000 , 34000 , 35000 , 36000 , 37000 , 38000 )

3) A comunidade espanhola é representada por 8 canais. Um total de 14.483 comentários foram processados. Código: 40000 - 47000
( 40000 , 41000 , 42000 , 43000 , 44000 , 45000 , 46000 , 47000 )

4) A comunidade coreana é representada por 8 canais. Um total de 12968 comentários foram processados. Código: 50000 - 57000
( 50000 , 51000 , 52000 , 53000 , 54000 , 55000 , 56000 , 57000 )

Resultados da visualização


1) Comunidade internacional : gráfico orientado em 50552 nós e 117906 arestas.



Apesar da homogeneidade geral do campo de comentários, duas regiões autônomas com contornos claros e uma difusa são perceptíveis.

Região cinzenta autônoma no oeste - comentários sobre os comerciais do canal 8000.



A região isolada corresponde ao conteúdo não-Touhou do canal 8000. Basicamente, são vídeos com trilhas sonoras para o jogo Final Fantasy (por exemplo, este ).

Região verde autônoma do nordeste - comentários nos vídeos do canal 7000.



O rolo 7024 reuniu muitos comentaristas exclusivos. O conteúdo do vídeo é a passagem do jogo Undertale . Este jogo tem sua própria comunidade de fãs. Provavelmente, comentaristas únicos vieram de lá.

A região bege espalhada no sul é o canal 3000.



Regiões mais isoladas são vídeos sobre o GTA e outros jogos que não são de Touhou ( 3015 , 3036 , 3038 , 3049 , 3051 , 3063 e outros).

Ou seja, a maioria das regiões isoladas da comunidade internacional é de conteúdo não relacionado a Touhou.

2) Comunidade russa : gráfico orientado em 3655 nós e 5180 arestas.



Há um campo de comentário comum, que tende a ser dividido em duas partes, e uma região destacada (roxa).

A região roxa destacada - o vídeo do canal 38000, que representa o conteúdo original - preparado pelos autores das legendas em inglês do canal para a composição em japonês. Comentários sobre o vídeo em inglês, os comentadores deste canal são em sua maioria exclusivos.

3) Comunidade espanhola : gráfico orientado com 5866 nós e 9843 arestas.



Três regiões autônomas são observadas. A região vermelha é o canal 40.000, a região preto-laranja é o canal 45.000. A região azul-violeta-verde é o canal 46000.

O conteúdo dos três canais é representado pela arte dos fãs. Provavelmente, a divisão em regiões isoladas está relacionada às especificidades da divisão na comunidade. Por exemplo, o conteúdo do canal 40.000 é principalmente relacionado ao cosplay, e os links para ele também levam a canais de cosplay.

4) A comunidade coreana : gráfico focado em 4113 nós e 6763 arestas.



São observadas duas grandes (azul violeta e verde-preta), bem como várias pequenas regiões autônomas (framboesa, laranja, verde escuro e assim por diante).

Região azul violeta: canal 57000. Região verde-preta - canais 51000, 52000 e 53000.

Em geral, todas as regiões são representadas por comentários sobre o conteúdo relacionado a Touhou. À distância do resto, às vezes são exibidos comentários de vídeos com conteúdo não Touhou, por exemplo, 52003 .

As comunidades espanhola e coreana são semelhantes: a maioria dos comentaristas acumula canais com muito conteúdo, os canais restantes são claramente separados deles. A comunidade russa, em comparação, interage mais fortemente, como pode ser visto na região geral dos comentários. Isso se deve ao fato de a maioria dos canais russos do YouTube representados na amostra estarem conectados por meio de links colocados nos canais.

5) Todas as comunidades - linguística local (2, 3, 4) e internacional (1) : gráfico orientado com 62340 nós e 185412 bordas.



Há um acúmulo geral de comentários e ramificações saindo dele.

O ramo verde escuro na direção noroeste é a comunidade russa.



Comunidade espanhola (cor cinza): sua parte principal está concentrada no sudoeste.



Um ramo separado da comunidade espanhola, representado pelo canal 40.000, fica na direção nordeste.



O ramo preto na direção sudeste é a comunidade coreana.



É notável que a comunidade coreana está mais intimamente ligada à internacional, sua parte principal (canal 57000) praticamente se fundiu à região do canal 13000.



A situação é semelhante com a comunidade espanhola, seu ramo sudoeste (canal 46000) é combinado com a região internacional (canal 20.000).



A parte principal da comunidade russa (canal 38000) está localizada a uma grande distância da região internacional mais próxima.



Classificação do canal por grau de interação


Para concluir nossa análise, vamos falar sobre classificação de canais. Nossa abordagem é baseada em uma observação muito simples. Se permitirmos uma correlação entre o arranjo espacial dos comentários e sua interseção com muitos outros comentários, quanto mais próximo um único comentário do cluster central, maior será essa interseção.

Com base nisso, você pode classificar os comentários de canais e vídeos individuais, no idioma local e internacional. Um exemplo de classificação de canal, dependendo da proximidade / distância dos comentários de um centro global comum, é apresentado na tabela (os canais são distribuídos para baixo em ordem decrescente de interação).



Deve-se esclarecer que essa é apenas uma das opções de classificação mais simples quando os grupos locais dependem diretamente da região global. No entanto, a visualização de grupos locais mostrou heterogeneidade na distribuição de comentários externos (globais) e internos (locais) dos comentaristas. A alta conectividade de alguns canais das comunidades espanhola e coreana praticamente os faz parte da região global, mas eles são fracamente conectados a outros canais locais. Por exemplo, a comunidade espanhola, com integração relativamente alta com a região global, é dividida em duas regiões praticamente desconectadas de dentro. A comunidade russa é relativamente distante da região internacional e demonstra uma forte conexão interna. Esses exemplos mostram as limitações de um modelo simples para classificar grupos locais em relação a um centro global comum. Isso também indica a possibilidade de criar um modelo que inclua especificidade local como critério de avaliação. Obviamente, essa tarefa requer um estudo separado, o que faremos.

Source: https://habr.com/ru/post/pt418733/


All Articles