Visualização de comentários no YouTube: vídeos, canais, gêneros, gêneros cruzados

Olá pessoal! Tanner Stokes escreveu um complemento que refez o texto dos comentários no YouTube em "herp derp". Isso tornou a vida muito melhor para alguns. Seguimos o mesmo caminho, mas mudamos um pouco o conceito. Apresentamos comentários do YouTube na forma de imagens, ou melhor, gráficos com vértices e arestas. E visualizamos todos os tipos de objetos - de vídeos e canais a cruzamentos entre gêneros. Como fazemos isso? Vamos descobrir.



Por que visualizamos


Os filósofos dizem que não os fatos são importantes, mas sua comparação. Também é importante não comentarmos o vídeo em si, mas comparar as ações dos comentaristas em vídeos diferentes. Situações reproduzíveis de forma sustentável correspondem aos padrões visíveis na visualização. A principal tarefa que escolhemos é a visualização e detecção de regiões - padrões em sua base, bem como um mapeamento geral da interação dos comentaristas no YouTube, a fim de compilar um atlas de comentários.

De software


Até recentemente, usamos o serviço da web Raspador de comentários do YouTube para desinflar comentários , mas parece que ele deixou de ser suportado, para que você possa usar esse serviço.

Agora usamos nossa própria ferramenta, que nos permite divulgar os comentários de um ou vários canais como um todo, o que é muito mais conveniente para nossos propósitos.

Para visualização de dados, usamos Gephi v. 0.9.2 Para empilhar vértices e arestas, usamos o algoritmo Force Atlas 2. Para exibir estatísticas, são utilizadas as funções “Grau médio (ponderado)” e “Modularidade”.

Algoritmo


A questão surge, mas como rastrear comentários, que indicadores objetivos devem ser tomados para isso? Tentamos vincular os nomes de usuário aos identificadores dos vídeos - no nosso caso, a numeração sequencial deles, por exemplo, "OverlordXXX" - "1"; "Overlord XXY" - "2" e assim por diante. Em seguida, criou dois arquivos, “Nós” e “Bordas”, de acordo com este manual .

A visualização em Gephi é a seguinte. Os comentadores (1) estão conectados aos rolos (2), que é um comentário. Se o comentarista tiver comentado mais de um clipe, ele será associado a todos os clipes nos quais ele comentou (3).



Visualização de comentários em vídeo


Para comparar os comentaristas, três vídeos foram selecionados ( 1 , 2 , 3 ).

O resultado da visualização de comentários em vídeo no Gephi:



Os comentários nos vídeos são apresentados na forma de um gráfico direcionado com 10.462 vértices e 10.692 arestas. A visualização mostra que a interação dos comentaristas entre os três vídeos é pouco manifestada. Isso corresponde em grande parte à diferença no conteúdo dos vídeos, refletida no comentário de cada um deles. O primeiro vídeo demonstra a experiência com um magnetron. O segundo vídeo inclui a experiência e a cobertura de eventos não diretamente relacionados à experiência. O terceiro vídeo é dedicado apenas a eventos sem referência a experimentos.

Para a medição de controle, foram utilizados rolos do mesmo canal ( 1 , 2 , 3 ), mas, diferentemente dos anteriores, eles estão mais intimamente relacionados entre si em um contexto semelhante (experimentos envolvendo um dublê memético).

Resultados da visualização:



Os comentários nos vídeos são apresentados na forma de um gráfico direcionado com 10108 vértices e 10857 arestas. O contexto geral corresponde à forte interação dos comentaristas em pelo menos dois dos três vídeos.

Ou seja, a diferença, ou vice-versa, a comunidade de comentaristas em vídeos diferentes se correlaciona com os diferentes ou vice-versa no contexto geral dos vídeos. Curiosamente, a visualização, mesmo sem primeiro se familiarizar com o conteúdo, captura muito bem.

Visualizar comentários do canal do YouTube


Para visualização, 472.286 comentários de 172 vídeos de canais foram selecionados:



Uma nuvem de comentários comum vincula a maioria dos vídeos. Nesta base, podemos falar sobre o canal como uma integridade semântica (semântica e contextual). Mas também existem características regionais interessantes. É fácil ver as regiões de dois conjuntos simétricos de comentários destacados na parte superior da imagem, pintados em verde e azul:



Como se viu, eles são formados por comentários em quatro vídeos sobre fogos de artifício ( 1 , 2 , 3 , 4 ), onde foi realizado um desenho pirotécnico.

Pode-se supor que a conectividade relativamente baixa desses vídeos com o restante se deva à transição para eles por meio de links externos e, como resultado, a aparência de um público específico que está indiretamente relacionado ao restante do conteúdo do canal.

Conclusão preliminar - na visualização de comentários, a seleção de regiões funciona bem. E então você pode explorar uma região separada com a ajuda de métodos qualitativos - por exemplo, análise de conteúdo e etnografia.

Visualização de comentários do YouTube: revisão de filme


Nove canais do YouTube ( 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ) foram utilizados para trabalhar com o campo de gênero, cujos autores indicaram uma revisão de filmes como o principal tipo de conteúdo na descrição.

Visualização de 1 920 865 comentários em vídeos de todos os canais:



A visualização mostrou que dois canais grandes (de 1 milhão de assinantes) literalmente absorvem sete canais pequenos (até 500 mil assinantes). De fato, pequenos canais se tornaram regiões de grandes canais, o que é perceptível na imagem como a cor correspondente da região. Pode-se supor que os comentaristas de pequenos canais estejam principalmente entre os comentaristas de grandes canais. Ou seja, os diagramas de Venn são mais adequados para suas pesquisas, por exemplo, onde você pode ver exatamente quantos deles e em que proporções são apresentados em diferentes canais.

Para a comparação de controle, foram visualizados 513282 comentários de oito canais ( 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 ) no gênero de blog de beleza:



Uma forte interseção de canais é observada apenas em dois subconjuntos, enquanto dois canais (preto e lilás) estão relativamente fracamente conectados com os outros. Ao contrário do primeiro exemplo, os comentaristas de blogs de beleza têm menor probabilidade de interagir e, em alguns casos, são públicos relativamente isolados. Portanto, isso deve ser levado em consideração ao definir a cobertura máxima do público dos canais, por exemplo, para fins publicitários. Se, no caso de resenhas de filmes, basta solicitar publicidade em mais de um milhão de canais, no caso de blogs de beleza, você precisa solicitar publicidade, inclusive em canais isolados, caso contrário, seu público não será coberto.

Visualização de comentários de interseção entre gêneros


Para visualizar a interseção entre gêneros, três canais foram selecionados nos gêneros de blog de beleza ( 1 , 14.231 comentários em 115 clipes), experimentos ( 2 , 72.163 comentários em 81 clipes) e viagens ( 3 , 135.403 comentários em 482 clipes).

1) Visualização da interseção dos comentadores e experimentos do blog de beleza:



2) Visualização de comentaristas sobre experimentos e viagens:



3) Visualização do blog de beleza e comentaristas de viagens:



4) Visualização de comentaristas de todos os canais:



Visualmente, você pode ver que os comentaristas do canal em viagens e experimentos têm várias interseções e os comentaristas do blog de beleza, apesar de isolados do resto, estão mais associados aos comentaristas de viagens do que aos comentaristas de experiências.

Resultados Preliminares


A tendência geral de visualização justifica-se no caso do estudo de comentários.
No caso do estudo de canais ou vídeos individuais, a visualização permite destacar e detalhar as regiões de interesse do pesquisador. Isso simplifica bastante o estudo qualitativo subsequente de comentários e conteúdo de vídeo nos canais do YouTube.

Do lado prático, a visualização da interseção do público ativo do canal (comentaristas) pode ser útil, por exemplo, em casos de otimização da publicidade nos canais. Se durante a visualização for detectada uma interseção forte e estável de comentaristas de canais / conjuntos de canais, isso permitirá que você distribua corretamente a publicidade e, como resultado, economize em seu posicionamento.

Source: https://habr.com/ru/post/pt416931/


All Articles