A web fala apenas sobre canais do Telegram.
No entanto, ninguém ainda avaliou numericamente: que efeito os canais do Telegram têm na mídia? Hoje vamos tentar consertá-lo - e dar o primeiro passo na análise da conexão entre a mídia e o telegrama.
Questão-chave de pesquisa:
Qual o papel dos canais do Telegram na definição da agenda da mídia?
Para avaliação, usaremos a seguinte abordagem: coletaremos o conjunto de dados de notícias e avaliaremos qual parte se encaixa nos canais do Telegram. Aqui, coletamos para a análise de 67 mil postos de água-viva e analisamos suas fontes e links.
Vamos começar pelo interessante: as notícias sobre a Medusa têm uma fonte "oficial" especialmente alocada , e o texto também contém links para outras fontes, que as chamaremos aqui de "não oficiais".
Vamos começar com as notícias, onde a fonte é o Telegram: oficialmente (gráfico azul) e no texto (vermelho) - a diferença é cinco vezes maior. Como podemos ver, as águas-vivas começaram a se referir oficialmente e geralmente em princípio ao Telegram. Tendência: o número de notícias do Telegram está crescendo: como fonte oficial e como links!

Dados: para reproduzir os resultados e outras pesquisas publicadas em domínio público: conjunto de dados (67k textos de artigos) e CSV com meta-informações . Veja a metodologia e o código da coleção em um artigo de análise anterior da Medusa.
Sob o corte:
- Análise - Telegrama vs Facebook (e vs Twitter).
- Onde o Telegram está localizado entre outros fabricantes de notícias e fontes?
- Como está crescendo a influência do telegrama?
- Quais canais são mais frequentemente referenciados?
- O que pode ser deduzido de tudo isso?
Telegram vs Facebook
Como observamos, a popularidade do Telegram entre as fontes de mídia está crescendo, enquanto a popularidade das redes sociais clássicas individuais. redes, por exemplo, o Facebook, está caindo - como se o Telegram começasse a corroer parte da torta do Facebook:

No entanto, observe que, por exemplo, o Twitter não desiste de suas posições com tanta facilidade - e parece que o Twitter se estabilizou (e não cresce mais) em uma boa posição, o Facebook está caindo e a participação dos Telegramas está crescendo - e, a julgar pelo momento em que parece ter desempenhado um papel aqui, Telegrama exatamente.

Onde está o telegrama entre as fontes?
Como vemos, a mídia não tem pressa em reconhecer o Telegram como uma fonte oficial (e eles estão apenas começando a fazê-lo), enquanto o cita ativamente - vemos que não há Telegrama entre fontes oficiais (durante todo o período da existência da Medusa), enquanto entre o mais citado que ele já conheceu.
Se olharmos para a mídia clássica - por exemplo, Kommersant, veremos que não existe esse efeito aqui - destacando em azul: o número de links em ambos os casos é aproximadamente igual. Enquanto a imagem do Telegram se parece muito com as redes sociais - a mídia pega ativamente o conteúdo a partir daí, mas não a coloca como fonte oficial: isso é mostrado na tabela no exemplo do Twitter (destacando em vermelho o mesmo que o Telegram) - a segunda fonte mais citada, mas oficial não é.

Mudança na classificação ao longo do tempo
Como vimos nas linhas de tempo das citações: a tendência geral é o crescimento do telegrama; além disso, antes de 2017-2018, não estava realmente nas fontes e citações das notícias; portanto, é lógico considerar os últimos três anos separadamente e, em seguida, a imagem das fontes muda significativamente:

De fato, vemos que o Telegram, como fonte de conteúdo de notícias, está crescendo constantemente - especialmente em relação a outras redes sociais: o Facebook e o VK.com estão perdendo espaço onde o Telegram está crescendo.
Se a tendência continuar, o Telegram entrará nas 5 principais fontes de conteúdo em um futuro próximo.
Principais canais em links oficiais e citações no texto
Também é interessante observar a quais canais a Medusa se refere com mais frequência, entre os 15 principais canais para citações nas notícias:

E compare com as referências como fonte oficial:

A partir daqui, você pode ver que o líder absoluto é o Mash, especializado em notícias "urgentes". Enquanto as fontes oficiais são organizações condicionais, por exemplo, o serviço de imprensa dos tribunais de São Petersburgo (o que é bastante irônico, dada a liminar sobre o trabalho do telegrama na Rússia). Para eles, o canal é um dos principais meios de alerta, e é lógico que eles possam desempenhar o papel de fontes oficiais da mídia.
Examinando o conjunto de dados de artigos, encontrei o seguinte padrão: o tamanho médio do título em caracteres cresce constantemente, se em 2014 um título típico soasse como
"A companhia aérea de baixo custo da Aeroflot mudou de nome" = 40 caracteres
Então, em 2019, já está mais perto de
"Os funcionários da EMERCOM não salvaram o manequim de treinamento. Ele foi arrastado por um cavalo assustado" = 80 caracteres

Talvez isso se deva à peculiaridade dos mecanismos de busca, bem como à peculiaridade do trabalho das redes sociais (onde as pessoas geralmente não leem além do título, ou precisam ser "atraídas" para clicar no título).
Por que a Medusa foi escolhida e o que fazer a seguir
Análise adicional
Obviamente, a análise e a pesquisa com base em uma mídia não podem ser 100% confiáveis e refletir completamente a agenda de informações da mídia - é necessário realizar uma análise com base em várias mídias principais, por exemplo, com base nos três negócios - Vedomosti, RBC, Kommersant. Se você tiver acesso ou um arquivo substancial de suas notícias (de preferência novas; e se houver outras mídias) - me avise.
Além disso, é necessário elaborar um mapa interno do próprio Telegram - como os canais são interconectados - veja meu artigo sobre a conexão de Hubs e a análise do gráfico de conexão de artigos .
Sobre problemas e metodologia de análise
A escolha da Medusa para análise não é acidental - aqui daremos um aperto, por que foi escolhida e que problemas surgem com outras publicações.
Em primeiro lugar, publicações como Vedomosti e Kommersant, por via de regra, não colocam hiperlinks para fontes, mas fornecem apenas uma descrição textual de onde as informações vieram. Por exemplo, as notícias de um empresário: "Abrau-Durso diminui o grau" - há apenas um link textual para uma fonte no espírito "... disse o presidente da Abrau-Durso, em entrevista ao jornal Vedomosti, em fevereiro de 2019". Isso significa que a tarefa de determinar links se torna exponencialmente mais complexa, transformando-se na tarefa de PNL e de correspondência de identidades. Vamos dar um exemplo simplificado para entender o problema da correspondência de identidade: no artigo vc.ru " Ainda não banido: como o Telegram ajudará a obter um visto para os EUA ", os criadores do canal Fora do Escritório compartilham sua experiência na obtenção de um visto - não há link para o canal no texto, com a mesma frequência acontece com a mídia comum. Portanto, mesmo que tenhamos determinado o nome do canal a partir do texto e que sejam Telegramas, ainda precisamos corresponder ao próprio ID do canal: OutOfOffice ou out_of_office? A resposta correta pode ser encontrada no link para o canal (e o canal em si não é ruim - sobre eventos culturais e viagens, eu recomendo).
Na verdade, como nasceu a ideia deste artigoArgumentei com um dos autores do canal - o Telegram estará nas principais fontes de mídia? Certamente, registramos que assumiremos o top 5. Eu tinha quase certeza de que ainda não e parece que a disputa venceu. Embora essa conversa não tenha acontecido em 2019, mas, por exemplo, em 2022, eu não teria tanta certeza do resultado da disputa.
Em segundo lugar, até onde eu sei, nenhuma mídia de negócios fornece uma API pública para acessar seus artigos; além disso, há motivos para acreditar que eles não ficarão muito felizes com a análise sistemática de seus artigos. Nesse caso, você também precisará ignorar a proteção contra a análise e possivelmente iterar de maneira não trivial todos os artigos.
Em terceiro lugar, há um problema em que é impossível separar o “principal” (fonte oficial) do “não principal” (material adicional), por exemplo, pegue a notícia “ Dados pessoais de milhões de russos vazaram pelos pregões ” - há um link principal e outro cinco como material adicional. Nesse caso, não é possível realizar uma análise semelhante à que fizemos aqui (sem uma mudança significativa na metodologia e na análise adicional - que também é uma tarefa de pesquisa não trivial da PNL).
Isso significa que teoricamente só é possível usar o RBC para uma comparação experimental limitada. Além disso, a coleta e a seleção dos dados necessários serão significativamente mais complicadas e exigirão métodos adicionais de filtragem de ruído, além de contabilização e identificação de links de texto, além de hiperlinks em artigos.
Conclusões
Resumimos os principais pontos do estudo:
- O telegrama está se tornando a principal fonte de conteúdo de mídia; em breve, poderá entrar nos 5 principais
- A participação das redes sociais clássicas está caindo e parece que o Telegram aumenta devido a elas
- A mídia cita o Telegram, mas raramente o reconhece como fonte oficial.
- Uma avaliação confiável requer uma análise abrangente com base em vários meios-chave
- O telegrama está crescendo como uma plataforma de conteúdo, e o padrão de comportamento da mídia é semelhante ao trabalho com as mídias sociais. redes: canais do autor, perfis em redes sociais e como "mídia dentro da mídia" - onde as organizações substituem o Telegram por um "site" condicional e o usam como um canal para disseminar informações
E se brevemente:
À noite no Telegram - de manhã no jornal.