研究:媒体关注电报频道中的内容

网络上 谈论电报频道。


但是,尚无人进行数字评估:电报频道对媒体有何影响? 今天,我们将尝试对其进行修复-并开始分析媒体与电报之间的连接。


关键研究问题:


电报渠道在制定媒体议程方面扮演什么角色?

为了进行评估,我们将使用以下方法:我们将收集新闻数据集并评估哪些部分属于电报频道。 在这里,我们收集了用于分析的6.7万条水母职位,并分析了它们的来源和链接。


让我们从一个有趣的话题开始:关于美杜莎的新闻有一个专门分配的“官方”消息源 ,并且文本中还包含指向其他消息源的链接,我们在这里将它们称为“非官方”消息。


让我们从新闻开始,新闻的来源是电报:正式(蓝色图表)和文本(红色)–区别是五倍。 正如我们所看到的,水母才刚刚开始正式使用,通常原则上是指Telegram。 趋势:电报新闻的数量正在增加:作为官方消息来源和链接!



数据:再现结果并在公共领域进行进一步研究: 数据集 (文章的67k原文)和具有元信息的CSV 。 请参阅先前的 Medusa分析文章中的收集方法和代码。


下切:


  • 分析-电报与Facebook(以及Twitter)。
  • 在其他新闻发布者和消息来源中,Telegram位于何处?
  • 电报的影响力如何增长?
  • 最常引用哪些渠道?
  • 从这一切中可以得出什么?

电报vs Facebook


正如我们指出的那样,电报在媒体资源中的流行度正在增长,而单个经典社交网络的流行度则有所提高。 网络(例如Facebook)正在崩溃-好像Telegram开始吞噬一部分Facebook蛋糕:


电报vs Facebook vs Twitter


但是,请注意,例如,Twitter不会轻易放弃其职位-似乎Twitter处于稳定状态(并没有进一步增长),处于一个良好的位置,Facebook正在下滑,而Telegrams的份额正在增长-并以它在这里扮演角色的时间来判断准确地电报。



消息来源中的电报在哪里?


正如我们所看到的,媒体并不急于将Telegram视为官方消息来源(他们才刚刚开始这样做),而他们却在积极引用它-我们看到,官方消息来源(在美杜莎的整个生存时期)都没有Telegram。被引用次数最多的他已经见过。


如果我们看一下经典媒体(例如Kommersant),我们会发现这里没有这种效果-以蓝色突出显示:两种情况下的链接数大致相等。 尽管Telegram的图片非常类似于社交网络-媒体积极地从那里获取内容,但并未将其作为官方来源:这在Twitter示例的表格中显示(红色突出显示,与Telegram相同)-引用次数第二高,但来自官方来源不是。



排名随时间变化


正如我们在引文时间表中所看到的那样:总体趋势是电报的增长,此外,2017-2018年之前实际上没有出现在新闻来源和报价中,因此将过去三年分开考虑是合乎逻辑的,然后来源的情况发生了重大变化:



实际上,我们看到Telegram作为新闻内容的来源正在稳步增长-尤其是与其他社交网络相关:Facebook和VK.com都在Telegram增长的地方失去了地位。


如果这种趋势持续下去,那么Telegram将在不久的将来进入前5名的内容来源。

官方链接和文字引用中的热门频道


查看美杜莎最常使用的频道,并在新闻中引用前15个频道,也很有趣:



并与作为官方来源的参考文献进行比较:



从这里您可以看到绝对领导者是Mash,他专门研究“紧急”新闻。 例如,虽然官方消息是有条件的组织,但圣彼得堡法院的新闻服务(考虑到俄罗斯电报工作的禁令,这具有讽刺意味)。 对他们来说,渠道是主要的警告手段之一,因此,它们可以发挥官方媒体的作用是合乎逻辑的。


关于标题内容丰富的有趣观察


通过检查文章数据集,我发现以下模式:以字符为单位的标题的平均大小正在稳定增长,如果在2014年,一个典型的标题听起来像


“ Aeroflot的低成本航空公司更名” = 40个字符

然后在2019年,它已经接近


“ EMERCOM员工未能救出训练假人。他被一头受惊的马拖走了” = 80个字符


也许这是由于搜索引擎的特殊性以及社交网络工作的特殊性(人们经常阅读标题以外的内容,或者需要“吸引”他们才能单击标题)。


为什么选择美杜莎,下一步该怎么做


进一步分析


当然,基于一种媒体的分析和研究不可能100%可靠并不能完全反映媒体的信息议程-有必要在几种主要媒体的基础上进行分析,例如,基于商业三人组-Vedomosti,RBC和Kommersant。 如果您可以访问他们的新闻或拥有其新闻的大量存档(最好是新鲜的;并且还有其他媒体),请告诉我。


此外,有必要绘制一份电报本身的内部图-通道如何互连-参见我有关集线器 连接和文章连接图分析的文章


关于问题和分析方法


选择美杜莎进行分析并非偶然-在这里,我们将进行挤压,选择它的原因以及其他出版物所遇到的问题。


首先,诸如Vedomosti和Kommersant之类的出版物通常不会在源上放置超链接,而只会对信息的来源进行文字描述。 例如,来自商人的消息: “阿布鲁-杜尔索降低了学位” -精神上只有一个文字链接到消息来源“ ...阿布鲁-杜尔索总统在接受《韦多莫斯蒂》报纸的采访时说,2019年2月。 这意味着确定链接的任务成倍增加,实际上变成了NLP和身份匹配的任务。 让我们举一个简化的例子来理解身份匹配问题:在vc.ru上的文章“ 尚未被禁止:Telegram如何帮助您获得赴美签证 ”中,“外出”频道的创建者分享了获得签证的经验-文本中没有指向该频道的链接,通常发生在普通媒体上。 因此,即使我们从文本中确定了通道的名称并且它是电报,我们仍然必须匹配通道ID本身:OutOfOffice或out_of_office? 可以在指向该频道链接上找到正确的答案(该频道本身也不错-我推荐有关文化活动和旅游的信息)。


实际上,这篇文章的思想是如何诞生的

我与该频道的一位作者争论-Telegram是否会成为顶级媒体来源? 可以肯定的是,我们记录到我们将进入前5名。 我几乎可以肯定那件事还没有解决,看来这场纠纷胜了。 虽然这次对话并未在2019年进行,但例如在2022年,我不确定争议的结果。


其次,据我所知,没有一种商业媒体提供公开的API来访问他们的文章,而且,有理由相信他们不会对文章的系统分析感到满意。 在这种情况下,您还必须绕过针对分析的保护,并可能对所有项目进行不重要的迭代。


第三,存在一个问题,即不可能将“主要”(官方来源)与“非主要”(附加材料)分开,例如,新闻“ 数百万俄罗斯人通过交易大厅泄漏的个人数据 ”-有一个主要链接,另一个五作为附加材料。 在这种情况下,不可能进行类似于此处所做的分析(在方法和附加分析上无重大变化-这也是NLP的一项重要任务)。


这意味着理论上只能将RBC用于有限的实验比较。 此外,必要数据的收集和选择将大大复杂,并且除了文章中的超链接之外,还需要其他噪声过滤方法,以及文本链接的计费和标识。


结论


我们总结了研究的要点:


  • 电报正成为媒体内容的主要来源,可能很快就会进入前5名
  • 经典社交网络的份额正在下降,由于这些原因,Telegram似乎有所增加
  • 媒体引用了电报,但很少将其视为官方消息。
  • 可靠的评估需要基于几种关键媒体的综合分析
  • 电报正作为一个内容平台而发展,媒体行为的模式与其在社交媒体上的工作类似。 网络:作者的渠道,包括社交网络中的个人资料,也可以作为“媒体中的媒体”使用-组织将有条件的“网站”替换为Telegram,并将其用作传播信息的渠道

如果很简短:


晚上在Telegram-早上在报纸上。

Source: https://habr.com/ru/post/zh-CN449382/


All Articles