可视化国际和本地东方社区的YouTube频道的评论

大家好! 我们提出了第一篇文章的想法,并继续在YouTube上可视化和研究评论。 这次,我们将与全球和本地YouTube社区合作。 用不同语言撰写的评论员如何互动? 一个全球社区是由许多地方团体组成的,还是比看起来复杂得多? 东方项目从何而来? 让我们找出答案。



评论和社区-类型详细信息,数字,语言范围


为了回答这些问题,我们探索了属于东方项目社区(东方项目)的YouTube频道评论员群体之间的关系。 通常,这些频道与Dammaku类型的一系列同名计算机游戏(具有大量子弹的垂直射击游戏)相关联。 基于游戏创作了大量的粉丝艺术。 YouTube频道的主要内容是粉丝艺术,包括相关的游戏,播放,流,音乐,动画等。

此类频道的受众相对较小,因此,一方面,数据易于处理和可视化,另一方面,调查结果只能推论到小型主题YouTube社区。

在研究中,选择了三个本地语言社区(俄语,西班牙语和朝鲜语)的评论(名称基于评论中的主流语言)。 在有条件的国际社会类别中,意见以英语审议,部分以日语审议。 由于Touhou Project最初是在日本生产的,因此,假名(Kana)被用作所有其他语言的描述元素。

社区数据


所有通道数据均已编码。 唯一的千位数分配给每个通道,片段的通道号+序列号分配给每个片段。

国际社会以25个渠道为代表。 总共处理了243281条评论。 编码:1000-25000。

1000,2000,3000,4000,5000,6000,7000,8000,9000,10000,11000,12000,13000,14000,15000,16000,17000,18000,19000,20000,21000,22000,23000,24000,25000

2)俄罗斯社区由9个频道代表。 总共处理了6417条评论。 码:30000-38000
30000,31000,32000,33000,34000,35000,36000,37000,38000

3)西班牙社区由8个频道代表。 总共处理了14483条评论。 码:40000-47000
40000,41000,42000,43000,44000,45000,46000,47000

4)韩国社区由8个频道代表。 总共处理了12968条评论。 码:50000-57000
50000,51000,52000,53000,54000,55000,56000,57000

可视化结果


1) 国际社区 :面向50552个节点和117906个边的定向图。



尽管注释字段具有一般的同质性,但仍可以看到两个轮廓清晰且分散的自治区域。

西部的自治灰色区域-评论8000频道的广告。



隔离的区域对应于频道8000的非东方内容。基本上,这些是具有游戏“ 最终幻想”的配乐的视频(例如, 此视频 )。

东北自治的绿色区域-评论7000频道的视频。



Roller 7024聚集了许多独特的评论员。 视频的内容是游戏Undertale的段落。 该游戏有自己的粉丝社区。 大概唯一的评论者来自那里。

南部分散的米色区域为3000航道。



最孤立的区域是有关GTA和其他非东方游戏( 3015、3036、3038、3049、3051、3063等)的视频。

也就是说,国际社会中大多数偏远地区都是与东方无关的内容。

2) 俄罗斯社区 :在3655个节点和5180个边上的定向图。



有一个公共的注释字段,该字段通常分为两部分,以及一个突出显示的(紫色)区域。

突出显示的紫色区域-38000频道视频 ,代表原始内容-由频道英文字幕的作者为日语作品准备。 对英语视频的评论,此频道的评论员大多是唯一的。

3) 西班牙社区 :带有5866个节点和9843个边的定向图。



观察到三个自治区。 红色区域为通道40,000,橙黑色区域为通道45,000,蓝紫色绿色区域为通道46000。

这三个频道的内容均由粉丝艺术代表。 划分为孤立区域的可能性可能与社区内划分的细节有关。 例如,频道40,000的内容主要与角色扮演相关,并且到该链接的链接也指向角色扮演频道。

4) 韩国社区 :重点关注4113个节点和6763个边的图形。



观察到两个较大的区域(紫蓝色和绿色-黑色),以及几个较小的自治区域(覆盆子,橙色,深绿色等)。

紫蓝色区域:通道57000。绿黑色区域-通道51000、52000和53000。

一般而言,所有地区均以对东方相关内容的评论为代表。 在与其他地方的距离很远的地方,有时会遇到不包含东方内容的视频(例如52003 )的评论。

西班牙和韩国社区相似:大量评论者积累了很多内容的频道,其余频道显然与它们分开了。 相比之下,俄罗斯社会的互动更加紧密,正如在一般性评论区域中所看到的那样。 这是由于以下事实:示例中代表的大多数俄罗斯YouTube频道都是通过放置在频道上的链接相互连接的。

5) 所有社区-本地语言(2、3、4)和国际(1) :具有62340个节点和185412个边的面向图。



总体上积累了评论和分支。

西北方向的深绿色分支是俄罗斯社区。



西班牙社区(灰色):其主要部分集中在西南地区。



以40,000频道为代表的西班牙社区一个单独分支位于东北方向。



东南方向的黑色分支是朝鲜族。



值得注意的是,朝鲜族与国际社会的联系更加紧密,其主要部分(57000频道)实际上已与13000频道区域合并。



西班牙社区的情况与此类似,其西南分支(46000频道)与国际区域(20,000频道)合并。



俄罗斯社区的主要部分(38000频道)与最近的国际区域相距很远。



互动程度对频道的排名


总结一下我们的评论,让我们来谈谈频道排名。 我们的方法基于一个非常简单的观察。 如果我们允许评论的空间布置及其与许多其他评论的交集之间的相关性,则单个评论越靠近中心群集,则该交集就越大。

基于此,您可以对本地和国际频道和视频的评论进行排名。 表格中列出了一个频道排名的示例,该排名取决于与通用全局中心的评论的接近度/距离(频道以交互作用的降序向下分布)。



应该澄清的是,当本地群体直接依赖于全球区域时,这只是最简单的排名选项之一。 但是,本地组的可视化显示评论者的外部(全局)和内部(本地)注释的分布不均。 西班牙和朝鲜族社区的某些渠道的高度连通性实际上使它们成为全球区域的一部分,但它们与其他本地渠道之间的联系松散。 例如,与全球区域融合程度较高的西班牙社区从内部被划分为两个几乎没有联系的区域。 俄罗斯社区与国际区域相距较远,并且内部表现出强大的联系。 这些示例显示了相对于通用全球中心对本地群体进行排名的简单模型的局限性。 这也表明创建包含局部特异性作为评估标准的模型的可能性。 显然,此任务需要单独进行研究,我们将做。

Source: https://habr.com/ru/post/zh-CN418733/


All Articles