然后是下一个学年的9月1日,鲜花,糖果,幸福的眼泪就这样发生了,仅此而已,在准备该学院演讲的过程中,我遇到了非常有趣的数据 。 我看到这可以在GePhi中快速精美地绘制 ,并遇到了Johannes Delitsch的故事。 Delich在莱比锡(Leipzig)担任小学老师,并收集了有关谁是朋友的数据(在1880学年,他和谁是他的班上的朋友)。 而且,这是最早记录的社交图谱之一。

当时的班级很大(该班级已经有53名学生),据我所知,老约翰尼斯一直担任家教直到1880年。 因此,在新学年伊始,看到我的第四个字母“ A”(老实说,我不知道那封信是什么,它并不那么重要)之后,约翰尼斯感到有些难过。 显然,他很活跃,决定更好地了解托付给他的暴民的社会关系。
资料
约翰尼斯不是一位现代社会学家。 他是一名学校老师,因此他的数据收集方法既漂亮,赞美又折衷。 他与学生交谈,阅读他们的作业,并“观察他们如何在小组中交流”。 结果是一个相当繁茂的数据集,Delic在此基础上撰写了Zeitschriftfür上的一篇文章。
Kinderforschung(德语中的任何单词都听起来很吓人,请事先对不起,但是“儿童研究杂志”的字面翻译在俄语中听起来更加令人毛骨悚然)。 据我了解,约翰内斯主要对孩子的表现和他的受欢迎程度在同学之间的关系感兴趣,因此,除了描述他与谁成为朋友的定向图之外,Delic还给学生评分(从最成功到最失败)。有趣的选择。 例如,班上有四名二年级学生,他们在数据集中突出显示。 班上还有一个叫Lasch的家伙,他的祖母是糕点师傅。 Delic注意到Lash用糖果对待其他孩子,并在他的数据中指出了这一点。 他还分别确定了患有健康问题的孩子,例如贫血,la行或发育迟缓。

“友谊矩阵”描述了谁是朋友以及与谁在一起。 计数是有针对性的,因为汉斯可以将弗雷德里克视为朋友,而弗雷德里克,也许他想在汉斯打喷嚏。
我们班上最好的人
让我们将此社交图放在GePhi中,例如计算PageRank并为顶点着色。

更多“有影响力”的学生会以更饱和的颜色绘画。
让我们“突出显示”具有最高PageRank的七个学生(我将解释为什么稍后恰好七个,让我们仅将七个作为基本常数)。 如果您选择图形中具有最高PageRank的七个顶点,则会发生这种情况。

1880年第四个“ A”派的舆论领袖。
我们已经讨论过这些家伙了! 首先,所有四岁以下的孩子都“处于顶峰”。 我决定选出7个人,因为以Schnabel的名字命名的4岁的4岁孩子中的一个不是很酷。 它具有第七个PageRank值。 虽然二年级学生Pheil和Vetter自信地(并且有很大的优势)在“权威”列表中排在第一和第二行,而二年级学生Schubert-第四,仅次于“权威” Lasha(仅次于竞争)与糖果的分布)。 施纳贝尔排名第七。 权威较高的是Schlegel班上最好的学生,而Meinhold上的第五位最成功的学生。 我们对此Maynhold一无所知,Delich并没有给我们留下任何关于他的特殊信息,因此我们将他指定为照片中的“陌生人”。
手鼓节拍和模块化等级计算
GePhi有一个工具可以在我们的第四个“ A”组中找到兴趣组。 本文描述了该算法,GePhi使用的实现也在此处 。 总体思路是该算法尝试评估网络中哪些社区更密集。 只需几步,该算法就可以将社区细分为不同的内容,因此接下来要做的只是根据单个结果投掷和打铃鼓,这不会降低过程的趣味性。 因此,我们的第四个“ A”社区搜索算法绘制了这种颜色。

告诉我你是谁的朋友,我会说你是徒劳的。
让我们看看发生了什么。 我们七个最有影响力的人都属于四个主要社区。 Pfail,Fetter和Schubert这三个“很酷”的常年常年掉进了社区,照片上都是绿色。 “ Nekrutoy”重复性的Schnabel和Schlegel班上最好的学生陷入了一个涂成紫色的社区。 最终,糖果经销商Lash掉入了图中浅蓝色指示的社区。 迈因霍尔德仍然是个谜。 他最后是一小组“收藏夹”,其中只有三个学生(包括他本人),她被涂成深灰色。 在四个有健康问题的孩子中,有两个根本不与任何人成为朋友,另外两个则陷入了蓝色社区。
那好 许多事情开始得到解决。 显然,施纳贝尔不是一个“酷”的重复,因为他没有和硬汉呆在一起,而是和一些与书呆子史莱格成为朋友的书呆子交流(很有趣的是,施纳贝尔和施莱格尔本人不是朋友,但是计算网络的模块化时,它会稳定地属于一个社区)。 拉什(Lash)和他的糖果组成了一个既不是书呆子也不是坏蛋的家伙社区,而Meinhold ...嗯... Meinhold是谁? 让我们看看“派对”中还有谁和他在一起。 与他一起进入同一个社区的另外两名学生是Mayer(Meier,学生评分第四)和Flash(Flasch,学生评分第三十五)。 嗯...三个家伙不再真正与任何人交流,但是其中两个学习得很好...

Superbad电影的画面。
简而言之,我想将这三个家伙视为来自19世纪德国的怪胎。 他们中的两个学习得很好,而第三个却没有与任何人交流,他只是在放学后干一个巨型人形机器人或Kriegsmarine,甚至更糟。 不是重点。
让我们将德国小学生的评分转换为平均评分。 我们将在2到5的范围内生成与正态分布相似的内容(德国人的评分等级为反比例,但根据我们的理解,当2未通过且5表示英俊时,我们将按照通常的等级进行所有操作)。 我们将每个学生与他的平均分数相关联,以便按此平均分数进行排名时,将获得与Delich数据相同的评分。 现在,让我们看看这四个组中学生的平均分数是多少。 同时,每个小组中平均有多少人成为成员,平均有多少人与他友好。 结果是这样的:

四组的平均分数和平均进出度。 颜色与图表的颜色相对应。
极客们通常学习很好,但是他们自己并不渴望结交朋友,也没有人会和他们成为朋友。 来自Schlegel和Schnabel政党的优秀学者平均研究程度低于怪胎,但就社会而言,他们的表现更好。 利他主义者(我叫拉什向他们分发糖果的小组)学习不好,但与其他孩子的朋友最活跃(尽管不是相互的)。 最后,坏人学到了最坏的东西,但他们很受欢迎(他们想和他们成为朋友),尽管就他们与朋友的人数而言,他们自己与极客们相距不远。
让我们来画一下不同社区的代表是谁的朋友

每个社区都是自己内部的大多数朋友,但是以其他方式与其他社区互动。
看到多么有趣! 利他主义者认为他们的朋友有很多好人,也有很多坏人。 利他主义者的坏人并不特别喜欢,但在这里,他们认为一些好人是他们的朋友。 从各方面来看,好人对与坏人的友谊不满意,但利他主义者面带笑容和免费糖果引起了他们克制的兴趣。
如果由于某种原因您更想从另一侧观看,这里是另一张奖品图片。

每个社区都是自己内部的大多数朋友,但是以其他方式与其他社区互动。
这是秋天第一周的有趣数据集。 2014年, 本文重新发现了第四个“ A”的数据。 事实是,第一次世界大战后德国还没有完成教学法,因此很长时间以来就遗忘了Delic收集的数据,但是现在事实证明,这几乎是第一个完整记录的社交图谱。 这样的事情。
原始数据发表在文章中:
Delitsch,J.,1900年。《德国经济学人》的ÜberSchülerfreundschaften。 ZeterschriftfürKinderforschung 5,150–162。
附言:有人多次问我这是什么道德。 我认为这是道德。
首先,即使是几列数字也可以隐藏戏剧。 是的,甚至什么。
其次,对于任何使用数据的人来说,“什么是道德?”这个问题的答案。 归结为“什么是质量指标?”
如果衡量标准是学习成绩,那么最好与优秀学生成为朋友。 实际上,所有二年级学生的成绩都不是全班最高,但学习成绩也不是最低。 他们在中间的某个地方闲逛,但社区中的其他孩子学得差得多。 也许二年级学生的表现相对较好是由于19世纪的德国学校对体育锻炼和运动给予了很多关注,因此二年级学生的``表现''被夸大了,原因是他们的身体更强壮。 尽管存在这种偏见,但围绕Schlegel的社区和极客社区的学习程度要比围绕二年级学生形成的社区好得多。
如果该度量标准在同龄人中很受欢迎,那么散布糖果是获得同样的受欢迎程度的一种相当昂贵且不是很有效的方法。 一方面,它有效:Lash是该课程中第三大最受欢迎的学生。 另一方面,他所在社区的“质量”(按社会知名度衡量)相当低。 也就是说,糖果使您在不太受欢迎的人中变得受欢迎。 其他与Lasha在一起的受欢迎的人不是朋友(既不是留级生,也不是Schlegel班上最好的学生)。
最后,如果度量标准是“真正的”朋友的数量(真正的朋友不是与您成为朋友的人,而是只有与您成为朋友的朋友),那么成为二年级学生就是这样。