在此之前,我注意到评分的奇怪行为,但是最近,陌生感已经很明显地表现出来了。 因此,我决定使用我可以使用的科学方法来研究该问题,即:分析正负的动力学。 突然想像?
我仍然是程序员,但是我知道如何做一些基本的事情。 因此,我编写了一个简单的实用程序,该实用程序从Habrovsky帖子的面板中收集统计信息:优点,缺点,视图,书签等。

经过研究,统计数据以图形显示,有可能发现更多的惊喜,较小的惊喜。 但是首先是第一件事。
奇怪1。实际上,有了她,我的统计研究就开始了。
在我发布某些帖子后的最初几个小时里,它们突然变为负数,然后将其重置为零,最后获得了预期的加分,这对我来说似乎很奇怪。 为什么会这样呢?
我正要发表另一篇文章-分两部分。 他决定对其进行统计准备。
发表了第一部分。 同时,他启动了该实用程序并开始等待结果。 不幸的是,在晚上-我喝醉了-程序由于承认的错误而停止收集信息。 第二天早上,我更正了该错误,但统计结果却是一天之内不完整。 但是,工作时间的趋势很明显。
从发布之日起的前14个小时提供数据,两次测量之间的间隔为10分钟。

眼睛没有被欺骗:大多数缺点都在发布的第一个小时。 首先,该职位突然出现,然后拉直。 以下是构建图表的数字:

而且,尽管事实顺利地增加了意见!

从减少千分之一开始的步骤可以解释为,减少始于Khabrovsky小组:无处可获取确切数量的视图(它可能来自第三方服务,但我没有使用它们)。
我在统计方面并不特殊,但是据我所知,这样的负数分布是异常的!
看,书签在注册期间或多或少均匀地分布:

评论也平均分配:

观察到活动和被动爆发,但它们也按时间段分布:注释逐渐消失,然后恢复。
与订阅者相同-统一略有增加:

报告期内的业力没有改变-我没有提出。 评级是由哈布雷(Habré)计算得出的,将其带走是没有意义的。
所有指标都与视图数成比例地变化,并且只有一些缺点,这是一个错误:从发布开始的第一个小时就出现了苦涩。 我以前的帖子也观察到了同样的情况。 但是,如果可以说,以前是个人印象,现在,现在可以通过注册确认。
在我纯粹的努比亚看来,这样的分配意味着:有几个用户坐在网站上有目的地查看最新发布的帖子,而仅根据他们所知道的需求,某些帖子被剔除。 我之所以写“一些帖子”,是因为我不仅在出版物中注意到了这种效果。 在所有情况下,效果都是明显的,否则我根本不会关注它。
对于这种情况,我有四个版本。
版本1。精神扭曲。 生病的人特别警惕不愉快的作者和负号,以伤害他人。
我不相信这个版本。
版本2。心理效应。 哪个-我不知道。 好吧,为什么读者首先一致地减去一个帖子,然后至少一致地加上一个帖子? 减为非主题主题,但占多数的鉴赏家为佳? 我不知道,我也不知道。
如果读者中有心理学家,请让他们说出自己的话。
版本3。仆人可以使用。 上帝知道,为什么他们的老板诽谤哈布罗夫的职位。 但是,不仅在我们国家有军人。 谁能理解他们,俄罗斯恐惧症?
版本4。先前确定的因素
的综合影响。
这是完全可以想象的。
尽管如此,最小用户设法减少了视图数量。 我不熟悉将Khabrov的帖子放在顶部的规则,我什至都不知道这些算法是否已公开,但是对我而言,这很明显:早期的小众阻止阻止被排斥的帖子到达顶部-更确切地说,它延迟了到达那里的时间,这反过来很明显次,减少了观看次数。
据我了解,目前还没有有效的方法来对抗这种邪恶。 唯一的方法是个人投票。 仅在这种情况下,您才能确定定期跟踪来自哪个配置文件,并减去最新帖子。 但是,哈布雷(Habré)没有进行任何投票表决(或者不会公开)。
但不是那么简单。
就像我说的那样,准备好的材料是分部分出版的。 在第二部分发表之后,我希望看到类似的情况:最初的出口为减号,第二个出口为加号。 但是,结果却变得更加顺畅:帖子并没有负面影响。
到第二部分发布时,该错误已修复,因此每天都会提供数据:

我不知道平滑来自哪里。 也许是因为星期六出版(星期六的普通读者不起作用?),或者因为这是以前出版的材料的结尾。
但是,负号的分布仍然不平衡:所有负号都在注册期的前半部分,负号的结束时间比正号早得多。 同时,视图在时间段内的分布与上次完全相同-平均:

下午三点左右发生的飞跃未分类。 仅一个小时,我的互联网就被切断了。 该实用程序无法连接到该站点。

其他所有内容都是完全标准的。
书签:

评论:与上一次一样,活动周期与沉默周期交替。

业力 记录了几个单位的增加-当然,不是同时发生的:

和订户。 总人数保持不变(显然,那些希望在第一部分出版时签约的人)。 下午只有一个小时左右出现了一次波动:有人取消了订阅-可能是错误的-但立即再次签约。 如果是另一个人,则会发生补偿:订户总数未更改。

因此,发布指标的行为是可以理解和可预测的。 除负数外的所有指标。 由于我没有看到明显的原因,因此我发现负峰值至少很奇怪。
奇怪2。有时视图的数量会减少(这当然是不可能的),但很快就会恢复正常。
我在程序调试过程中意外跟踪了它,当时还没有附加export-import函数,因此图表上缺少相应的之字形。 您可以说一句话-这种效果已观察到两次。 几千次观看后,观看次数突然减少了几百,在10到20分钟后,它又恢复到以前的水平(不考虑自然增加)。
这样就很简单:网站上的错误。 没有什么可考虑的。
奇怪3。在我看来,这比自愿的第一效果和技术的第二效果更奇怪。 加号不会单独发生,在此期间内分布均匀,而是成块分布。 但是加的不是评论,当问题自然地跟随答案时,它们就是个人行为!
看一下上面发布的结果图:这些块很明显。
博学的人在Poisson分布点头向我点头,但是我自己却无法计算概率。 如果有能力,请数数。 对我来说,显而易见的是,加号的次数比常规的要高得多。
这是帖子第一部分内容的数字数据。 该图显示了评分总数中每单位加号的数量,两倍和三倍的位置。 如前所述,测量间隔为10分钟。

从30个戳入84个单元中,两个单元被戳了3次。 好吧,我不知道这与概率论有多少对应...
帖子第二部分的数据(由于测量时间较长,为了便于比较,我将其缩短了第一部分的持续时间):

顺便说一句,这里的一个加号在时间上与三个加号相邻,也就是说,在大约20分钟内,加号激增了(送出的加号总数的29%)。 而且这在发布的最初几分钟内没有发生。
单,双和三位置之间的比率与第一部分的比率大致相同。 评级设置频率降低的事实解释了评级在测量中所占份额的下降。 进行了测量,但未记录任何优点。
我无法以任何方式(即完全以任何方式)来解释这种块填充的效果。 令人厌恶的是,这种“块状”行为似乎并不典型。
好的发射者分批发送建议,然后打开和关闭? 呵呵呵呵...
聚苯乙烯如果有人希望使用更高级的方法来分析帖子的统计信息或检查算术,则包含源数据的文件位于:
yadi.sk/d/iN4SL6tzsGEQxw我并没有坚持我的怀疑-也许我是错的,特别是因为在统计数据中没有贝尔梅斯。 我希望专业统计学家,心理学家和其他感兴趣的用户的评论可以澄清所产生的困惑。
谢谢您的关注。