Über die Kuriositäten der Habrostatistik

Früher bemerkte ich ein seltsames Verhalten bei Bewertungen, aber in letzter Zeit hat sich die Fremdheit zu deutlich manifestiert. Und ich beschloss, das Problem mit den mir zur Verfügung stehenden wissenschaftlichen Methoden zu untersuchen, nämlich: die Dynamik von Plus-Minus zu analysieren. Plötzlich vorgestellt?

Ich bin immer noch der Programmierer, aber ich weiß, wie man sehr grundlegende Dinge macht. Also habe ich ein einfaches Dienstprogramm codiert, das Statistiken aus den Panels des Habrovsky-Beitrags sammelt: Vor-, Nachteile, Ansichten, Lesezeichen und mehr.



Statistiken werden in Grafiken angezeigt, nach dem Studium konnten einige weitere Überraschungen gefunden werden, kleinere. Aber das Wichtigste zuerst.

Fremdheit 1.
Mit ihr begann tatsächlich meine statistische Studie.

Es kam mir seltsam vor, dass sie in den ersten Stunden nach der Veröffentlichung einiger meiner Beiträge abrupt negativ wurden, dann auf Null zurückgesetzt wurden und am Ende das erwartete Plus verdienten. Warum sollte das so sein?

Ich wollte gerade einen weiteren Beitrag veröffentlichen - in zwei Teilen. Er beschloss, es einer statistischen Vorbereitung zu unterziehen.

Veröffentlichte den ersten Teil. Gleichzeitig startete er das Dienstprogramm und begann auf das Ergebnis zu warten. Leider hörte das Programm nachts - während ich betrunken war - aufgrund eines bekannten Fehlers auf, Informationen zu sammeln. Am nächsten Morgen habe ich den Fehler behoben, aber die Statistiken waren für einen Tag unvollständig. Die Trends sind jedoch für die geleisteten Arbeitsstunden offensichtlich.

Die Daten beziehen sich auf die ersten 14 Stunden ab dem Datum der Veröffentlichung, der Abstand zwischen den Messungen beträgt 10 Minuten.



Die Augen werden nicht getäuscht: Die meisten Minuspunkte liegen in der ersten Stunde der Post. Zuerst ging der Pfosten abrupt, dann richtete er sich auf. Hier sind die Zahlen, auf denen das Diagramm aufgebaut ist:



Und das trotz der Tatsache, dass die Ansichten reibungslos zunehmen!



Die Schritte von Tausendstel werden durch die Tatsache erklärt, dass Reduzierungen im Chabrowski-Panel beginnen: Es gibt keinen Ort, an dem die genaue Anzahl der Ansichten ermittelt werden kann (es könnte wahrscheinlich von Drittanbietern übernommen werden, aber ich habe sie nicht verwendet).

Ich bin kein Spezialist für Statistiken, aber eine solche Verteilung der Minuspunkte ist meines Wissens ungewöhnlich!

Schauen Sie, Lesezeichen werden mehr oder weniger gleichmäßig über den Registrierungszeitraum verteilt:



Kommentare sind auch gleichmäßig verteilt:



Aktivitäts- und Passivitätsausbrüche werden beobachtet, aber sie werden auch nach Zeiträumen verteilt: Das Kommentieren verblasst und wird dann fortgesetzt.

Das gleiche gilt für Abonnenten - es gibt einen einheitlichen leichten Anstieg:



Das Karma für den Berichtszeitraum hat sich nicht geändert - ich bringe es nicht mit. Und die Bewertung wird von Habré berechnet, es macht keinen Sinn, sie zu bringen.

Alle Indikatoren ändern sich proportional zur Anzahl der Aufrufe, und nur mit den Minuspunkten stimmt etwas nicht: In der ersten Stunde nach Beginn der Veröffentlichung fällt ein bitterer Blitz. Das gleiche wurde bei meinen vorherigen Beiträgen beobachtet. Wenn es früher sozusagen persönliche Eindrücke waren, werden sie jetzt durch Registrierung bestätigt.

Meiner rein nubischen Meinung nach bedeutet eine solche Verteilung: Auf der Website sitzen mehrere Benutzer, die sich die neuesten veröffentlichten Beiträge gezielt ansehen, und einige der Beiträge, basierend auf den nur ihnen bekannten Bedürfnissen, werden minimiert. Ich schreibe "einige der Beiträge", weil ich diesen Effekt nicht nur in meinen Veröffentlichungen bemerkt habe. In allen Fällen ist der Effekt ausgeprägt, sonst hätte ich einfach nicht darauf geachtet.

Ich habe vier Versionen, warum dies geschieht.

Version 1. Geistige Verzerrung. Kranke Menschen schützen gezielt unangenehme Autoren und Minus, um Schaden zuzufügen.

Ich glaube nicht an diese Version.

Version 2. Psychologische Wirkung. Welches - ich weiß es nicht. Nun, warum lesen Leser zuerst einstimmig minus einen Beitrag, dann zumindest einstimmig plus? Minus als nicht thematisch, aber plus nach Kennern der Schönheit sind in der Mehrheit? Ich weiß nicht ich weiß nicht.

Wenn es unter den Lesern Psychologen gibt, lassen Sie sie ihr gewichtiges Wort sagen.

Version 3. Diener sind betriebsbereit. Warum sollten ihre Chefs die Chabrow-Posten verleumden - Gott weiß. Es gibt jedoch nicht nur in unserem Land Soldaten. Wer wird sie verstehen, Russophobie ?!

Version 4. Die kombinierten Auswirkungen zuvor identifizierter Faktoren.

Es ist durchaus denkbar.

Wie dem auch sei, Minusgeber schaffen es, die Anzahl der Ansichten zu reduzieren. Ich bin nicht mit den Regeln vertraut, nach denen Khabrovs Posts an die Spitze gestellt werden. Ich weiß nicht einmal, ob diese Algorithmen veröffentlicht wurden oder nicht, aber es ist mir klar: Eine frühzeitige Minusierung verhindert, dass geächtete Posts an die Spitze gelangen - genauer gesagt, es verzögert sich, dorthin zu gelangen, was wiederum erheblich ist reduziert die Anzahl der Ansichten.

Soweit ich weiß, gibt es keine wirksamen Möglichkeiten, dieses Übel zu bekämpfen. Der einzige Weg ist die persönliche Abstimmung. Nur in diesem Fall können Sie bestimmen, aus welchen Profilen die regelmäßige Verfolgung und abzüglich der neuesten Beiträge stammt. Es gibt jedoch keine registrierte Abstimmung über Habré (oder besser gesagt, es wird nicht veröffentlicht).

Aber nicht so einfach.

Wie gesagt, das vorbereitete Material wurde in Teilen veröffentlicht. Nach der Veröffentlichung des zweiten Teils erwartete ich ein ähnliches Bild: mit dem anfänglichen Ausstieg auf Minus und dem nächsten auf Plus. Der Effekt erwies sich jedoch als viel weicher: Der Beitrag wurde nicht mit Minus ausgegeben.

Zum Zeitpunkt der Veröffentlichung des zweiten Teils wurde der Fehler behoben, sodass die Daten pro Tag angegeben werden:



Woher die Glättung kam, ist mir nicht bekannt. Vielleicht wegen der Veröffentlichung am Samstag (Minuspunkte am Samstag funktionieren nicht?) Oder weil dies das Ende des zuvor veröffentlichten Materials ist.

Die Verteilung der Minuspunkte ist jedoch immer noch ungleichmäßig: Alle Minuspunkte befinden sich in der ersten Hälfte des Registrierungszeitraums, und das Minus endet viel früher als das Plus. Gleichzeitig werden die Ansichten genau wie beim letzten Mal über den Zeitraum verteilt - gleichmäßig:



Der Sprung, der gegen drei Uhr nachmittags erfolgte, ist kein klassifiziertes Material. Nur für eine Stunde war mein Internet abgeschnitten. Das Dienstprogramm konnte keine Verbindung zur Site herstellen.



Alles andere ist Standard.

Lesezeichen:



Kommentare: Wie beim letzten Mal wechseln sich Aktivitätsperioden mit Stilleperioden ab.



Karma Es wurde ein Anstieg um einige Einheiten verzeichnet - natürlich nicht gleichzeitig:



Und Abonnenten. Die Gesamtzahl ist unverändert geblieben (anscheinend diejenigen, die sich zum Zeitpunkt der Veröffentlichung des ersten Teils angemeldet haben möchten). Nur etwa eine Stunde am Nachmittag trat eine einzige Schwankung auf: Jemand, der sich abgemeldet hatte - vielleicht aus Versehen -, sich aber sofort wieder anmeldete. Wenn es sich um eine andere Person handelte, erfolgte eine Entschädigung: Die Gesamtzahl der Abonnenten hat sich nicht geändert.



Post-Indikatoren verhalten sich also verständlich und vorhersehbar. Alle Indikatoren außer Minuspunkten. Da ich keinen offensichtlichen Grund dafür sehe, finde ich den Minuspeak zumindest seltsam.

Fremdheit 2.
Manchmal nimmt die Anzahl der Ansichten ab (was natürlich unmöglich ist), kehrt aber bald zum Normalzustand zurück.

Ich habe es versehentlich beim Debuggen des Programms verfolgt, als die Export-Import-Funktion noch nicht angehängt war, sodass der entsprechende Zickzack im Diagramm fehlt. Sie können ein Wort nehmen - dieser Effekt wurde zweimal beobachtet. Mehrere tausend Aufrufe, plötzlich verringert sich die Anzahl der Aufrufe um ein paar Hundert, nach 10 bis 20 Minuten wird die vorherige Ebene wiederhergestellt (ohne Berücksichtigung der natürlichen Zunahme).

Damit ist es ganz einfach: ein Fehler auf der Website. Und es gibt nichts zu denken.

Fremdheit 3.
Das kam mir viel seltsamer vor als die freiwilligen ersten und technischen zweiten Effekte. Pluspunkte treten nicht einzeln mit einer gleichmäßigen Verteilung über den Zeitraum auf, sondern in Blöcken. Aber Plus ist kein Kommentar, wenn eine Frage natürlich einer Antwort folgt, sind sie eine individuelle Handlung!

Schauen Sie sich die oben veröffentlichten Ergebnisdiagramme an: Die Blöcke sind erkennbar.

Erfahrene Leute nickten mir bei der Poisson-Verteilung zu, aber ich kann die Wahrscheinlichkeit selbst nicht berechnen. Wenn Sie fähig sind, zählen Sie. Für mich ist es bereits offensichtlich, dass die Anzahl der doppelten Pluspunkte viel höher als die Norm ist.

Hier sind die digitalen Daten zu den Pluspunkten des ersten Teils des Beitrags. Die Grafik zeigt die Anzahl der Pluspunkte pro Einheit, Doppel- und Dreifachpositionen in der Gesamtzahl der Bewertungen. Wie bereits erwähnt, beträgt das Messintervall 10 Minuten.



Von 30 Stößen in 84 Zellen wurden zwei Zellen dreimal gestochen. Nun, ich weiß nicht, wie sehr dies der Wahrscheinlichkeitstheorie entspricht ...

Daten zum zweiten Teil des Beitrags (da der Messzeitraum länger ist, verkürze ich ihn aus Gründen der Vergleichbarkeit um die Dauer des ersten Teils):



Übrigens, hier grenzt hier eines der einzelnen Pluspunkte rechtzeitig an das Dreifache an, dh in etwa 20 Minuten gab es einen Anstieg des Pluswerts (29% der Gesamtzahl der Pluspunkte wurden geliefert). Und dies geschah nicht in den ersten Minuten der Veröffentlichung.

Das Verhältnis zwischen Einzel-, Doppel- und Dreifachpositionen ist ungefähr das gleiche wie für den ersten Teil. Ein Rückgang des Anteils der Bewertungen an Messungen erklärt sich aus der Tatsache, dass Bewertungen seltener festgelegt wurden. Es wurden Messungen durchgeführt, aber keine Pluspunkte aufgezeichnet.

Ich kann diesen Effekt der Blockauffüllung in keiner Weise erklären, das heißt in keiner Weise. Für Minuspunkte scheint ein solches „blockartiges“ Verhalten nicht typisch zu sein.

Die Emittenten des Guten senden Vorschläge teilweise und schalten sie dann ein und aus? Heh heh heh ...

PS
Wenn jemand die Statistik von Posts mit fortgeschritteneren Methoden analysieren oder die Arithmetik überprüfen möchte, finden Sie hier die Dateien mit den Quelldaten:
yadi.sk/d/iN4SL6tzsGEQxw

Ich bestehe nicht auf meinen Zweifeln - vielleicht irre ich mich, zumal es in der Statistik keinen Belmez gibt. Ich hoffe, dass die Kommentare von professionellen Statistikern, Psychologen und anderen interessierten Anwendern die entstandene Verwirrung verdeutlichen.

Vielen Dank für Ihre Aufmerksamkeit.

Source: https://habr.com/ru/post/de473354/


All Articles