Wir haben alle an Umfragen teilgenommen, online oder im realen Leben. Und wenn wir ein neues Projekt starten, können wir nicht auf Umfragen verzichten. Aber manchmal gibt es Umfrageergebnisse, bei denen nicht klar ist, was zu tun ist, außer zu
lächeln . Im Bild unten ist dies das Ergebnis einer Umfrage des Allrussischen Forschungszentrums für öffentliche Meinung (VTsIOM).
Ich war neugierig, wie Fragen mit qualitativen Bewertungen jetzt verwendet werden, und stellte fest, dass VTsIOM,
POF ,
Levada Center hauptsächlich eine Tri-Band-Skala (schlecht / normal / gut) verwenden. Bei detaillierteren Fragen erhöht sich die Skala auf 5-6
Einheiten , jedoch selten.

Dann gibt es heute eine Situation, in der Soziologen sich von der mehrstufigen Skala qualitativer Bewertungen entfernen und versuchen, eine dreistufige zu verwenden. Und wenn die Soziologie in der Lage ist, daraus herauszukommen, wird bei der Analyse anständiger Datenmengen die Notwendigkeit, qualitative Schätzungen zu verwenden, zu einem komplizierenden Faktor und verringert die Zuverlässigkeit der Ergebnisse. Da es zum Beispiel praktisch unmöglich ist, zwischen den Begriffen „eine schöne Wohnung“ und „ausgezeichnetes Wohnen“ zu unterscheiden und die Antwort eines der Charaktere der „Zwölf Stühle“ zu berücksichtigen: „Wem die Braut und die Stute gehören“, geht die Mehrfachkreuzung von Qualitäten über vernünftige Grenzen hinaus.
Es gibt einen Abstufungsmechanismus, der von Banken bei der Ermittlung von Fälschungen in Finanzdokumenten gut genutzt wird. Dies ist
Benfords Vertriebsgesetz, das 1984 von
Ted Hill bewiesen wurde.
Die theoretischen Berechnungen des vorgeschlagenen Werkzeugs werden in diesem Material vorgestellt: "
Benfords Gesetz und die darunter liegenden Verteilungen ."
In Wikipedia wird dieses Gesetz wie folgt formuliert: Wenn wir die Basis des Zahlensystems b (b> 2) haben, dann ist für die Ziffer d (d ∈ {1, ..., b - 1}) die Wahrscheinlichkeit, die erste signifikante Ziffer zu sein:

Basierend auf dem Vorstehenden erhalten wir einen Abstufungsmechanismus für qualitative Merkmale wie folgt.
Wählen Sie die Anzahl der Intervalle, also sagen wir 5, dh vier Abstufungen und ein mittleres Intervall. Also b = 6, wir erhalten die Wahrscheinlichkeiten für die Intervalle:
1. Intervall - 0,386853;
2. Intervall - 0,226294;
3. Intervall - 0,160558;
4. Intervall - 0,124539;
5. Intervall - 0,101756.
Aus der Statistik der Häufigkeit, Wörter, die qualitative Zeichen bewerten, erstellen wir eine Reihe in aufsteigender Reihenfolge und legen einen Index fest. Wir führen die Umwandlung der Frequenz in die Wahrscheinlichkeit einer Äußerung durch. Als nächstes akkumulieren wir die Wahrscheinlichkeiten aus dem Schwanz, bis wir einen Wert erhalten, der der extremen Zeile (5.) entspricht, in unserem Fall - 0,101756 und Wörter (qualitative Definitionen), deren Wahrscheinlichkeiten in diese Summe fallen, beziehen wir uns auf Bereich 5. Ferner führen wir durch einen abnehmenden Index eine weitere Summierung durch, bis wir uns dem Wahrscheinlichkeitswert des 4. Bereichs und weiter ähnlich dem Wert des ersten Intervalls nähern.
Als Ergebnis erhalten wir klare Teilmengen mit einer realen numerischen Schätzung.
Ich werde nicht versichern, dass die Auswahl der Synonyme einfach ist. Da bestimmt jeder für sich ein bequemes Ergebnis / Aufwand-Verhältnis.