Todos participamos en encuestas, en línea o en la vida real. Y cuando comenzamos un nuevo proyecto, no podemos prescindir de las encuestas. Pero a veces hay resultados de encuestas con las que no está claro qué hacer, excepto
sonreír , en la imagen a continuación, el resultado de una encuesta del Centro de Investigación de Opinión Pública de toda Rusia (VTsIOM).
Tenía curiosidad por saber cómo se utilizan ahora las preguntas con evaluaciones cualitativas y descubrí que VTsIOM,
POF ,
Levada Center utilizan principalmente una escala de tres bandas (pobre / normal / buena). En casos de preguntas más detalladas, la escala aumenta a 5-6
unidades , pero rara vez.

Entonces, hoy, hay una situación en la que los sociólogos se alejan de la escala multinivel de las evaluaciones cualitativas y tratan de usar una de tres niveles. Y si la sociología puede salir de esto, entonces, al analizar cantidades decentes de datos, la necesidad de usar estimaciones cualitativas se convierte en un factor complicado y reduce la confiabilidad de los resultados. Dado que, por ejemplo, es prácticamente imposible distinguir entre los conceptos: "un hermoso apartamento" y "excelente vivienda", y teniendo en cuenta la respuesta de uno de los personajes de las "Doce sillas": "Para quién son la novia y la yegua", la intersección múltiple de cualidades va más allá de los límites razonables.
Existe un mecanismo de gradación y los bancos lo utilizan bien para determinar falsificaciones en documentos financieros. Esta es
la ley de distribución
de Benford , que, en 1984, fue probada por
Ted Hill .
Los cálculos teóricos de la herramienta propuesta se presentan en este material: "La
ley de Benford y las distribuciones correspondientes ".
En Wikipedia, esta ley se formula de la siguiente manera: si tenemos la base del sistema de números b (b> 2), entonces para el dígito d (d ∈ {1, ..., b - 1}) la probabilidad de ser el primer dígito significativo es:

Con base en lo anterior, obtenemos un mecanismo de gradación para las características cualitativas, de la siguiente manera.
Elija el número de intervalos, bueno, digamos 5, es decir, cuatro gradaciones y un intervalo medio. Entonces b = 6, obtenemos las probabilidades para los intervalos:
1er intervalo - 0,386853;
2do intervalo - 0.226294;
3er intervalo - 0.160558;
4to intervalo - 0.124539;
5to intervalo - 0.101756.
A partir de las estadísticas de frecuencia, palabras que evalúan signos cualitativos, hacemos una serie en orden ascendente y colocamos un índice. Llevamos a cabo la conversión de frecuencia a la probabilidad de expresión. Luego, acumulamos las probabilidades desde la cola, hasta que obtenemos un valor igual a la fila extrema (5ta), en nuestro caso - 0,101756 y palabras (definiciones cualitativas), cuyas probabilidades caen en esta suma, nos relacionamos con el rango 5. Además, mediante un índice decreciente, llevamos a cabo una suma adicional hasta que nos acercamos al valor de probabilidad del 4to rango y, además, de manera similar, al valor del primer intervalo.
Como resultado, obtenemos subconjuntos claros con una estimación numérica real.
No voy a asegurar que la selección de sinónimos es fácil. Dado que cada uno determina por sí mismo una conveniente relación resultado / esfuerzo.