我们都参与了在线或现实生活中的调查。 当我们开始一个新项目时,我们离不开调查。 但是有时会有一些调查结果,除
微笑以外,不清楚该做什么。在下图中,这是对全俄舆论研究中心(VTsIOM)的调查结果。
我对现在如何使用定性评估的问题感到好奇,发现VTsIOM,
POF和
Levada Center主要使用三波段量表(差/正常/好)。 如果问题更详细,则比例会增加到5-6个
单位 ,但很少。

然后,今天,有一种情况,即社会学家不再使用定性评估的多层次规模,而是尝试使用三层次的定性评估。 而且如果社会学能够摆脱这种情况,那么在分析体面的数据量时,使用定性估计的需求将成为一个复杂因素,并降低结果的可靠性。 例如,由于实际上不可能区分以下概念:``漂亮的公寓''和``优质的住房'',并考虑到``十二把椅子''其中一个字符的答案:``新娘和母马是谁'',因此品质的多重交集超出了合理范围。
有一种分级机制,银行可以很好地使用它来确定财务文件中的伪造品。 这是
本福德的分配定律,1984年,
泰德·希尔 (
Ted Hill )证明了这一定律。
本文介绍了该工具的理论计算方法:“
本福德定律及其下的分布 ”。
在Wikipedia上,此法则的公式如下:如果我们具有数字系统b(b> 2)的基数,则对于数字d(d∈{1,...,b-1}),成为第一有效数字的概率为:

基于上述内容,我们获得了定性特征的渐变机制,如下所示。
选择间隔数,好吧,假设为5,即四个渐变和一个中间间隔。 所以b = 6,我们得到了区间的概率:
第一个间隔-0.386853;
第二间隔-0.226294;
第三间隔-0.160558;
第四间隔-0.124539;
第五间隔-0.101756。
从频率的统计数据,对定性符号进行评估的单词中,我们按升序排列一个序列并放下一个索引。 我们将频率转换为发声的概率。 接下来,我们从尾部开始累加概率,直到获得等于极端行(第5个)的值,在本例中为0101756和单词(定性定义),其概率属于该总和,我们涉及范围5。 此外,通过递减的索引,我们执行进一步的求和,直到接近第4个范围的概率值,并且进一步类似于第一个区间的值。
结果,我们得到具有真实数值估计的清晰子集。
我不会保证选择同义词很容易。 因为每个人都为自己确定一个方便的结果/工作量比率。