白噪声绘制一个黑色正方形

任何分析师在开始工作之初就经历了确定分布参数标识的令人讨厌的阶段。 然后,随着经验的积累,对他而言,获得的剩余分散的协调意味着在大数据分析中某个阶段已经过去,您可以继续进行。 不再需要检查数百种模型是否符合各种回归方程,搜索具有瞬态的分段,组成模型的组合。 带着疑惑折磨自己:“也许还有其他更合适的模式吗?”

我以为:“但是如果你从相反的角度去做呢? 看看白噪声能做什么。 白噪声能否创造出我们的注意力与我们经验中的重要对象相提并论的东西?”


白噪声(文件来自网络,大小为448x235)。

关于这个问题,他的理由如下:

  1. 出现明显长度的水平和垂直线的可能性是多少?
  2. 如果它们可以出现,那么它们与某一坐标中的原点重合并组成一个矩形图形的概率是多少?

在本文的进一步内容中,我将解释这些任务与大数据分析之间的关系。

在G.Sekey的书“概率论和数理统计中的悖论” (第43页)中,我找到了与Erds - Renyi定理的链接,其内容如下:
当抛硬币n次时,一系列长度的标志  log2n观察到的概率趋于1,n趋于无穷大。

对于我们的数字,这意味着在235行中,每条趋向于1的概率中都有:



也就是说,我们下降到整个-水平连续8个黑点。

对于所有448列,其可能性趋于1,存在:



整体丢弃-垂直连续放置7个黑点。

从这里我们可以得出在“白噪声”中为该图片绘制大小为8x7像素的黑色矩形的可能性:



其中1是一行中黑色点的第一个序列,在二维空间中的任何位置。

我并不认为概率很小,但不为零。

继续,我们可以将所有行合并为一条,并获得长度为102,225个字符的行。 然后,根据Erds-Renyi定理,概率趋于1,存在一个长度链:



对于一百万条记录的链:



如您所见,Erdos-Renyi定理与大数据的联系是唯一确定的。

注意事项 接下来,我将陈述自己对所识别出的内容的分析。 因为以这种形式存在,所以我找不到G.Sekey的书中提出的这个定理及其证明。

通过定义数据同质性,我们可以得出检验可以使用Erdos-Renyi定理。

它适用于中心矩为一阶(MX)的分布。
它只能应用于单通道顺序随机过程。

如何申请


可以预期,任何分布都可以想象为与中心的偏差:左右,上下。 也就是说,损失:尾巴鹰。

因此,根据该定理,应该检测出一个间隔,在该间隔中,连续值的数量为 m= log2N高于或低于MX(Y(xi))。

注意事项 在这方面,我想看一下该定理的证明,以了解只有这样一行(仅在上方或下方)或两行(上方和下方)。 根据我的想法,这些现象的对称性应产生两个契约,另一方面,分析相似过程的证明时,这些数学家与图有关,然后建议他们建立确定最大值的证明。 这使得存在关于最小化目标函数的证据。 对于大于2的选项,Erds-Renyi定理如何寻找不对称概率提出了疑问。

在所研究的基础中仅发现一个这样的顺序合同的实际结果,使我们有机会假设所提供的所有数据都是同质的。
第二个。 如果通过处理数据,根据Erd -s-Renyi定理,我们发现有一系列比应有的值更多的值,则图中所示的情况很可能发生。


为了示例的目的,图中所示的系列由两个功能组成。

第三个结论。 如果通过Erds-Renyi定理处理数据(100万条记录),则找不到单个行,其长度为19个数字,而是找到了三个具有17个数字的序列。 可以假定一般数据由三个函数的组合组成,并通过这些序列的位置来确定可能发生瞬变的间隔。

当他处理此材料时,对以下内容进行了观察。 当根据小的自然观测结果,有必要从100个观测结果中确定更大的总体参数,以确定100万或更多的一般人口的特性时,所有开发的数据分析方法都是针对技术的。 对于现代任务,当有必要分解庞大的数据库时,由统计数据开发的工具非常费力。

继续: 第2 部分第3部分

Source: https://habr.com/ru/post/zh-CN460473/


All Articles