幸福理论。 西瓜皮的规律和异常的正常性

我代表《哈勃幸福理论》一书中无序的章节,并以副标题“中庸之道的数学基础”向哈勃读者告别。 这本尚未出版的流行科学书,非常非正式地讲述了数学如何使您以新的认识水平看待世界和人们的生活。 它适用于对科学感兴趣的人和对生活感兴趣的人。 而且由于我们的生活是复杂的,而且总体上是不可预测的,因此本书的重点主要放在概率论和数理统计上。 这里没有证明定理,也没有给出科学的基础知识,这绝不是教科书,而是所谓的娱乐科学。 但是,正是这种几乎好玩的方法,使我们能够发展直觉,为学生提供生动的实例来丰富讲座,最后向非数学家和我们的孩子解释我们在干科学中发现的如此有趣。



在本章中,我们将从分析西瓜及其果皮开始,找出它们与墨菲著名法则的联系,并确保所有口味都没有受到争议。


仅凭我个人看来我很正常吗?


我们多久一次在观看新闻或阅读新闻评论时感到困惑:“这个世界上有正常人吗?! 似乎应该有,因为我们很多,平均而言,我们应该很正常。 但同时,圣贤们说我们每个人都是独一无二的。 青少年确信他们肯定不同于“正常人”的灰色群体,并且与其他人不同。

当然,熟悉统计的读者已经多次看到,对于各种不对称分布,模式(概率密度图上的最大值)如何与平均值或数学期望值不一致。 即,平均值不对应于最高的概率密度,但是如果不是最频繁遇到的话,则期望相同,至少是主要的。 但是,并非一切都那么简单。 到目前为止,我们已经考虑了单变量分布-一维结果空间中的分布。 但是生活是多方面的,而且肯定不是一维的! 当增加额外的尺寸时,可能会发生非常意外的事情。

多维几何的特征之一是在有限的体积中边界值的份额增加。 那是什么意思。 考虑不同尺寸空间中西瓜的经典问题,并着手研究从这种巨大,结实且令人垂涎的西瓜中得到多少优质的糖浆,如果将其切开,我们发现其果皮的厚度不会超过 $ 15 \%$ 从它的半径? 好像 $ 15 \%$ 这很痛苦,但是看看本文开头的图,也许我们发现这样比例的西瓜是完全可以接受的。

让我们从一个一维的西瓜开始-这是一个粉红色的圆柱,其果皮是沿着边缘的两个白色小段。 地壳的总长度-这是一维世界中体积的类似物-将为 $ 15 \%$ 西瓜的总长度。 呈薄饼状的二维薄煎饼状西瓜皮,其面积将比其内部面积小,仅为三倍。 在通常的三维世界中,这样的地壳几乎 $ 40 \%$ 总体积。 有一个陷阱。

果皮在各种尺寸的西瓜中所占的份额。

对于球以及任意形状的物体,我们可以获得外壳体积与物体总体积之比的依赖性。 它通过地壳厚度与物体特征尺寸之比来表示 $ d $ 并且是空间维数的指数函数 $ m $

$ \ frac {V_ {peels}} {V_ {total}} = 1-\左(1-d \右)^ m。

这是西瓜皮半径的百分之十五在其体积中所占比例的增长曲线,并且空间的尺寸进一步增加。


在四维空间中,我们传统上的短瓜西瓜将只剩下我们一半的肉,而在十一维世界中,我们只能饱餐一顿 $ 15 \%$ 从整个西瓜中扔掉组成的外壳 $ 15 \%$ 它的半径!

因此,我们准备制定西瓜皮的深刻规律
买一个多维西瓜,基本上可以得到它的果皮。

当然,这是一种耻辱,但这与我们世界的正常性和卑鄙定律有什么关系? las,正是他阻止了所谓的“黄金均值”的搜寻,贬低了民意测验的结果并增加了不太可能出现的麻烦的作用。

事实是,具有所有参数的人的空间本质上是多维的。 相当独立的维度可以被认为是明显的身高,体重,年龄和财富,以及智力(IQ)和情感(EQ)的发展水平,最后是可以观察到的,尽管面部表情正规化程度不高,或者性格特征,例如健谈,固执或多情。 我们可以轻松地计算出代表一个人的十二个参数。 对于这些参数中的每一个,都有一定的统计确定的“规范”-最期望的,而且也是经常观察到的值。 在如此丰富的参数空间中,有多少人在各个方面都是典型的? 我们用来计算果皮和西瓜体积比的表达式也可以用来计算至少在“异常”人群中的概率。 实际上,满足所有典型性标准的概率同时等于每个标准分别具有典型性的概率的乘积。

现在,我们将大大简化任务,以免编写令人恐惧的公式,根据这些公式,什么也无法正确计算。 假设每个方向的人的素质服从一定平均值附近的正态(高斯)分布 。 当然,这是非常大胆的,但是对于我们的目的而言这是相当合理的,因为我们不是在谈论一组特定的特征,而是坦率地说,我们幻想着,试图在这种动摇的话题中至少提出一些特定的东西。 因此,在显示最一般的图片之前,现在尚无法加载详细信息。 因此,我们使用均值和方差将所有条件服从正态分布。 因此,我们可以确定世界上最典型的人的参数,并计算与他们的偏差。 此外,我们不在乎每个标准会显示哪些具体的色散值,因为我们只对超出标准偏差的可能性感兴趣,并且该值并不取决于分布本身的规模。 所有这些导致这样一个事实,即如果我们指定 $ P_ {out} $ 处于以标准偏差为界的区域之外的概率(出现在分布的外部“地壳”中,这很可能不像西瓜的地壳,而是地球大气层,它深入到外层空间,变得越来越稀薄),考虑时有些异常 $ m $ 标准将通过“西瓜”公式进行计算:

$ P = 1-\左(1-P_ {out} \ right)^ m。

对于高斯分布 $ P_ {out} = 1-CDF(\ sigma)+ CDF(-\ sigma)= 32 \%$ 在哪里 $ \ sigma $ -标准偏差。

对于不同数量的比较标准和规范定义的不同“严重性”,“异常”的概率。 上图和下图的区别在于,在确定“正态性”时,它们分别使用一个和两个标准偏差的半径。

好吧,事实证明,至少有些异常是正常的。 根据前十个参数对人进行评估,要为总人口中只有2%的人是完全普通的事实做好准备。 而且,一旦我们找到他们,他们将立即成为名人,失去平庸!

相同的均值定律


由工程师爱德华·墨菲(Edward Murphy)制定的经典卑鄙定律之一说:
“一切可能出错的地方都会出错。”
在整个样本中都可以观察到所有结果,即使是最不可能的结果,也比琐碎的陈述要深得多。

假设要执行某些工作,则需要执行一系列操作,对于每个操作,失败的可能性很小。 一切顺利的可能性有多大? 这很简单-您需要将所有步骤的成功概率相乘。 然后打开了西瓜皮的法则:步骤数越多,在紧急情况下边界的作用就越大。 一打台阶就足以使每一个错误发生5%的概率增加到整件事失败的概率50%! 这同样适用于具有许多部分的复杂系统,每个部分都可能发生故障。 在最简单的情况下,系统的故障概率是根据西瓜皮的相同定律从每个部分的故障概率计算得出的。

我们的推论非常简单,墨菲定律比目标更具情感性,看起来像是一种无稽之谈,但是,从这个观察结果来看,二十世纪四十年代和五十年代开始了一种新的大科学:可靠性理论。 她增加了时间,系统元素的相互联系,经济性以及人为因素,并在工程科学领域以外的领域找到了应用:经济学,控制理论以及编程领域。

当我们研究最后一天定律时,我们将回到该主题,该定律迫使打印机在项目完成的那一天变得垃圾。 历史悠久的墨菲定律-真正可怕的力量! 同时,回到唯一性和正常性主题。

幸福正在寻找诊断与您相同的朋友。


我们都是不同的,这是可以理解的,但是是否有可能完全提出遵守任何规范的问题,我们是否要进行评估和比较? 你问,这怎么了? 我们总是将某人与某人进行比较,通常是将自己与其他人进行比较,但有时我们允许对某人进行评估。 但是,从数学的角度来看,一切并不是那么简单。

比较就是确定顺序关系 。 也就是说,从某种意义上说,表示某个集合中的一个元素先于另一个。 即使在学校,我们也学到了这一点:不到20头,大象比鲸鱼还弱,合同比金钱还贵,等等。但是这里有许多问题。 星期一或星期二之前会发生什么? 星期日或星期一呢? 那星期一之前是哪个星期天,星期六之后是那个星期几? 哪个更大:2 + 3i或3 + 2i? 我们可以按顺序命名彩虹的颜色,甚至可以将所有中间颜色与真实数字-光的频率相关联,但是除了这些颜色之外,还有许多非光谱色,它们形成了印刷术和设计者所熟悉的色轮,可以将所有可见的颜色按顺序排列吗? 这些示例表明,订单关系存在困难。 例如,传递性在一周的很多天都无效(因为 $ $ 应该 $ B $ 但是为了 $ B $ 应该 $ C $ 不遵循 $ C $ 总是跟随 $ $ ) 尝试在复数领域引入或多或少的概念与这些数字的算法不一致,并且颜色具有这两个缺点。

以及如何比较人物,书籍,菜肴,编程语言和其他具有很多参数(甚至有条件地形式化)的对象? 从原则上讲,这是可能的,但只有先就定义和指标达成一致,否则这将是一场无休止,风雨无阻的辩论。 las,最激烈的争论通常已经出现在选择度量的阶段,因为它们本身形成了一个特定的集合,在这个集合上还必须确定顺序的关系。

但是,可以为多维对象(例如人)的可比性提供一种完全有意义且明确的推理方法。 在多维参数空间中,每个对象都可以由向量-一组数字-表征其的条件的值表示。 考虑到向量的集合(例如人类社会),我们将看到其中的一些证明是同向的,或者至少在方向上接近,现在它们的长度已经可以比较。 同时,一些向量将是正交的(在几何意义上-垂直,广义上讲是独立的),并且与它们相对应的人将变得彼此无法理解:它们将以许多参数出现在共轭空间中,例如臭名昭​​著的物理学家和作词家。 认为一个好的诗人比一个才华横溢的工程师或天才的运动员好或坏是没有道理的。 唯一可以判断的是向量的长度-有天赋的程度,与平均值的距离。

在这方面,可能会产生一个奇怪的问题:在给定维度的空间中,随机矢量的比例将是同向的,而哪个部分将是正交的? 您可以找到多少志同道合的人,或者至少可以找到可以与自己比较的人?

在二维世界中,每个向量对应于共线(同向)的一维空间和正交向量的一维空间。 如果我们考虑“几乎”同向和“几乎”正交向量,则它们以允许偏差的相同选择形成相同区域的扇区。 也就是说,当考虑两个标准时,相似和不相似的对象将是相同的数量。


二维和三维空间中的几乎共线和几乎正交的向量。

在三维世界中,情况将发生变化。 共同指向的矢量仍然形成一维空间,而正交矢量已经填充了平面-二维空间。 固定向量的长度 $ R $ 并允许与理想方向稍微偏离一个角度 $ \ Delta \ varphi $ ,几乎可以将同向向量的数量与两极周围的圆形区域的面积进行比较 $ 2 \ pi(R \ Delta \ varphi)^ 2 $ ,以及几乎正交的向量数-赤道周围的带状区域: $ 4 \ pi R ^ 2 \ Delta \ varphi $ 。 他们的态度 $ 2 / \ Delta \ varphi $ 同时减少偏差 $ \ Delta \ varphi $ 无限增长。

在四维世界中,正交矢量已经形成了三维空间,而同向矢量仍然位于一维空间中,其数量之差已经与偏离理想值的平方成正比。 但是在这一阶段,最好转向概率论,并找出获得正交或同向矢量的机会,从空间中随机获取两个矢量。 $ m $ ? 随机向量之间的角度分布将告诉我们这一点。 幸运的是,在讨论多维球体的区域时,可以通过分析计算得出最终形式:

$ p(\ varphi)= \ frac {\ Gamma(m / 2)} {\ sqrt {\ pi} \,\ Gamma((m-1)/ 2)} \ sin(\ varphi)^ {m-2 },$

在这里 $ \伽玛(x)$ 是伽马函数,是阶乘数到实数(甚至复数)的泛化。

各种尺寸空间的随机向量的角分布。

现在很明显,对于二维空间,角度是均匀分布的;对于三维空间,角度与正弦函数成正比,并且随着尺寸的增加,该分布趋向于法线且色散不断减小。 对于大于2的所有维,分布模式为90度,并且相互正交的矢量的比例随着参数数量的增加而增加。 最重要的观察结果是,同向矢量(实际上具有大约0或180度的角不会保留足够高的空间维数。让我们考虑一下角度小于30度的相似(同向,可比)矢量)(这是一个非常小的角度: $ 30 ^ \ circ = \ pi / 6 \大约1/2 = \ sin 30 ^ \ circ $ ) 然后,当通过类似于某些选定向量的两个标准进行比较时,所有随机向量中只有三分之一会变成真。 使用三个条件将使您只能与给定向量进行比较 $ 13 \%$ 整套,有四个标准-已经 $ 6 \%$ ,随后每增加一个尺寸,该比例就会减少一半。 如果我们更加严格并且将自己限制在较小的角度,则被认为相似的向量比例将更快地下降。

因此,我们获得了西瓜皮定律的向量公式:
在高维空间中,几乎所有向量都相互正交。

或同等学历:没有伴侣的味道和肤色。

明智地进行比较,不要在生活中寻求正常,也不要害怕异常。 数学本身告诉我们,在人的复杂世界中,我们只能谈论相似度,而不能谈论比较度。 因此,没有理由为了寻求真相而进行无休止的争执,相反,值得倾听和尝试听取不同的意见,从另一个共轭的空间中看到观点,从而丰富您对世界的感知。

圣人是对的:我们都是独一无二的,我们的独特性是完全一样的。



我诚挚地邀请您(本书的第一批读者)提出一些疑问,补充和评论,这些疑问,补充和评论无疑将使它更加准确,丰富和有趣。

Source: https://habr.com/ru/post/zh-CN416551/


All Articles