用于区域分析的热势方法的技术实施



在第一本出版物( 使用热势分析领土 )中,我们描述了一般如何使用热势来分析领土 。 在以下出版物中,计划描述有关空间对象的信息如何存储在数据库中,如何构建主要组件的模型以及通常可以执行哪些分析领域的任务。 但是首先是第一件事。

首先使用热势方法可以对我们感兴趣的领域制定总体思路。 例如,从巴塞罗那(加泰罗尼亚)巴塞罗那的OSM中获取初始信息,并进行整体分析而不选择参数,我们可以获得第一主要成分的“热”图像。 我们在第一篇文章中也谈到了“热”图,但是回想起“热”图这一术语并不是不合时宜的,这是由于积分分析所用电位的物理含义所致。 即 在物理问题中,电势是温度;在分析领土的问题中,电势是影响该地区特定点的所有因素的总和。

以下是通过综合分析获得的巴塞罗那“热”图的示例。


第一个主要组成部分的“热”图,未选择参数,巴塞罗那

通过设置任何特定参数(在这种情况下,我们选择了行业),您可以直接从中获得“热量”图。


第一个主要组成部分的热图,行业,巴塞罗那

当然,分析的任务比获得对选定区域的一般评估要广泛得多,而且也要多样化得多,因此,以本文中的示例为例,我们考虑的任务是在放置新物体时找到最佳位置以及解决该问题的热电势方法的技术实现方式,在下面的出版物中我们将介绍其他事物。

解决在放置新对象时找到最佳位置的问题,将有助于确定该区域“准备好接受”该新对象的程度,它将如何与该领土上已有的其他对象相关联,该新对象将为该领域带来多少价值以及它将增加什么价值。

技术实施阶段


技术实施可以通过以下列出的程序序列来表示:

  1. 准备信息环境。
  2. 搜索,收集和处理源信息。
  3. 在分析区域内构建节点网格。
  4. 将地区因素划分为多个片段。
  5. 根据因素计算电位。
  6. 选择用于创建主题综合特征的因素。
  7. 应用主成分法获得领土的整体指标。
  8. 创建用于选择新设施建设场所的模型。

第一阶段 信息环境准备


在此阶段,有必要选择一个数据库管理系统(DBMS),确定信息的来源,收集信息的方法以及收集的信息量。
在工作中,我们使用了PostgeSql数据库(DB),但值得注意的是,任何其他使用SQL查询的数据库都适用。

初始信息将存储在数据库中-有关对象的空间数据:数据类型(点,线,多边形),其坐标和其他特征(长度,面积,数量),以及由于工作而获得的所有计算值以及工作本身的结果。

统计信息也以空间数据的形式显示(例如,具有分配给这些区域的统计信息的区域的区域)。

转换和处理所收集的源信息的结果是,形成了包含有关线性,点和面积因子,它们的标识符和坐标的信息的表。

第二阶段 搜索,收集和处理源信息


作为解决此问题的初始信息,我们使用包含有关地区信息的开放式地图资源中的信息。 我们认为,领导者是OSM信息,每天在世界范围内更新。 但是,如果您设法从其他来源收集信息,情况将不会更糟。
信息处理包括使其统一,消除不准确的信息并准备将其上传到数据库。

第三阶段 在分析区域中构建节点网格


为了确保所分析区域的连续性,有必要在其上构建一个网格,该网格的节点在给定的坐标系中具有坐标。 随后,将在网格的每个节点处确定电势值。 这将使您可视化均质区域,聚类和最终分析结果。

根据要解决的任务,可以使用两种方法来构建网格:
-具有常规步骤(S1)的网格 -是对整个领土的调查。 使用它,可以计算因素的潜力,确定区域(主要组成部分和集群)的整体特征,并显示仿真结果。

选择此网格时,必须指定:

  • 网格步长-网格节点的定位间隔;
  • 被分析领土的边界,它可能对应于行政区域划分,或者可以是地图上以多边形形式限制计算区域的区域。

-不规则网格(S2)描述了区域中的各个点(例如质心)。 它还可以根据因素计算潜力,确定区域(主要组成部分和集群)的整体特征。 使用计算出的主要成分在不规则步长的网格上精确建模,并且为了可视化仿真结果,根据坐标的近似原理,将不规则步长的网格节点的簇数转移到规则步长的网格节点。
在数据库中,有关网格节点坐标的信息以表格的形式存储,其中包含每个节点的以下信息:

  • 节点编号
  • 节点的坐标(x,y)。

下图显示了具有规律性步骤的栅格示例,这些规则性步骤具有到不同区域的不同步骤。




N.诺夫哥罗德市的网格覆盖(红色点)。 下诺夫哥罗德地区的网格覆盖(蓝色圆点)。

阶段4。 领土因素的分裂


为了进一步分析,必须将领土的扩展因子转换为离散因子的数组,以便每个网格节点都包含有关其中存在的每个因子的信息。 线性因子分为段,面-片段。

根据区域的面积和因子的具体情况选择划分步骤;对于大面积(区域),划分步骤可以为100-150 m,对于较小的领土(城市),划分步骤可以为25-50 m。

有关分区结果的信息以表格的形式存储在数据库中,其中包含每个片段的以下信息:

  • 因素标识符;
  • 获得的分区片段的质心的坐标(x,y);
  • 分区的片段的长度/面积。

5阶段。 根据因素计算电位


初始信息分析的一种可能且可以理解的方法是将因素视为来自影响对象的潜力。

对于二维情况,我们使用拉普拉斯方程的基本解-距点的距离的对数。

考虑到最终电势值为零的要求以及大距离上电势值的限制,电势确定如下:

Fr=Lnr1/r2对于r <r1 (1)

Fr=Lnr/r2对于r2> r> = r1

Fr=0对于r> = r2


点对象的潜在影响类型

对数函数必须限制为零,并且与因子之间的距离应合理限制。 如果没有在距离该因素很远的地方进行潜在的限制,则必须在远离分析点的地方考虑大量信息,这实际上不会影响分析。 因此,我们引入了因子作用半径的值,超出该值时,对因子势的贡献等于零。

对于城市来说,因子半径的大小等于2,000米的半小时人通道。 对于该地区,我们应该谈论一个半小时的交通可达性-20,000米。

因此,作为计算电势值的结果,我们在常规网格的每个节点上具有每个因子的总电势。

6阶段。 选择创建领土主题综合特征的因素


在这一阶段,将选择最重要和最有用的因素来创建该领土的主题综合特征。

因子的选择可以自动进行,为参数设置一定的边界(相关性,影响百分比等),也可以由专家完成,知道任务的主题并对领域有所了解。

选择了最重要和最有意义的因素后,您可以继续执行下一步-解释主要组件。

第七阶段。 应用主成分法获得领土的整体指标。 聚类


有关地域因素的初始信息在上一阶段转换为每个网格节点计算出的势能,并合并为新的整体指标-主要组成部分。

主成分法分析了研究区域中各因素的可变性,并从分析结果中找出了它们变化最大的线性组合,从而可以计算出它们变化的量度-整个地区的变化。

我们考虑了将线性模型函数逼近给定值的模型的一般问题
i=1nAiPCAij+B=POTj(2)
其中i是组件编号,
n是计算中涉及的组件数
j是领土点的节点的索引,j = 1..k
k-领土上所有网格节点的数量,根据该数量计算主要组成部分
Ai-模型第i个主要成分的系数
PCAij是第j个点的第i个主要成分的值
B是该模型的免费成员
POTj是我们正在建立模型的因素的第j点的潜力

我们使用主要成分的属性,通过最小二乘法在等式(2)中定义未知数:
j=1kPCAijPCAi2j=0(3)
其中i和i2是组件编号,i <> i2
j-站点节点索引
k是区域中所有节点的数量
j=1kPCAij=0(4)

(3)表示组件之间没有关联
(4)-任何组件的总和为零。

我们得到:
Ai=j=1kPCAijPOTj/j=1kPCAij2
B=POTj(5)
在此,公式(2)中的符号 POTj平均潜力

此结果可以解释如下:
该模型是一个简单的表达式,由建模值的平均值和每个组件的简单校正组成。 至少,结果应包括自由项B和第一个主成分。 以下是下诺夫哥罗德地区主要主要成分的热图示例。





基于计算出的主要成分,可以构造均匀区域。 这既可以在所有方面进行,也可以仅在定价上进行,即 执行聚类。 为此,您可以使用K-means方法 。 对于每个均质区域,计算出代表该地区发展水平的第一主要成分的平均值。
下诺夫哥罗德地区通过定价参数进行聚类的示例如下。



同样,使用获得的主要成分作为成本模型的参数,我们可以获得区域的价格表面。


N.诺夫哥罗德市的价格表面

8个阶段。 创建用于选择新设施建设地点的模型


为了选择对新设施的位置最有吸引力的位置(以下称为“设施”),必须将“设施”的位置与周围基础设施进行比较。 为了使“对象”发挥功能,必须有足够的资源来确保其发挥功能,必须考虑大量因素,无论对“对象”具有积极影响还是消极影响。 这些因素的总和可以定义为“对象”功能的“营养”环境。 对象数量与领土资源量的对应关系是“对象”稳定运行的基础。

该比较的结果是为该区域的每个点计算的电势,并允许在视觉和分析上分析用于放置新“对象”的位置选择。

例如,对于贸易而言,恒定的购买者流量很重要,这意味着必须考虑到贸易对象的因素清单应包括提供这种流动的因素(例如,社会基础设施,工作地点,居住地点,高速公路等)。 )

另一方面,当满足所有条件以确保贸易对象的功能时,必须考虑贸易对象的密度,因为环境的“消费”导致购买可能性的降低。 人流不是无限的,这同样适用于他们的财务资源和物质能力。

用于解决为物体选择最佳位置的问题的算法是,根据主要成分获得的电势尽可能接近“物体”类型的物体集合的电势。 然后计算模型的电势与“对象”类型的电势之间的差; 从产生的差值中减去一个“物体”的潜在贡献值; 在这种情况下获得的负值将替换为零,也就是说,将消除那些没有足够资源来实现新“对象”功能的位置。

由于采取了这些行动,我们获得了具有正潜在值的区域点,即“对象”的有利位置的位置。

换句话说,我们掌握了所有因素的计算潜力,以及我们要用来建立模型和分析所选主题领域(贸易,工业,文化,社会领域等)的因素。

为此,有必要选择构成环境变量的因素-主要成分-然后从中计算模型。
我们建议通过分析所有因素与主题区域参考因素的相关性来选择因素。 例如,对于文化,它可以是剧院,学校的教育系统等。

我们计算标准电位与所有因素电位的相关性。 我们选择那些相关系数的绝对值大于某个特定值的因子(通常最小相关系数的值= 0. 3)。
|Kkorri|>0.3(6)
在哪里 |Kkorri|-第i个因子与标准的相关系数的绝对值。

考虑覆盖该区域的网格的所有节点的相关性。

模型的电势与与等式(2)中的新对象相同类型的对象的电势之间的差表明可以用来定位新对象的区域的电势。

结果,我们获得了电位值,该电位值表征了“对象”在研究区域中的位置的有利程度。

下面给出了一个示例,以图形方式显示推荐区域以显示新“对象”的位置。



因此,解决为新对象选择最佳位置的问题的解决方案结果可以表示为每个点上以点为单位的区域估计值,从而给出了放置投资对象的潜力的想法,即得分越高,放置对象的利润就越大。

总而言之,值得一提的是,在本文中,我们仅研究了一个可以使用领土分析解决的问题,而现有的数据来自公共资源。 实际上,借助它可以解决很多问题;它们的数量仅受您的想象力限制。

Source: https://habr.com/ru/post/zh-CN455048/


All Articles