利用热势进行区域分析


下诺夫哥罗德的街道网络热势计算示例

这个城市的领土是一个复杂的,异质的系统,并且在不断变化。 可以使用空间对象(因素)来描述领土并评估城市环境。 描述领土的因素在其影响的性质(正,负)和几何形状(点,线,多边形)上是不同的。

通常很难确定每个单独对象对领土整体或某个特定方面的发展水平的影响程度。 今天,定义和描述诸如“文化”,“社会领域”,“社会紧张关系”,“美好生活”,“经济发展”和“公共卫生”等概念的问题变得越来越重要。 如果我们想将它们应用于不同的社会群体,不同年龄和性别的人群,这些概念的歧义就会增加。

另外,应该指出的是,现代概念中的城市边界是相当随意的。 每天的人口迁移,偏远地区的交通便利性“模糊了城市的边界”。 总体上,城市群的概念反映了城市的边界,但同时也使城市边界的概念更加模糊。

尽管存在上述问题,但当今对领土的分析和评估是一些有前途和有趣的领域,可以解决许多城市环境的紧迫问题。


本文建议考虑使用“热”模型分析领土的方法。 该方法的基础是研究各种性质(点,线性和面)的对象(因子)产生的电势。 使用此方法对地域进行分析可以从描述该地域的一组空间数据(因子)移动到该地域中每个点的精确数字(点)估计。

作为区域分析的一部分而研究的潜力具有物理解释-不同尺寸(2D,3D)介质中的热量分布。 这种现象可以以“热”图像(区域的“热”图)的形式表示,可以根据图像的颜色强度来了解区域的发展程度。

地域因素



对领土的分析涉及搜索和处理有关影响领土及其指标的因素的信息。 影响因子是影响周围区域的对象,具有一组特征和空间坐标。 影响因素的例子包括商店,工业设施,道路,森林,水体。

影响指标是反映对象影响的对象,并且具有一组特征和空间坐标。 影响指标的示例:ATM,广告牌,纪念碑。

在下面的演示中,我们将使用影响因素的概念,将术语-因素和影响指标结合在一起。

下面是一个影响因素的空间数据示例。



领土分析工作的重要阶段之一是收集和处理初始信息的阶段。 如今,有许多关于影响细节程度不同的因素的信息。

可以从开放源或访问受限的源中获取信息。 在许多情况下,开放信息足以进行分析,尽管通常它需要相当耗时的处理。

在我们看来,开源中的佼佼者是资源-OpenStreetMap(OSM)。 从此来源获得的信息每天都会在世界范围内更新。

OpenStreetMap(OSM)资源信息以以下格式表示:

-OSM格式。 扩展名为“ .osm”的基本格式用于描述XML图像-节点,路径,关系。

-“波兰格式”。 具有扩展名“ .mp”的文本格式用于处理图形。

-PBF格式。 扩展名为“ .osm.pbf”的数据存储格式。

作为信息来源,您还可以使用:

-2地理信息系统
该资源包含高质量,每月处理的信息,以及适用于企业和组织的出色的3级分类器。

-KML(锁孔标记语言)文件
KML(钥匙孔标记语言)文件是一种文件格式,用于在Google Earth,Google Maps和移动设备的Google Maps中显示地理数据。

使用KML文件,您可以:
-设置各种图标并签名以指示地球表面上的位置
-通过更改相机的位置为所选对象创建各种角度
-使用各种叠加图像
-定义用于自定义对象显示的样式,使用HTML代码创建超链接和嵌入式图像
-使用文件夹对元素进行分层分组
-从远程或本地主机动态接收和更新KML文件
-根据3D查看器中的更改接收KML数据

- 联邦国家注册,地籍和制图“ Rosreestr”服务
Rosreestra门户网站上的信息对于其内容和相关性而言很有价值,但是,不幸的是,它无法免费获得基本建设项目和土地的时间表。 Rosreestra门户网站还包含大量受限信息。

- 统计部门
统计数据是关于该领土的合法信息来源,但是,截至今天,统计机构的数据仅可用于某些指标,主要是在统计机构的报告和区域机构的报告中。

- 政府信息系统
高质量的信息包含在政府的信息系统中,但其中只有一小部分在公共领域发布并可供分析。

区域分析对信息的构成没有任何特殊要求,实际上,您可以使用可以找到的所有内容,来自开放源的信息通常是可以互换的。 但是,应该注意的是,即使仅从OSM资源接收的信息也足以对不熟悉的地区进行分析。

使用“热”模型分析领土。 对电位的物理解释



如前所述,今天的领土分析是紧迫的话题,也是合理吸引各种城市环境基础设施建设投资的有力工具。

通过分析领土可以解决的各种任务可以合并为几个大区域:

-在每个地点获得对领土的最详尽的解释。
解决此问题,您可以在区域的每个点上获得一组点估计值,从而大致了解区域以及某些主题领域的发展水平。 这样的主题领域可以是例如文化,工业,贸易等。

-确定在选定区域内放置某种类型的投资对象(例如银行,专门商店,购物和娱乐中心等)的最有利位置。

-分析最有效地域。
该方向允许对区域特征,研究区域内的市场情况进行详细研究,并确定所需的选项。

-以出现新道路和新路线为例,确定一个因素对成本模型的贡献。

-分析一个领土的不同方面,并分析不同的领土(领土比较)。

本文中使用“热”模型分析区域的方法的独创性在于使用区域发展指标-潜力,以数字形式表示并反映对象对区域的影响程度(影响因子)。

为了理解研究的实质,应该对热势本身说几句话,并对其进行物理解释。

在物理学中,有诸如力场力函数之类的概念。 力场具有能量的维,力函数是力的维。

对于重力定律,力场由以下公式确定:

F=k/r2在哪里
k是一个常数;
r是互动对象之间的距离。

力函数ϕ由以下表达式确定:

dϕ=Fdr在哪里
ϕ是力场的潜力;
dϕ,dr是微分;
r是互动对象之间的距离,

因此 ϕ=k/r

力场电势的物理意义是指力场经过一定路径时所执行的功E。 在万有引力定律的情况下,当到物体的距离从r2变为r1时,力函数由以下公式确定

E=k1/r11/r2在哪里
E-通过特定路径时由力场执行的功;
r1,r2-对象的初始和最终位置。

对于分析区域的任务,可以将对象(因素)对区域的影响视为强度( 幂函数 ),将区域的发展水平视为所有对象(因素)的总热势( 力场 )。 在物理问题中,热势是温度,而在使用“热”模型分析领土的问题中,势是影响领域的所有因素的总和。

空间数据是点,线,面。 为了计算电位,将扩展的空间数据分为小片段。 对于每个片段,计算因子等于对象片段大小(因子)的点的电势。

根据紧密相似性原则,将数据分为语义组。 例如,贸易对象是按商品组合的。 有成组的森林物体,水体,居民点,公交车站等。 有意义的群体是一个因素。 通过所有物体(因素),我们获得了适合进一步处理的一组热势。

势能的使用(“热图”)使您可以从空间数据移动到对领土有影响(势能的可视化)的对象(因子)的“热”图像。 这种转变使得有可能确定该因素在领土上每个点的存在程度并进行进一步分析,即 以彩色显示城市的不同发展方向。 因此,我们为该区域的每个点获得了不同强度的辉光。

下图展示了下诺夫哥罗德境内“热”图像的几个因素。


诺夫哥罗德的“热”图,反映了“药房连锁”因素


诺夫哥罗德的“热”图,反映了“成人综合诊所”的因素


诺夫哥罗德的“热”图,反映了“儿童综合诊所”的因素


诺夫哥罗德的“热”图,反映了“工业区”因素

区域的“热”图像可以确定各种影响对象的电位集中程度。 接下来,有必要将获得的电势组合成一个完整的特征,该特征允许通过许多因素来评估区域。 为此,您需要一种方法,该方法可以分析大量信息,识别对象并通过丢失最少信息量来降低数据的维数。 一种这样的方法是主成分分析(PCA)。 您可以在Wikipedia上阅读有关此方法的更多信息。

该方法的本质是找到初始参数的线性组合,该组合在分析领域的变化最大。 对于空间数据-整个地区变化最大。

主成分的方法可以确定在整个区域内变化最大的对象(因素)。 通过该方法的工作,出现了新的变量-主要成分,与初始数据相比,它们的信息量更大,借助这些变量,可以更轻松地分析,描述和可视化区域,从而更轻松地构建模型。

主要组成部分是分析表达式-带有某些系数的初始因子的电势之和。 但是,如果有任何因素对地区具有重大影响,但在所分析的地区中没有变化,则主成分法不会在主要成分的构成中包括此因素。

主要组成部分按信息降序排列-即 遍布全境。 第一个主要组成部分比单独的因素携带更多的信息,并且很好地描述了领土。 通常,当使用约一百个因子时,第一主要成分承载了整个地区约50%的所有信息(分散)。 主要组成部分彼此不相关,可以用作模型,作为每个点的区域特征。

作为某些抽象计算的领域指标,主要组成部分没有明确的名称和分类。 但是,与主要组成部分密切相关的因素的组合可以解释主要组成部分。 通常,以下因素与主要组成部分相关:

-基础设施发展水平;
-领土的运输组成部分;
-气候带;
-农业发展水平;
-领土的经济潜力。

包括聚类在内的进一步分析包括一些重要的前几个主要组成部分。

在图中,您可以看到俄罗斯联邦几个城市的主要主要组成部分的图形显示。


诺夫哥罗德北部城市基础设施发展水平的第一个主要特征


叶卡捷琳堡城市基础设施发展水平的第一个主要特征


表征喀山城市基础设施发展水平的第一个主要组成部分


表征彼尔姆城市基础设施发展水平的第一个主要组成部分


表征萨马拉城市基础设施发展水平的第一个主要组成部分


表征哈巴罗夫斯克城市基础设施发展水平的第一个主要组成部分

整体功能:聚类



领土分析的下一阶段工作是寻找质量统一的城市地区。 该搜索基于对区域内每个点的主要成分值的分析。 可以使用聚类来解决搜索这些同质区域的任务-聚类是根据一组特征的邻近性原理对区域进行分组的过程。

区域集群有两个目标:

-更好地感知领土形象;
-分配区域以汇编单个模型。

根据选择的因素对区域进行聚类以进行分析。 这些因素可能是影响定价的因素,也可能是描述领土发展的某个方面(例如,社会领域)的因素。

有两种常见的经典聚类方法:K均值方法和树状图方法。 当在领土上工作时,K均值方法已经很好地证明了自己的优势,其独特之处在于通过将新对象连接到生长点来使集群“成长”。 K-means方法的优点是其工作与形成领土的自然过程相似:将相似的领土整合在一起,而不是分离不同的领土。

K均值法用于计算下诺夫哥罗德(下图)。


以诺夫哥罗德市为例,集群与领土发展水平的对应关系

使用建议的方法,您可以了解有关各个主题的领域。 我们感兴趣的主题可能是,例如,城市基础设施的发展水平,领土的“精英化”水平,文化的发展水平,领土发展的社会组成部分。 这些主题是定义不明确的整体概念,由许多相互关联的因素组成。

通过一些用于选择分析参数的算法(包括在专家的参与下),我们将获得主题地图,这些地图给出了领土发展的一个方面的想法。

整体特征被理解为第一主要组成部分,首先是信息最丰富的第一主要组成部分,并且根据选择的参数对区域进行聚类。

下图显示了有关发展各个方面的第一主要组成部分的专题图。


以诺夫哥罗德为例的主题图“文化对象”以诺夫哥罗德为例的


主题图“社会领域”

整体特征使人们有可能了解该地区的特征,并且在许多因素的影响下,信息损失最小。

总之,值得再次指出的是,今天的领土分析对于解决城市环境发展,选择建筑投资地点以及寻找新物体和其他任务的最有利位置的问题,是一个极为重要的阶段。

本文使用“热”模型从不同性质的因素分析文章中提出的区域的方法对于这组因素并不重要,也就是说,它没有对源信息施加限制和要求。

源信息的多样性和冗余性以及使用开放数据的能力为分析世界任何地区提供了无限的前景

在以下有关地域分析问题的出版物中,我们计划揭示使用模型的主要组件和方法来执行以下任务的编译模型的特征:

-放置新对象时选择最佳位置;
-利用市场价值为某类物品建立价格表;
-根据对象的位置评估某种活动的获利能力。

还计划引入从主要成分到因子的逆向转换方法,这反过来又使我们能够获得给定领土的因子模型。

Source: https://habr.com/ru/post/zh-CN446222/


All Articles