我们将继续探讨关于SAP HANA数据管理套件的一系列文章,该套件是内部部署和云技术的混合,其中包括四个产品组件:SAP Data Hub,SAP HANA,SAP Enterprise Architecture Designer和
SAP Cloud Platform Big Data Services 。
这些解决方案的组合使您可以创建具有以下功能的整体数据管理结构:
- 数据来源跟踪
- 跟踪数据及其结构的变化
- 对元数据的全面理解
- 支持所需的安全级别
- 集中监控
但是今天,我们将讨论该系统的“核心”-SAP HANA平台。
SAP已经并且将继续进行研究,在开发数据处理方面投入大量资源和资金。 结果就是SAP HANA平台-高性能分析设备。 我们公司已经在开发业务技术和服务方面积累了多年的独特经验-SAP使用它来创建用于实时数据处理的业务平台。 结果,SAP HANA应运而生,它成为新型智能企业(智能企业)的开发和建设的基础和核心。 该平台用于在SAP内部以及我们的客户和合作伙伴中开发应用程序。

SAP HANA是用于存储和处理信息的多功能解决方案。 内置的计算引擎是SAP HANA的功能之一,它使您可以将计划操作从应用程序级别转移到SAP HANA数据库级别。 使用硬件平台的现代体系结构,计算效率更高-整个已处理数据的“雪崩”都分为严格定义的线程数,该线程数等于平台核心的总数。 这种方法可以最有效地利用每个处理器每个核心的处理能力。
SAP HANA还提供用于存储和处理内存数据的技术。 SAP HANA作为数据库允许您以行和批处理格式存储数据。 内存中的数据存储和处理技术提供了快速的事务处理,并且与数据分析技术一起使用的Calculation View可确保执行分析查询时的高性能。
Forrester分析师开始使用新概念-“翻译数据库”。 按照他们的定义,这种平台“支持多种类型的用途,包括实时信息,机器学习,在线分析和极限事务处理。”
Forrester最近的一份报告指出:“ SAP HANA是一种无共享(不共享使用资源)的内存平台。 这是用于交易和数据分析的SAP平台的基础,它支持许多应用程序场景:实时数据处理应用程序,分析,转换应用程序以及深度和高级分析系统。 企业使用该平台来组织内存数据集市,使用SAP Business Warehouse进行实时数据存储以及使用SAP S / 4HANA和SAP Business Suite。
转换平台适用于支持实时应用程序和服务:用于交易股票,检测欺诈,打击恐怖主义,监视患者健康状况,分析来自各种传感器的数据,监视地震等等。 使用转换平台,应用程序可以实时交换数据,确保企业中存储的信息的一致性和准确性。
SAP HANA的另一个应用领域是机器学习支持,它使您可以将复杂的分析模型应用于数据,以更准确地预测运营,业务流程,客户行为等。
SAP HANA如何支持此功能?
让我们从数据库服务开始。 如果我们从架构和技术的角度考虑HANA,那么有两种存储数据的方式:逐行和逐行。
将数据按行存储在表中可实现高速数据记录。 如果要向表中添加新行,则只需要在内存中为该行找到可用空间并在其中写入新数据即可。 但是,逐行存储给数据分析带来了问题:您需要以易于分析的形式使用索引或数据的物化表示形式。 同时,由于需要额外的时间来重建索引,在插入行期间以不同的格式实现数据,因此索引会导致延迟。
如果数据是按单位存储的,那么要添加新行,有必要花时间将行值分类为列,然后等待直到将数据发布到内存中的不同位置。 所有这些都会导致数据记录期间的性能下降。
具有大容量存储的数据库使您可以更快地处理请求,因为在这种情况下,来自请求的列的数据是紧凑的,并且在内存中被压缩。 即 查询时,无需扫描整个表-仅查看查询中使用的列。 这样的数据库已针对读取进行了优化,信息的大容量存储允许使用分组以某种方式在RAM中组织数据。 通过这种方法,可以以更高的效率使用各种压缩技术,从而导致源信息的多次压缩。
为了解决此问题,开发了统一表方法,该方法提供了将数据读写到存储表的高速度。 这种机制使您可以快速执行事务(即记录新行),由于以压缩形式进行大容量存储,并行数据处理,还可以高速分析数据,还可以将所有数据存储在随机存取存储器(内存中)中。
记录时,不会立即更改表的主存储位置。 而是将所有编辑记录在单独的数据结构中-增量存储(在图片L1-delta中)。 在此,数据以针对记录而优化的格式存储。 当需要从增量存储转移更改时,将启动特殊的增量合并过程-增量合并。 首先,将来自L1-delta的数据转换为L2-delta中的布局格式,然后与主数据存储(主存储)合并。 对于数据读取机制,信息存储的所有三个区域(L1-delta,L2-delta和主存储)以整数形式提供数据。 由于此过程,事实证明可以提供高速数据记录和分析。

SAP HANA的显着优势之一是,汇总数据的所有计算都在形成分析查询期间直接执行,并立即显示为结果。 在RAM中存储详细数据或源数据(而不是合计值)的功能使您可以放弃对合计表的初步计算和存储,合计表是传统分析系统的组成部分。
SAP HANA还支持各种内部编程语言:R用于创建预测模型,SQL Script用于编写计算逻辑。 在SAP HANA 2.0中嵌入的XSA应用程序服务器级别,您可以
通过支持自带语言概念(并使用Cloud Foundry)来使用许多其他语言进行开发。 使用这些语言,您可以直接在数据存储级别进行必要的计算和预测。 这样,您就可以摆脱不必要的大量数据传输阶段,并将完成的计算结果提供给应用程序级别。
现在考虑SAP HANA平台服务。
SAP HANA平台服务

SAP HANA不仅具有数据库,而且还提供用于应用程序开发,集成和数据清理工具的全套服务,用于分析数据处理(包括机器学习)的库以及存储和处理特殊类型数据的能力。 SAP HANA允许您从各种来源下载数据而无需其他工具,从而开发出各种形式来输入,编辑和分析数据。 还提供用于复杂智力数据处理的工具:转换,转换,搜索模式,研究。 而且,当然,该平台是开放的,可通过各种工具进行可视数据分析。
要谈论SAP HANA的所有功能,您将需要写一些其他文章。 其中许多已经在我们的博客中进行了描述。

让我们看一些可用的服务:
SAP HANA包括一个用于存储和处理地理数据的引擎,该数据描述了空间中物体的位置,形状和方向。 SAP HANA支持空间数据类型及其处理方法。 有一种处理这种结构的特殊方法-图形。 在这种情况下,SAP HANA提供了处理超链接数据及其关系的功能。 数据处理引擎具有内置算法,用于查找邻域,最短路径,强耦合的组件,模式匹配等等。
SAP HANA还具有数百种预打包的机器学习和预测算法,这些算法具有聚合,聚类,分类,回归,概率分布,时间序列等功能。 此外,您可以使用TensorFlow库和R。
SAP HANA具有用于处理和分析文本文件的内置功能,包括用于文本挖掘的各种功能-例如,模糊逻辑,搜索同义词,语义分析等。
SAP HANA流分析可以通过将数据或结果存储在SAP HANA数据库中并将不太重要的数据定向到价格便宜的存储解决方案(例如Hadoop)中,每秒实时捕获,过滤,分析和影响数百万个事件。 SAP HANA流分析还与Apache Kafka的消息传递系统集成在一起。
SAP HANA入门的有用材料和资源:
SAP HANA的免费试用版和快速版可在我们的官方网站上下载。 另外,在开始工作时,您可以在开始使用SAP HANA之前先学习一
组教程 :
-用于SAP HANA的虚拟机和
Server + XSA Applications版本以及
视频安装说明-这套教程有多种选择。 例如,对于空间数据:第
一个和
第二个