Fungsi SAP HANA sebagai basis data untuk SAP HANA Data Management Suite

Kami melanjutkan serangkaian artikel di SAP HANA Data Management Suite, gabungan teknologi lokal dan cloud yang mencakup empat komponen produk: SAP Data Hub, SAP HANA, Perancang Arsitektur Enterprise SAP, dan Layanan Big Data Platform SAP Cloud .

Kombinasi dari solusi ini memungkinkan Anda untuk membuat struktur manajemen data holistik dengan fungsi-fungsi berikut:

  • pelacakan asal data
  • melacak perubahan data dan strukturnya
  • pemahaman komprehensif tentang metadata
  • mendukung tingkat keamanan yang diperlukan
  • pemantauan terpusat

Tetapi hari ini kita akan berbicara tentang "inti" dari sistem ini - platform SAP HANA.

SAP telah melakukan dan terus melakukan penelitian, menginvestasikan sumber daya dan dana besar dalam pengembangan pemrosesan data. Hasilnya adalah platform SAP HANA - Alat Analisis Kinerja Tinggi. Perusahaan kami telah mengumpulkan pengalaman unik bertahun-tahun dalam mengembangkan teknologi dan layanan untuk bisnis - dan SAP menggunakannya untuk membuat platform bisnis untuk pemrosesan data secara realtime. Akibatnya, SAP HANA muncul, yang menjadi dasar dan inti untuk pengembangan dan pembangunan perusahaan cerdas tipe baru (perusahaan cerdas). Platform ini digunakan untuk mengembangkan aplikasi baik di dalam SAP, dan pelanggan dan mitra kami.



SAP HANA adalah solusi multiguna untuk menyimpan dan memproses informasi. Salah satu fitur SAP HANA adalah mesin penghitung bawaan, yang memungkinkan Anda mentransfer operasi perencanaan dari level aplikasi ke level database SAP HANA. Menggunakan arsitektur modern platform perangkat keras, perhitungan lebih efisien - seluruh "longsoran" data yang diolah dibagi menjadi jumlah ulir yang didefinisikan secara ketat, yang jumlahnya sama dengan jumlah total inti platform. Pendekatan ini memungkinkan penggunaan daya pemrosesan yang paling efisien dari setiap inti dari setiap prosesor.

SAP HANA juga menyediakan teknologi untuk menyimpan dan memproses data dalam memori. SAP HANA sebagai database memungkinkan Anda untuk menyimpan data dalam format baris-demi-baris dan dalam kumpulan. Teknologi penyimpanan dan pemrosesan data dalam memori menyediakan pemrosesan transaksi yang cepat, dan bersama-sama dengan teknologi analisis data, Calculation View menjamin kinerja tinggi ketika melakukan kueri analitik.

Analis Forrester mulai menggunakan konsep baru - "database translasi". Menurut definisi mereka, platform semacam itu "mendukung banyak jenis penggunaan, termasuk informasi waktu nyata, pembelajaran mesin, analitik sebaris, dan pemrosesan transaksi ekstrem."

Laporan Forrester baru-baru ini menyatakan sebagai berikut : “SAP HANA adalah platform tanpa memori yang dibagikan (tanpa penggunaan bersama), dalam memori. Ini adalah dasar dari platform SAP untuk transaksi dan analitik data, ini mendukung banyak skenario aplikasi: aplikasi pemrosesan data real-time, analitik, aplikasi translasi, dan sistem analitik yang mendalam dan canggih. Perusahaan menggunakan platform untuk mengatur data dalam memori, untuk bekerja dengan penyimpanan data waktu nyata dari SAP Business Warehouse, serta ketika bekerja dengan SAP S / 4HANA dan SAP Business Suite. "

Platform translasi cocok untuk mendukung aplikasi dan layanan realtime: untuk perdagangan saham, mendeteksi penipuan, memerangi terorisme, memantau kesehatan pasien, menganalisis data dari berbagai sensor, memantau gempa bumi, dan banyak lagi. Menggunakan platform translasi, aplikasi dapat bertukar data secara real time, memastikan konsistensi dan akurasi informasi yang disimpan di perusahaan.

Area aplikasi lain untuk SAP HANA adalah dukungan pembelajaran mesin, yang memungkinkan Anda untuk menerapkan model analitik yang kompleks ke data untuk lebih akurat memprediksi operasi, proses bisnis, perilaku pelanggan, dll.

Bagaimana SAP HANA mendukung fungsi ini?


Mari kita mulai dengan layanan basis data. Jika kita mempertimbangkan HANA dalam hal arsitektur dan teknologi, maka ada dua cara untuk menyimpan data - baris demi baris dan baris demi baris.

Penyimpanan data dalam tabel memungkinkan untuk perekaman data kecepatan tinggi. Jika Anda ingin menambahkan baris baru ke tabel, maka Anda hanya perlu menemukan ruang kosong di memori untuk baris ini dan menulis data baru di sana. Namun, penyimpanan baris-demi-baris menimbulkan masalah dengan analisis data: Anda perlu menggunakan pengindeksan atau representasi material dari data dalam bentuk yang sesuai untuk analisis. Pada saat yang sama, pengindeksan menyebabkan penundaan karena fakta bahwa waktu tambahan diperlukan untuk membangun kembali indeks, mematerialisasi data dalam format yang berbeda selama penyisipan baris.

Jika data disimpan berdasarkan unit-per-unit, maka untuk menambahkan baris baru, perlu menghabiskan waktu menyortir nilai-nilai baris ke dalam kolom, kemudian tunggu sampai data diposting ke berbagai tempat di memori. Semua ini menyebabkan kinerja yang buruk selama perekaman data.

Basis data dengan penyimpanan massal memungkinkan Anda untuk memproses permintaan lebih cepat, karena dalam hal ini data dari kolom yang diminta padat dan dikompresi dalam memori. Yaitu saat bertanya, tidak perlu memindai seluruh tabel - lihat saja kolom yang digunakan dalam kueri. Basis data semacam itu dioptimalkan untuk membaca, dan penyimpanan informasi secara massal memungkinkan pengorganisasian data dalam RAM dengan cara tertentu, menggunakan pengelompokan. Dengan pendekatan ini, dimungkinkan untuk menggunakan berbagai teknik kompresi dengan efisiensi yang lebih besar, yang mengarah pada kompresi berganda dari informasi sumber.

Untuk mengatasi masalah ini, pendekatan Unified Tables dikembangkan, yang menyediakan kecepatan tinggi membaca dan menulis data ke tabel penyimpanan. Mekanisme ini memungkinkan Anda untuk dengan cepat melakukan transaksi (yaitu, merekam jalur baru), menganalisis data dengan kecepatan tinggi karena penyimpanan massal dalam bentuk terkompresi, pemrosesan data paralel, dan juga menyimpan semua data dalam memori akses acak (dalam memori).

Saat merekam, perubahan tidak langsung dilakukan ke lokasi penyimpanan utama tabel. Sebagai gantinya, semua suntingan direkam dalam struktur data terpisah - penyimpanan delta (dalam gambar L1-delta). Di sini, data disimpan dalam format yang dioptimalkan untuk direkam. Ketika diperlukan untuk mentransfer perubahan dari penyimpanan delta, proses penggabungan Delta khusus diluncurkan - penggabungan delta. Pertama, data dari L1-delta diubah menjadi format tata letak di L2-delta, dan kemudian digabungkan dengan penyimpanan data utama (main store). Dan untuk mekanisme pembacaan data, ketiga area penyimpanan informasi (L1-delta, L2-delta dan toko utama) menyediakan data dalam bentuk integral. Berkat proses ini, ternyata menyediakan perekaman dan analisis data berkecepatan tinggi.



Salah satu keuntungan signifikan SAP HANA adalah bahwa semua perhitungan data agregat dilakukan langsung selama pembentukan kueri analitik dan segera ditampilkan sebagai hasilnya. Kemampuan untuk menyimpan data terperinci atau sumber dalam RAM (bukan nilai agregat) memungkinkan Anda untuk meninggalkan perhitungan awal dan penyimpanan tabel agregat, yang merupakan bagian integral dari sistem analitik klasik.

SAP HANA juga mendukung berbagai bahasa pemrograman internal: R untuk membuat model prediksi, SQL Script untuk menulis logika perhitungan. Pada tingkat server aplikasi XSA yang tertanam dalam SAP HANA 2.0, Anda dapat melakukan pengembangan dalam banyak bahasa lain dengan mendukung konsep Bring Your Own Language (dan dengan menggunakan Cloud Foundry) . Dengan menggunakan bahasa-bahasa ini, Anda dapat membuat perhitungan dan perkiraan yang diperlukan secara langsung di tingkat penyimpanan data. Ini memungkinkan Anda untuk menyingkirkan tahap-tahap yang tidak perlu dari transfer sejumlah besar data dan memberikan hasil perhitungan yang telah selesai ke level aplikasi.

Sekarang pertimbangkan layanan platform SAP HANA.

Layanan Platform SAP HANA





SAP HANA tidak hanya memiliki basis data, tetapi juga seluruh rangkaian layanan untuk pengembangan aplikasi, alat integrasi dan pembersihan data, perpustakaan untuk pemrosesan data analitis, termasuk Machine Learning, serta kemampuan untuk menyimpan dan memproses jenis data khusus. SAP HANA memungkinkan Anda untuk mengunduh data dari berbagai sumber tanpa alat tambahan, untuk mengembangkan berbagai formulir untuk memasukkan, mengedit, dan menganalisis data. Alat juga tersedia untuk pemrosesan data intelektual yang kompleks: transformasi, transformasi, pencarian pola, penelitian. Dan, tentu saja, platform ini terbuka untuk analisis data visual melalui berbagai alat.

Untuk membicarakan semua fitur SAP HANA, Anda perlu menulis beberapa artikel tambahan. Banyak dari mereka sudah dijelaskan di blog kami.



Mari kita lihat beberapa layanan yang tersedia:

SAP HANA mencakup mesin untuk menyimpan dan memproses geodata - data yang menggambarkan posisi, bentuk, dan orientasi objek di ruang angkasa. SAP HANA mendukung tipe data spasial dan metode pemrosesan mereka. Ada metode khusus untuk memproses struktur seperti itu - grafik. SAP HANA dalam hal ini menyediakan kemampuan untuk memproses data yang hyperlink dan hubungannya. Mesin pengolah data memiliki algoritma bawaan untuk menemukan lingkungan, jalur terpendek, komponen yang sangat berpasangan, pencocokan pola, dan banyak lagi.

SAP HANA juga memiliki ratusan algoritma pembelajaran mesin peramalan dan peramalan dengan kemampuan seperti agregasi, pengelompokan, klasifikasi, regresi, distribusi probabilitas, seri waktu, dan banyak lagi. Selain itu, Anda dapat menggunakan perpustakaan TensorFlow dan R.

SAP HANA memiliki kemampuan bawaan untuk memproses dan menganalisis file teks, termasuk berbagai fungsi untuk penambangan teks - misalnya, logika fuzzy, mencari sinonim, analisis semantik, dll.

SAP HANA Streaming Analytics dapat menangkap, memfilter, menganalisis, dan memengaruhi jutaan peristiwa per detik secara real time dengan menyimpan data atau hasil dalam basis data SAP HANA dan mengarahkan data yang kurang penting ke solusi penyimpanan yang lebih murah seperti Hadoop. SAP HANA Streaming Analytics juga terintegrasi dengan sistem pengiriman pesan Apache Kafka.

Bahan dan sumber daya yang berguna untuk memulai dengan SAP HANA:
Versi percobaan gratis SAP HANA , edisi ekspres tersedia untuk diunduh di situs web resmi kami. Juga, di awal pekerjaan, Anda dapat mempelajari serangkaian tutorial sebelum mulai bekerja dengan SAP HANA:
- mesin virtual dan versi Aplikasi Server + XSA untuk SAP HANA dan instruksi pemasangan video
- Kumpulan tutorial memiliki banyak pilihan. Misalnya, untuk bekerja dengan data spasial: yang pertama dan kedua

Source: https://habr.com/ru/post/id426503/


All Articles