
Halo semuanya!
Nama saya Sergey Konkov - Saya seorang arsitek data di Laporan & Data Bisnis.
Artikel ini membahas tentang kemungkinan menggunakan geo-analitik dan pembelajaran mesin di perusahaan ritel dan didasarkan pada proyek nyata klien kami - jaringan besar salon kecantikan. Tidak akan ada banyak kode dan rincian teknis, perhatian akan diberikan pada tinjauan teknologi, aplikasi dan integrasi mereka.
Tantangan
Ada perusahaan yang aktif berkembang di sektor jasa. Perusahaan membuka beberapa salon kecantikan bulanan terutama di pusat perbelanjaan (TC).
Tugasnya adalah memilih tempat terbaik untuk penemuan, mengurangi waktu dan biaya untuk membuat keputusan.Contoh rencana implementasi
- Kami akan menerima data tentang pusat perbelanjaan yang dapat membantu kami menilai daya tarik tempat;
- Mari kita coba mencari koneksi antara data yang diperoleh dan hasil kerja salon di pusat-pusat perbelanjaan di mana perusahaan sudah beroperasi;
- Kami akan membuat metodologi untuk mengevaluasi pusat perbelanjaan baru untuk daya tarik;
- Kami akan membuat model pembelajaran mesin untuk menghitung perkiraan ini untuk pusat-pusat perbelanjaan di mana perusahaan kami belum ada;
- Kami akan membuat alat untuk mengotomatisasi pekerjaan spesialis dalam memilih tempat untuk membuka outlet ritel;
Kami mengumpulkan data geografis
Jadi, data apa di pusat perbelanjaan yang bisa membantu.
Mencerminkan:
- Misalnya, di daerah dan kota apa itu terletak - Moskow atau Samara, Barvikha atau Vykhino;
- Ukuran pusat perbelanjaan - berapa banyak toko, restoran, salon di sana?
- Dan apa saja toko-toko ini - bahan bangunan atau butik mode?
- Apakah ada pesaing di sana? Dan berapa jumlahnya? Dan yang mana dari mereka?
- Mungkin ada informasi tentang jumlah pengunjung di pusat perbelanjaan?
- Apakah ada pusat perbelanjaan lain di dekat sini? Dalam radius 5 km, tidak satu atau dua lebih baik dari ini di seberang jalan;
- Dan apa lagi yang ada di dekat sini? Mungkin pusat bisnis besar dengan banyak karyawan kantor atau area tidur?
Itulah yang dipikirkan oleh orang yang โberpengalamanโ tentang siapa yang perlu memutuskan tempat untuk bisnis. Orang yang maju juga memiliki kemampuan analitik, yang dalam Excel atau SQL dapat membuat pembenaran yang kompeten berdasarkan semua faktor ini.
Butuh waktu untuk mengumpulkan dan memproses data ini. Mari kita coba optimalkan ini.
Di mana mendapatkan data? Mari kita lihat layanan geo yang ada di pasaran. Yang utama adalah: Yandex Maps, 2GIS, Google Maps. Setelah membandingkan fitur-fiturnya, kami memutuskan untuk menggunakan 2GIS.
Keuntungan utama layanan menurut kami: akurasi, relevansi dan kelengkapan data, API yang ramah pengguna. Tetapi Anda dapat menggunakan solusi dari produsen lain.
Akses ke API 2GIS dapat diperoleh melalui formulir di situs web layanan. Akses dibayar dan tergantung pada jumlah permintaan, secara terpisah akan diperlukan untuk menentukan dalam kontrak dengan 2GIS cara menggunakan data, itulah sebabnya kami meminta mereka, apa yang akan kami lakukan dengan mereka dan sebagainya.
Saya akan memberi tahu Anda sedikit cara bekerja dengan API 2GIS.Layanan ini memungkinkan Anda untuk memilih lokasi organisasi di wilayah tertentu (kota, distrik, jalan, dan sebagainya). Sebagai filter, Anda dapat menentukan rubrik organisasi (jenis aktivitas). Kami akan membuat permintaan untuk mencari semua organisasi di bawah judul Pusat perbelanjaan. Hasilnya, kami mendapatkan daftar pusat perbelanjaan di wilayah tersebut. Dalam respons untuk setiap pusat perbelanjaan, yang disebut pengidentifikasi rumah - building_id juga akan datang. Kami akan membuat permintaan ke semua organisasi yang berlokasi di gedung dengan salah satu building_id yang diterima. Kami mendapatkan daftar semua organisasi di pusat perbelanjaan ini termasuk nama dan pos mereka.

Dengan demikian, kami menerima daftar semua toko, salon, restoran, dan organisasi lain di pusat perbelanjaan tertentu. Kita dapat membuat permintaan seperti itu untuk setiap pusat perbelanjaan yang menarik minat kita.
Infrastruktur proyek
Untuk implementasi, kami memilih cloud
MS Azure . Ada semua yang kita butuhkan, yaitu:
Semua data yang diperoleh dari 2GIS akan dimuat ke dalam tabel database Azure SQL.
Kami menempatkan semua skrip untuk diunduh dalam paket Pabrik Data Azure. Ini akan memungkinkan kami untuk mengunduh data secara massal (misalnya, untuk semua pusat perbelanjaan di kota tertentu) dengan jadwal untuk menjaga relevansi data, serta berdasarkan permintaan untuk pusat perbelanjaan tertentu.
Contoh tugas integrasi:

Bekerja dengan data
Kita dapat mulai mencari hubungan antara data dari 2GIS dan hasil aktual dari salon. Untuk melakukan ini, unggah data di pusat perbelanjaan ke toko tempat perusahaan tersebut sudah ada. Di sana kami akan mengunggah data tentang pekerjaan salon dari ERP - pendapatan, jumlah cek, margin, jumlah pengunjung.
Pada tahap ini, kami menghubungkan spesialis ke proyek Ilmu Data. Bagi mereka, kami menggunakan kubus OLAP berdasarkan data yang dikumpulkan dan lingkungan Belajar Mesin Azure.
Studi yang dilakukan oleh para ilmuwan data menunjukkan bahwa faktor-faktor berikut paling kuat mempengaruhi hasil kerja salon (pendapatan dan marginalitas):
- Kota tempat pusat perbelanjaan berada;
- Jumlah toko di pusat perbelanjaan;
- Jumlah pesaing di pusat perbelanjaan;
- Kehadiran merek tertentu;
- Jumlah pusat perbelanjaan lain dalam radius 2 km;
Untuk menilai daya tarik pusat perbelanjaan, kami memperkenalkan skala dari 1 hingga 10. Untuk transparansi penilaian daya tarik, kami perlu menunjukkan kepada pengguna faktor-faktor mana dan bagaimana mereka memengaruhi peringkat akhir. Berikut adalah contoh penilaian salah satu pusat perbelanjaan:

Menghubungkan pembelajaran mesin
Kami menghitung perkiraan ini untuk semua pusat perbelanjaan di mana perusahaan sudah beroperasi. Set data yang dihasilkan (faktor + penilaian) akan digunakan untuk membuat model pembelajaran mesin. Pada akhirnya, model harus menentukan penilaian daya tarik pusat perbelanjaan untuk pembukaan salon baru.
Contoh membuat percobaan di Azure ML Studio:

Gambar tersebut menunjukkan contoh sederhana membuat percobaan pembelajaran mesin berdasarkan model regresi linier.
Setelah kami menyebarkan model yang dibuat dalam bentuk layanan web, kami akan dapat menerima peringkat menarik untuk pusat perbelanjaan di mana tidak ada salon perusahaan kami.
Jadi, kami memiliki data, kami memiliki pemahaman tentang cara bekerja dengannya, dan kami memiliki cara menentukan peringkat pusat perbelanjaan. Sekarang kami akan mentransfer semua ini kepada pengguna yang beroperasi.
Kami mengotomatiskan pekerjaan staf dari departemen pemilihan tempat
Untuk memulai, buat laporan analitis.
Misalnya, kita perlu mengevaluasi kemungkinan membuka beberapa gerai ritel di N.
Kami tertarik pada data berikut:
- Semua pusat perbelanjaan di kota (jumlah toko di masing-masing, jumlah pesaing, toko kami);
- Semua pusat perbelanjaan di kota di mana ada pesaing, tetapi bukan kita;
- Semua pesaing di kota (di mana pusat perbelanjaan diwakili, berapa total gerai ritel);
Berikut adalah contoh dari salah satu laporan yang dibuat di MS Power BI. Sumber data adalah gudang data kami di MS Azure.

Selanjutnya, kami akan membuat alat untuk menampilkan data yang dikumpulkan di pusat perbelanjaan di peta. API 2GIS yang sudah dikenal akan membantu kami dalam hal ini. Di aplikasi web, buat widget peta dan terapkan spidol dengan tanda pusat perbelanjaan di atasnya. Contoh (data nyata berubah):

Untuk meringkas
Jadi kami melakukan yang berikut:
- Kami membangun proses untuk mendapatkan data tentang pusat perbelanjaan dari layanan 2GIS.
- Kami menemukan hubungan antara data yang diperoleh dan hasil salon di pusat-pusat perbelanjaan di mana perusahaan sudah beroperasi.
- Mereka menciptakan metodologi untuk menilai pusat perbelanjaan untuk daya tarik.
- Kami mengembangkan pelaporan dan alat untuk mengotomatisasi pekerjaan spesialis dalam memilih tempat untuk membuka gerai ritel.
Mari kita lihat arsitektur dari solusi yang kita miliki.
Pada bagian selanjutnya dari artikel ini, saya berencana untuk memberi tahu cara membuat bot-geoanalitik untuk membantu karyawan yang bertanggung jawab atas pemilihan tempat.Terima kasih atas perhatian anda!
Jika seseorang tertarik pada detail teknis dari implementasi masing-masing komponen solusi, maka saya akan dengan senang hati menjawab pertanyaan dalam komentar atau dalam pesan pribadi.