Pemasaran dengan pengambilan keputusan ML

Prioritas backlog mengarah pada pilihan antara strategi. Masing-masing memiliki metriknya. Ada persyaratan untuk memilih yang paling penting. Penilaian ML adalah solusi ketika non linearitas ada dan ekonomi nonlinier. Lihat pengantar di sini . Dua kelompok dipertimbangkan. Pertama (I) berhubungan dengan konversi web {rasio pentalan, konversi mikro, waktu, kedalaman}. Kedua (II) sesuai dengan atraksi pengunjung baru dari saluran organik {kunjungan, pemirsa, tampilan}. Fungsi target adalah sejumlah penawaran komersial per hari. Tugasnya adalah mengurangi dimensi untuk mendapatkan strategi sederhana yang optimal. Dalam hal ini saluran B2B online / offline tidak dapat dipisahkan: pasar tipis dan pelanggan baru mungkin memiliki beberapa informasi tentang 'merek' dari kedua saluran. Oleh karena itu evaluasi statistik lebih dekat dengan kenyataan daripada pelacakan CJM langsung dalam kasus ini.

Dalam contoh yang diberikan ensemble voting, teknik binning target dan pengurangan dimensi dilibatkan. Dua kelompok metrik dipertimbangkan. Fitur dan target dinormalisasi ke interval [0,1]. Data yang relatif kecil dengan pengambilan sampel harian digunakan: empat tahun perekaman. Metrik web diuraikan dari platform analitik melalui Python API. Data penjualan diterima dari CRM. Matriks korelasi menunjukkan bahwa tidak ada korelasi yang signifikan antara Penawaran yang dikonversi dan metrik Web: regresi linier tidak dapat diterapkan.



Ensemble penduga pemungutan suara nonlinear digunakan: KNeighborsClassifier, Decision Tree, Ada Boost, Gradient Boosting, Support Vector Classifier, Naive Bayes, dan Multi-layer Perceptron dengan tiga lapisan tersembunyi. Penyelarasan Hyper diterapkan hanya untuk KNeighborsClassifier. Model linear {bias tinggi} dan nonlinier {varians tinggi} dipertimbangkan. Model sebanding dalam kaitannya dengan akurasi / hamburan. Hamburan yang lebih kecil berarti stabilitas yang lebih tinggi. Awalnya kami menggunakan semua metrik sebagai fitur input. Ini memberikan 0,11 hamburan akurasi model dan median akurasi 96%:



Eksperimen kedua mengasumsikan membuang metrik untuk mengurangi dimensi. Metrik dilemparkan jika pemindahannya memberikan akurasi penarikan minimum. Akhirnya satu metrik tersisa - jumlah sesi. Dalam hal ini akurasi masih 96%, tetapi hamburan model ensemble lebih rendah: 0,01.



Kesimpulan: tidak ada informasi tambahan yang diberikan oleh fitur lain. Lalu lintas memiliki kepentingan tertinggi untuk prediksi dan sesuai dengan model prediksi yang lebih stabil. Metode yang diusulkan dapat digeneralisasi dalam pengambilan keputusan ketika non-linearitas tidak bisa dihindari.

Kedamaian kode Jupyter diberikan di sini .

Terima kasih untuk Karma

Source: https://habr.com/ru/post/id458076/


All Articles