Marketing com tomada de decisão de ML

A priorização da lista de pendências leva à escolha entre estratégias. Cada um tem suas métricas. Há um requisito para escolher o mais importante. A pontuação ML é uma solução quando não existe linearidade e a economia não é linear. Veja a introdução aqui . Dois grupos são considerados. Primeiro (I) corresponde à conversão na web {taxa de rejeição, microconversão, tempo, profundidade}. O segundo (II) corresponde à atração de novos visitantes do canal orgânico {visitas, espectadores, visualizações}. A função de destino é um número de ofertas comerciais por dia. A tarefa é reduzir a dimensão para obter a estratégia simples ideal. Nesse caso, os canais B2B online / offline não podem ser separados: o mercado é escasso e os novos clientes podem ter algumas informações sobre 'a marca' de ambos os canais. Portanto, a avaliação estatística está mais próxima da realidade do que o rastreamento direto da CJM neste caso.

No exemplo dado, a votação do conjunto envolve a proibição de técnicas de redução de destino e dimensão. Dois grupos de métricas são considerados. Os recursos e o destino são normalizados para o intervalo [0,1]. São utilizados dados relativamente pequenos com amostragem diária: quatro anos de gravação. As métricas da Web são analisadas da plataforma analítica por meio da API Python. Os dados de vendas são recebidos do CRM. A matriz de correlação mostra que não há correlação significativa entre ofertas convertidas e métricas da Web: a regressão linear não pode ser aplicada.



É utilizado um conjunto de estimadores de votação não lineares: KNeighborsClassifier, Decision Tree, Ada Boost, Gradient Boosting, Classificador de vetores de suporte, Naive Bayes e Perceptron de várias camadas com três camadas ocultas. O hiper-ajuste é aplicado apenas ao KNeighborsClassifier. Modelos lineares (alto viés) e não lineares (alta variância) são considerados. Os modelos são comparáveis ​​em relação à precisão / dispersão. Espalhamento menor significa maior estabilidade. Inicialmente, usamos todas as métricas como recursos de entrada. Ele fornece a dispersão de 0,11 da precisão do modelo e mediana da precisão de 96%:



O segundo experimento pressupõe métricas de descarte consequentes para diminuir a dimensão. A métrica é lançada se sua remoção fornecer um mínimo de precisão. Finalmente, resta uma métrica - número de sessões. Nesse caso, a precisão ainda é de 96%, mas a dispersão dos modelos de conjunto é menor: 0,01.



Conclusão: nenhuma informação adicional é fornecida por outros recursos. O tráfego tem maior importância para previsão e corresponde a um modelo de previsão mais estável. O método proposto pode ser generalizado na tomada de decisões quando a não linearidade é inevitável.

Alguma paz no código Jupyter é dada aqui .

Obrigado pelo Karma

Source: https://habr.com/ru/post/pt458076/


All Articles