Mesures non triviales de l'efficacité des campagnes publicitaires

Lors de l'analyse des chaînes de canaux publicitaires, certaines idées assez simples mais utiles passent inaperçues. Les analystes qui connaissent les mathématiques veulent immédiatement s'immerger dans l'apprentissage automatique, tandis que les analystes qui sont loin des mathématiques ne comprennent pas vraiment où et comment regarder indépendamment des rapports Google Analytics standard.

Dans le même temps, une chose assez banale comme la distribution des longueurs de chaînes d' attribution pour une période peut vous dire des choses très éloquentes, et pas seulement sur l'efficacité de votre publicité.

Dans cet article, je vais montrer comment pour cette distribution:

  1. Distinguer parmi ceux qui passent par les canaux publicitaires les utilisateurs qui répondent à la publicité;
  2. Évaluez l'efficacité de l'impact de votre campagne publicitaire sur ce groupe;
  3. Pour évaluer comment les gens réagiraient à votre produit si vous saviez tout ce que vous vouliez leur dire;
  4. Estimez la fréquence optimale d'affichage des publicités en termes de taux de conversion.


Groupes d'engagement des utilisateurs


Supposons que vous disposiez de données sur toutes les chaînes de canaux que les utilisateurs ont transmises en un mois. Pour commencer, nous les diviserons en deux groupes:

  1. Chaînes qui se sont terminées par une conversion.
  2. Chaînes qui n'ont pas mis fin à la conversion.

Construisez une table contenant le nombre de chaînes d'une certaine longueur:
Longueur de chaîne
1
2
3
4
...
Nombre de conversions
200
400
600
1000
...
Nombre de conversations sans conversions
400 000
300 000
30000
7000
...
Après cela, vous pouvez tracer le logarithme du nombre de chaînes converties et non converties sur leur longueur et les regarder ensemble. Par exemple, ici, nous avons construit un tel calendrier pour l'un de nos clients B2C pour une certaine période de temps:


Fig.1. La dépendance du nombre de chaînes sur la longueur de la chaîne

Chaque point du graphique définit un certain groupe d'utilisateurs qui, au cours de la période considérée, ont terminé la conversion (ligne verte) ou n'ont pas effectué la conversion (ligne bleue) en passant une chaîne d'une longueur donnée. Les deux graphiques baissent car le nombre de chaînes diminue de façon exponentielle avec sa longueur. Pour les chaînes courtes (de 2 à 7-8), le niveau de conversion (la distance entre les lignes) augmente progressivement.

Il y a des points extrêmement intéressants qui peuvent être mis en évidence en regardant ce graphique:


Fig.2. Dépendance du nombre de chaînes à leur longueur avec des régions superposées mettant en évidence différents types de comportement.

Nous avons 4 groupes d'utilisateurs distincts:

  1. Chaînes de longueur 1 et 2 (jaune). Le nombre de conversions augmente, mais cette croissance elle-même et les valeurs du taux de conversion (taux de conversion) ne correspondent pas à la tendance principale. Ce sont des utilisateurs qui ne connaissent que le produit.
  2. Chaînes de longueur de 3 à 9 (vert). La tendance principale est lorsque le nombre de conversions diminue. Les graphiques convergent, ce qui indique que le rapport des chaînes évolue dans le sens d'une augmentation de la proportion de chaînes avec conversion. C'est-à-dire le taux de conversion augmente. Cela convient aux utilisateurs qui cliquent spécifiquement sur les publicités.
  3. Chaînes de 9 à 15 (bleu). Le nombre de conversions est réduit et le niveau de conversion reste inchangé. Les graphiques vont en parallèle, ce qui indique que le niveau de conversion est inchangé. Les utilisateurs ont une idée de la façon dont l'organisation peut satisfaire leurs besoins, et la publicité supplémentaire n'augmente pas la probabilité d'un achat.
  4. Plus de 15 (rose). Moins de 10 conversions et conversions sans conversions. Trop peu de données pour dire quelque chose.

La mise en évidence de ces 4 groupes permet de comprendre les volumes de personnes susceptibles de répondre à la publicité. Il s'agit pour l'essentiel du groupe (2).

Analyse de conversion de groupe


Pour commencer, jetez tout ce qui n'est pas nécessaire. Les longueurs de plus de 15 (dans ces données) ne sont pas très informatives pour nous. Trop peu de chaînes de cette longueur ne permettent aucune conclusion. Dessinons un graphique du niveau de conversion en fonction de la longueur de la chaîne:


Fig.3. Taux de conversion vs longueur de chaîne

Ce graphique est approximativement avec l' Igmoid oh. Ces dépendances sont décrites par régression logistique . La description de la dépendance obtenue en utilisant la régression logistique permet de tirer des conclusions utiles supplémentaires, cependant, deux faits interfèrent avec une bonne approximation en utilisant la régression logistique:

  • La queue inférieure est trop basse, la régression surestimera considérablement la probabilité de conversion pour les courtes chaînes.
  • À mesure que le nombre de chaînes augmente, le graphique tend non pas à 1, comme un sigmoïde, mais à 0,5.

Ces deux problèmes sont résolus tout simplement.

Pourquoi la queue inférieure a-t-elle des probabilités aussi faibles (pour la régression logarithmique)?

Il est intuitivement évident que si une personne a cliqué sur des liens vers votre ressource au moins trois fois, cela ne s'est probablement pas produit par hasard. Et la chance d'une fois est très probable. Ainsi, la question posée est résolue de manière simple et radicale - toutes ces personnes étaient sur le site par hasard (très probablement), et elles n'avaient besoin ni de vos produits ni de vos services. Mais les voici sur votre site, et il est probable qu'ils seront convertis.

Par conséquent, nous ne considérerons tout simplement plus ce groupe. Pour approximer la régression logistique, nous ne considérerons que les groupes d'utilisateurs (2) et (3).

Comment se débarrasser du fait que la probabilité n'a pas tendance à 1, si dans les régressions logistiques elle devrait tendre à 1?

Que donnent les agences de publicité? Ils permettent au client de se familiariser pleinement avec l'entreprise, ses services et ses équipements. Si une personne a déjà tout appris sur l'entreprise, cela signifie-t-il nécessairement qu'elle achètera quelque chose? Non. Il existe très probablement des dizaines et des centaines d'alternatives au service annoncé. Une personne qui connaît déjà tout de votre service particulier connaît probablement de très près un certain nombre d'autres services. Et maintenant, il a suffisamment d'informations pour choisir avec une certaine probabilité une certaine entreprise dans laquelle il commandera quelque chose. Et cette probabilité est inférieure à 1. Augmenter le nombre de passes sur les publicités à partir d'un certain montant devient vide de sens. Par conséquent, pour que le graphique tende vers 1, il vous suffit de diviser toutes les valeurs des niveaux de conversion par la valeur de probabilité à laquelle le graphique tend à augmenter le nombre de passages sur la publicité.

Évaluation intégrale de l'efficacité de l'organisation et de sa stratégie marketing


Regardons ce qui précède de l'autre côté. Pour des chaînes suffisamment longues, le nombre d'utilisateurs supplémentaires répercutant la publicité ne joue plus de rôle. Quelque chose d'autre compte. Nous appelons cela le degré de commodité de l'entreprise en tant que telle. Elle est constante pour l'organisation.

Ensuite, la probabilité de conversion globale est divisée en le produit de deux probabilités:

Pconv(l)=Pmarketing(l)Pfirm,

Pfirm- une évaluation intégrée de l'efficacité de l'organisation, c'est-à-dire la probabilité d'acheter quelque chose dans une organisation pour laquelle vous savez déjà tout ce que vous pouvez et de choisir consciemment entre cette organisation et des alternatives (des passages supplémentaires via les canaux publicitaires n'affecteront pas la décision d'achat). Pmarketing(l)- une évaluation intégrée de l'efficacité d'une stratégie marketing, c'est-à-dire la probabilité d'acheter quelque chose dans l'organisation, à condition que seules les influences marketing, et si une personne sait tout ce qui est possible, alors elle achètera certainement dans cette organisation et n'envisagera pas d'alternative. Et, bien sûr, cette probabilité dépend de la longueur de la chaîne. l.

Si nous revenons à la figure 3, nous verrons que la zone d'influence Pmarketing(l)s'étend uniquement au groupe d'utilisateurs (2). Pour le groupe (3) - Pmarketing(l)=1, ce qui signifie que la probabilité d'achat est Pfirm. Dans notre cas, en moyenne Pfirm=0,55ce qui est extrêmement bon. Ce chiffre indique que, ayant toutes les cartes en main, une personne choisit cette organisation parmi toutes les alternatives possibles dans 55% des cas.

Eh bien, il reste à ajouter que nous avons maintenant une rationalisation pour Pmarketing(l), qui tend vers 1. Une régression logistique simple à un facteur peut désormais lui être appliquée. Nous allons le faire en approximant les données normalisées par 1 en divisant les données par sigmoïde Pfirm.


Fig.4. Dépendance de la conversion à la longueur de la chaîne avec une courbe imposée pour la régression logistique.

Sur le graphique l- longueur de chaîne, P m - Pmarketing(l). L'exposant de l'exposant est log-odds ratio = 0,53. Si une entreprise avait 100% de chances d'une «conversion consciente» ( Pfirm=1), cela signifierait à peu près qu'à chaque augmentation de la chaîne d'une unité, le rapport du nombre de chaînes avec et sans conversion changerait de [exp (0,53) = 1,699].

Cet indicateur mesure le degré d'efficacité de la stratégie marketing dans son ensemble. Plus la probabilité est atteinte rapidement Pfirm, plus la stratégie est efficace. Naturellement, vous devez vous assurer que Pfirma pris des valeurs satisfaisantes pour votre entreprise, sinon une stratégie marketing efficace obligera un client potentiel à acheter quelque chose qui ne vous appartient pas.

Estimation de la fréquence optimale de publicité sur la chaîne


Considérons la figure (3), qui montre la dépendance de la probabilité de conversion sur le nombre de canaux que l'utilisateur a actuellement parcourus. Chaque point du graphique correspond à une certaine section conditionnelle du public cible. Par exemple, les personnes qui sont passées par 10 canaux sont quelque peu différentes de celles qui n'en ont parcouru que 2, car la plupart de celles qui sont passées par deux canaux n'atteindront pas 10.

De plus, pour ceux qui sont passés par 10 canaux, les programmes de marketing ne fonctionnent probablement plus. Ils ont déjà vu toutes les publicités possibles. Pour ceux qui ne sont passés que par deux canaux, la publicité peut fonctionner. Ainsi, l'ensemble de la stratégie marketing doit être focalisé spécifiquement sur le groupe (2). Les personnes qui ont passé plus de deux chaînes, mais qui ne l'ont pas encore fait, par exemple 10.

Notre étude des données a montré que pour le groupe (2), il existe une corrélation négative significative entre le niveau de conversion et le nombre total de clics sur les annonces pendant une certaine période. C'est-à-dire plus les gens d'Asie centrale sont en principe passés par un certain canal publicitaire, moins il est probable qu'un membre du groupe (2) de ce canal soit converti.


Fig. 5. La relation entre la corrélation et les différentes longueurs de chaîne. La corrélation est le coefficient de corrélation du Pearson entre le niveau de conversion et le nombre total de clics sur les canaux publicitaires.

Cela peut être dû au fait que l'augmentation des conversions est associée à une augmentation des impressions. Les algorithmes intelligents des plates-formes publicitaires essaient de montrer la publicité de la partie la plus efficace du public cible, mais cette partie est limitée. Ainsi, avec une augmentation du nombre d'impressions, les algorithmes sont obligés de commencer à diffuser des publicités auprès de la partie la moins efficace du public cible. Cette partie de l'AC est moins susceptible de se convertir.

Nous pouvons supposer qu'il existe un choix optimal de la fréquence des impressions de la publicité sur la chaîne, qui n'affecterait que la partie la plus efficace du public cible. Le degré d'adéquation du choix de la fréquence courante peut être estimé en calculant la corrélation entre le nombre total de transitions pour la période et le niveau de conversion. Si cette corrélation est négative, vous devez réduire la fréquence des impressions. S'il est approximativement égal à 0, alors la taille est optimale. S'il est positif, la taille de l'audience peut être augmentée.

Dans notre cas, un changement de la fréquence des impressions, qui a entraîné une diminution du nombre de conversions de 25%, a entraîné une augmentation du taux de conversion moyen du groupe (2) de 3,5% à 4%.

Conclusions et limites


Principales mesures suggérées:

  1. Taille du groupe (2). Il vous permet d'estimer combien de personnes au cours de la période considérée ont activement réagi aux publicités.
  2. La probabilité de conversion d'une personne qui s'est généralement produite par hasard et n'a besoin de rien de l'organisation. Il est estimé par le taux de conversion des chaînes "en une étape". Dans le cas des données examinées ici, c'est 0,06%.
  3. Diviser la probabilité de conversion par deux longueurs de chaîne Pfirmet Pmarketingpeut être estimé:
    • Évaluation intégrale de l'efficacité organisationnelle. C'est-à-dire La probabilité d'acheter le produit, à condition qu'avec une visualisation supplémentaire de la publicité, l'opinion de la personne sur le produit et l'entreprise ne change pas du tout. Dans notre cas, c'est 55%.
    • Une évaluation intégrée de l'efficacité d'une stratégie marketing par l'indicateur de régression logistique, qui peut approximer la dépendance existante du niveau de conversion sur la longueur de la chaîne. À chaque augmentation de la chaîne d'une unité, la probabilité de conversion augmente et elle atteindrait 100% à un moment donné si Pfirm=1. L'indice de régression logistique indique la gravité de cette augmentation.
  4. La corrélation entre le niveau de conversion et le nombre total de clics de groupe (2) sur le canal publicitaire pour la période nous permet d'estimer la fréquence optimale d'impressions sur le canal.

Tout ce qui précède présente un certain nombre de limites d'interprétation. Et la principale limitation nous impose le dernier temps de réflexion. De toute évidence, des chaînes suffisamment longues peuvent encore se terminer par une conversion quelque part dans le futur (ce que nous n'avons pas encore trouvé) et un certain niveau "réel" de conversion de chaîne peut être quelque peu plus élevé. Il est raisonnable de supposer que Pfirm est quelque peu sous-estimé et cette évaluation fait partie intégrante de l’efficacité de l’organisation par le bas. Pour éviter ces difficultés, nous pouvons considérer un intervalle de temps dans lequel tous ces effets à temps fini seraient extrêmement faibles. Par exemple, une année entière.

PS Pour vous tenir au courant de l'actualité Maxilect et être le premier informé de toutes les publications, abonnez-vous à nos pages en VK , FB ou Telegram .

Source: https://habr.com/ru/post/fr439356/


All Articles