
Qu'est-ce qui empêche de combiner avec succès les mathématiques et les affaires?
Ce texte est le premier d'une série d'articles sur la façon d'intégrer correctement les outils de Big Data au profit des entreprises.
Petit spoiler: tout ira bien, si vous vous souvenez de l'entreprise elle-même.
Il y a encore 5 ans, les grandes entreprises voulaient introduire un bigdat nouveau. Mais il y avait peu de vrais expérimentateurs. Les exceptions étaient celles qui possédaient définitivement une masse de données: télécoms, banque, sociétés Internet. Et en 2018, les entreprises viennent elles-mêmes pour l'expertise du big data, et des secteurs les plus inattendus: métallurgie, assurance, aéronautique.
Où commence le modèle?
Les mégadonnées ont cessé d'être un mantra magique (maintenant la blockchain porte cette couronne). Mais jusqu'à ce qu'elle se débarrasse du mythe principal:
"Un mathématicien plus ou moins adéquat peut esquisser un modèle sur un morceau de papier, il le mettra rapidement en œuvre, et après cela, vous pourrez siroter un cocktail et regarder les ventes augmenter."
J'exagère, bien sûr, mais pas beaucoup. Je vais donner un exemple de notre pratique.
Il y a un fabricant de briques de construction. Petit, avec de l'expérience et des ventes établies. À de tels moments, les entreprises se posent souvent la question: comment pourrions-nous réduire davantage les coûts et augmenter les bénéfices?
Le candidat à l'amélioration était la logistique. Il y avait beaucoup de chaos dans les livraisons de briques, il était difficile d'estimer la demande des clients à l'avance, donc les coûts du carburant et des lubrifiants et la dépréciation des véhicules étaient énervants. Après avoir pris connaissance du big data, l'entreprise a décidé: nous allons prévoir quand la brique s'épuise sur les chantiers clients afin de l'y envoyer rapidement. Nous avons analysé les données précédentes, fait un modèle qui promettait d'intéressants pourcentages d'optimisation.
Toute la joie a rompu l'ordre habituel. Premièrement, il fallait trouver des machines pour une livraison rapide et réfléchir aux itinéraires. Deuxièmement, ces machines ne pouvaient passer dans l'entrepôt que pour un chargement dans des plages horaires strictement définies, car le calendrier d'arrivée des machines clientes avait été établi plusieurs semaines à l'avance. Il était impossible de déplacer des clients. Par conséquent, l'efficacité était des cendres.
Il s'est avéré que nous avons commencé avec le «prévoyons» habituel et avons fini par transformer le processus opérationnel.
Le problème des mégadonnées a deux paramètres: les affaires et les mathématiques. Et leur ordre est juste ça. Avant de planter un analyste pour construire un modèle, vous devez passer par trois étapes.
1. Définissez la tâche du point de vue de l'entreprise.
Disons que nous voulons lutter contre les sorties de clients. Et ils ont décidé de prédire qu'un certain groupe d'acheteurs est proche d'aller chez un concurrent. Pour eux, nous formerons toutes sortes de petits pains à conserver.
La tâche à première vue est triviale. L'analyste construit le modèle sur des données historiques - clients décédés et clients réguliers - pour en tirer des signes. Par exemple, dans le cas réel d'un opérateur mobile, la sortie d'un abonné anonyme = l'abonné a cessé d'utiliser la communication. Mais combien de temps - une semaine, un mois, un an - ne doit-il pas s'allumer pour être enregistré dans le "fuite"?
Il existe plusieurs façons de définir cette tâche. C'est possible selon un modèle d'entreprise prêt à l'emploi. Ou selon les données historiques - à quelle fréquence les abonnés qui n'ont pas utilisé la connexion reviennent-ils pendant un mois? Et si tel - jusqu'à 10%? Par exemple, l'abonné effectuait un long voyage d'affaires ou était conduit à une part limitée d'un autre opérateur.
Il est important ici: qui devrait être considéré comme un «honneur» - une décision entièrement commerciale.
Le minimum nécessaire de toute unité de Big Data est de 2 rôles. Le premier est un data scientist, sur qui les mathématiques et la construction de modèles. Le second est désigné différemment d'une équipe à l'autre - propriétaire de produit, chef de produit, analyste commercial. La conscience de cette personne est l'énoncé correct du problème. Sa mission est d'explorer les subtilités de l'entreprise du client et de sélectionner les outils dont il a besoin. De plus, plonger dans une communication active avec toutes les parties.
2. Vérifiez l'analyse de rentabilisation.
D'accord, nous déciderons du modèle. Mais combien nous coûtera l'optimisation?
Prenez le même débit. Pour garder les clients potentiels qui partent, vous pouvez appeler ou beacon avec le bon message. Ou, s'il y a une ressource, offrez un bonus. Vous pouvez indiquer au client un tarif plus intéressant économiquement en analysant ses dépenses.
Mais puisque nous pensons aux bonus, alors ce sont nos dépenses pour ces clients. Et bien, nous saurions avec certitude que ce client partirait si rien n'était fait. Mais les modèles ne sont pas idéaux dans leurs prévisions. Nous tiendrons quelqu'un droit. Et, par exemple, 20% des «déchiqueteurs» potentiels ne le seront pas. Dans ce cas, nous leur offrirons des bonus. Combien d'argent sera dépensé pour cela, est-ce autorisé dans notre cas? Vous devez regarder le volume de la clientèle, l'ampleur de la sortie et considérer les chiffres absolus.
C'est ce qu'on appelle des erreurs du premier et du deuxième type. Nous devons comprendre que les résultats de la mise en œuvre du modèle donneront plus qu’à emporter. Et cela devrait être une différence acceptable pour nous. Les exigences pour le modèle sont formées avant sa construction. Peut-être qu'ils sortiront de telle manière qu'il n'y aura pas besoin de passer du temps en tant que scientifique.
3. Planifiez comment les résultats seront utilisés.
«L'économie a convergé», nous dit l'analyse de rentabilisation. "Pouvons-nous enfin construire le modèle?"
Tôt. Nous devons réfléchir à ce qui arrivera aux résultats.
Ici nous donnera un modèle de 200 000 personnes qui peuvent se transformer en «honneurs» chaque mois. Et nous déciderons de les appeler. Avons-nous le temps de tout parcourir? Après tout, le centre de contact n'est pas en caoutchouc.
Un autre point - vous devez comprendre quel décalage nous aurons entre la prédiction de départ et le départ effectif du client. Pourquoi avons-nous besoin d'une prédiction si le client "gonfle" dans un avenir très proche? Après tout, nous n'aurons peut-être pas le temps de les contacter. Mais plus nous nous éloignons du moment où nous partons, plus la précision de la prédiction est faible. Là encore, il faut calculer l'optimum entre les avantages et les risques.
Et le troisième point - à quelle vitesse pouvons-nous mettre en œuvre des innovations dans nos processus commerciaux? Ne fonctionne pas, comme avec l'exemple d'un fabricant de briques.
En conclusion
Le chemin vers une tâche claire pour un Data Scientist est une tâche en soi.
Si nous avons vérifié les trois points, tout s'est avéré et un modèle est apparu, nous attendons la prochaine étape amusante - l'intégration. La construction de modèles et les mathématiques connexes prennent généralement environ 20% du temps. Les 80% restants (et parfois beaucoup plus, selon la flexibilité de l'entreprise) - mise en œuvre dans le productif. Jusqu'à plusieurs mois.
Un modèle n'est qu'un MVP. Tout le monde aime les construire, car tout le monde aime les résultats hypothétiques. Et ensuite, les introduire dans de véritables processus métier se bloque dans la plupart des entreprises. Après tout, la chose la plus difficile est de modifier les commandes déboguées.
Par conséquent, dans tout projet de Big Data, il doit y avoir un data scientist, sur lequel les mathématiques, un chef de produit responsable des affaires, et un chef de projet avec une équipe de projet. Ces derniers devront mettre en œuvre et bousculer le processus métier. Parfois, c'est douloureux et dur. Mais seulement dans cette configuration, travailler avec des mégadonnées peut être bénéfique.
Nous enseignons ces caractéristiques et d'autres de l'application de l'analyse de données dans les affaires à notre école de données dans des cours pour les
analystes et les
gestionnaires .
Le poste a été préparé
par la School of Data sur la base de la publication du fondateur de la School in the
Business HUB de Kyivstar PJSC