
O que impede com sucesso combinar matemática e negócios?
Este texto é o primeiro de uma série de artigos sobre como integrar corretamente as ferramentas de big data para benefício dos negócios.
Pouco spoiler: tudo vai dar certo, se você se lembrar do negócio em si.
Até cinco anos atrás, as grandes empresas queriam introduzir um bigdat novo e fanfarrão. Mas havia poucos experimentadores reais. As exceções foram aquelas que definitivamente possuíam uma massa de dados: telecomunicações, bancos, empresas de Internet. E em 2018, as empresas buscam especialização em big data e nos setores mais inesperados: metalurgia, seguros, indústria aeronáutica.
Onde o modelo começa?
O big data deixou de ser um mantra mágico (agora o blockchain usa essa coroa). Mas até que ela se livrou do mito principal:
"Um matemático mais ou menos adequado pode esboçar um modelo em um pedaço de papel, implementá-lo rapidamente e, depois disso, você pode saborear um coquetel e observar o aumento das vendas".
Exagerei, é claro, mas não muito. Vou dar um exemplo da nossa prática.
Existe um fabricante de tijolos de construção. Pequeno, com experiência e vendas estabelecidas. Nesses momentos, as empresas costumam se perguntar: como reduziríamos ainda mais os custos e aumentaríamos os lucros?
O candidato à melhoria foi a logística. Havia muito caos nas entregas de tijolos, era difícil estimar a demanda dos clientes com antecedência, portanto os custos de combustível e lubrificantes e a depreciação dos veículos eram irritantes. Tendo aprendido sobre big data, a empresa decidiu: preveremos quando o tijolo acabar nos canteiros de clientes, para enviá-lo rapidamente para lá. Analisamos os dados anteriores, fizemos um modelo que prometia porcentagens interessantes de otimização.
Toda a alegria quebrou a ordem usual. Em primeiro lugar, era necessário encontrar máquinas para pronta entrega e pensar nas rotas. Em segundo lugar, essas máquinas só podiam entrar no armazém para carregar em intervalos de tempo estritamente definidos, porque o cronograma de chegada das máquinas clientes era estabelecido com várias semanas de antecedência. Era impossível mover clientes. Portanto, a eficiência era cinzas.
Descobrimos que começamos com o habitual "vamos prever" e acabamos transformando o processo de negócios.
O problema do big data tem duas configurações: negócios e matemática. E a ordem deles é exatamente isso. Antes de plantar um analista para construir um modelo, você precisa passar por três estágios.
1. Defina a tarefa do ponto de vista dos negócios.
Digamos que queremos combater a saída de clientes. E eles decidiram prever que um determinado grupo de compradores está perto de procurar um concorrente. Para eles, formaremos todo tipo de pão para guardar.
A tarefa à primeira vista é trivial. O analista constrói o modelo com dados históricos - clientes que partiram e clientes regulares - para obter sinais de ambos. Por exemplo, no caso real de uma operadora móvel, a saída de um assinante anônimo = o assinante deixou de usar a comunicação. Mas quanto tempo - uma semana, um mês, um ano - não deveria ser ligado para ser gravado no "vazado"?
Existem várias maneiras de definir esta tarefa. É possível de acordo com um modelo de negócios pronto. Ou de acordo com dados históricos - com que frequência os assinantes que não usaram a conexão retornam por um mês? E se tal - até 10%? Por exemplo, o assinante estava em uma longa viagem de negócios ou foi levado a uma participação limitada de outra operadora.
É importante aqui: quem deve ser considerado como "honras" - uma decisão completamente de negócios.
O mínimo necessário de qualquer unidade de big data é de 2 funções. O primeiro é um cientista de dados, sobre quem a matemática e a construção de modelos. O segundo é referido diferentemente de equipe para equipe - proprietário do produto, gerente de produto, analista de negócios. A consciência dessa pessoa é a afirmação correta do problema. Sua missão é investigar os meandros dos negócios do cliente e selecionar as ferramentas de que ele precisa. Além disso, aprofundar a comunicação ativa com todas as partes.
2. Verifique o caso de negócios.
Ok, vamos decidir sobre o modelo. Mas quanto a otimização nos custará?
Tome a mesma saída. Para manter os clientes em potencial saindo, você pode ligar ou sinalizar com a mensagem certa. Ou, se houver um recurso, ofereça um bônus. Você pode informar ao cliente uma tarifa economicamente mais interessante analisando suas despesas.
Mas, como estamos pensando em bônus, esse é o nosso gasto com esses clientes. E bem, teríamos certeza de que esse cliente sairia se nada fosse feito. Mas os modelos não são ideais em suas previsões. Vamos segurar alguém certo. E, por exemplo, 20% dos potenciais “trituradores” de fato não serão assim. Nesse caso, ofereceremos bônus a eles. Quanto dinheiro será gasto com isso, é permitido no nosso caso? Você precisa examinar o volume da base de clientes, a escala da vazão e considerar os números absolutos.
Isso é chamado de erros do primeiro e do segundo tipo. Devemos entender que os resultados da implementação do modelo vão dar mais do que tirar. E isso deve ser uma diferença aceitável para nós. Os requisitos para o modelo são formados antes de sua construção. Talvez eles saiam de tal maneira que não seja necessário gastar tempo como cientista.
3. Planeje como os resultados serão usados.
"A economia convergiu", diz o caso comercial. "Podemos finalmente construir o modelo?"
Mais cedo. Precisamos pensar no que acontecerá com os resultados.
Aqui nos dará um modelo de 200.000 pessoas que podem se transformar em “honras” todos os meses. E nós vamos decidir ligar para eles. Temos tempo para passar por tudo? Afinal, o contact center não é de borracha.
Outro ponto - você precisa entender que intervalo de tempo teremos entre a previsão de saída e a saída real do cliente. Por que precisamos de uma previsão se o cliente "incha" em um futuro muito próximo? Afinal, talvez não tenhamos tempo para contatá-los. Mas quanto mais afastados do momento em que partimos, damos a resposta, menor a precisão da previsão. Aqui, novamente, você deve calcular o melhor entre os prós e os riscos.
E o terceiro ponto - com que rapidez podemos implementar inovações em nossos processos de negócios? Para não funcionar, como no exemplo de um fabricante de tijolos.
Em conclusão
O caminho para uma tarefa clara para um cientista de dados é uma tarefa em si.
Se checamos todos os três pontos, tudo acabou e um modelo apareceu, estamos aguardando a próxima etapa divertida - a integração. A construção de modelos e a matemática relacionada geralmente levam cerca de 20% do tempo. Os 80% restantes (e às vezes muito mais, dependendo da flexibilidade da empresa) - implementação no produtivo. Até vários meses.
Um modelo é apenas um MVP. Todo mundo gosta de construí-los, porque todo mundo gosta de resultados hipotéticos. E depois introduzi-los em processos de negócios reais, na maioria das empresas. Afinal, a coisa mais difícil é alterar as ordens depuradas.
Portanto, em qualquer projeto de big data, deve haver um cientista de dados, no qual matemática, gerente de produto responsável pelos negócios e gerente de projeto com uma equipe de projeto. O último terá que implementar e agitar o processo de negócios. Às vezes é doloroso e difícil. Mas somente nessa configuração, trabalhar com big data pode ser benéfico.
Ensinamos esses e outros recursos da aplicação da análise de dados nos negócios da nossa Escola de Dados em cursos para
analistas e
gerentes .
O post foi preparado
pela Escola de Dados com base na publicação do fundador da Escola no
Business HUB da Kyivstar PJSC