Olá novamente! Hoje, continuamos uma série de publicações dedicadas ao lançamento do curso
Big Data for Managers . Então, vamos começar.
"A IA está próxima." É isso que ouvimos desde 2017 e, provavelmente, continuaremos a ouvir mais. Para empresas estabelecidas que não são o Google ou o Facebook, surge a pergunta natural: o que temos que nos permitirá sobreviver a essa transição?
Em nossa experiência, a resposta são "dados". A imprensa comercial também adere a esse ponto de vista. Centenas de artigos foram escritos alegando que
"os dados são novos petróleo", significando que é o combustível que impulsionará a economia da IA.

Nesse caso, você pode assumir que sua empresa tem sorte. Você coletou todos esses dados e, quando a IA finalmente apareceu, descobriu-se que você estava sentado em reservas de petróleo. Mas se você é realmente tão sortudo, talvez você deva se perguntar: "Nós somos realmente tão sortudos?"
Na analogia "dados são petróleo", há alguma verdade. Como combustível para um motor de combustão interna, são necessários dados para que a IA funcione. A IA pega dados brutos e os transforma em algo útil para a tomada de decisões. Quer saber o tempo para amanhã? Vamos usar os dados meteorológicos do período anterior. Quer saber as vendas de iogurte na próxima semana? Vamos usar dados de vendas passadas de iogurte. AI é uma máquina de previsão orientada a dados.
Mas a IA precisa dos
seus dados? Hoje é geralmente aceito que todos os dados podem ser úteis para a IA, mas, na verdade, não é assim. Sim, são necessários dados para a operação diária da sua máquina de previsão. Mas provavelmente estes não são os dados que você possui agora. Em vez disso, sua empresa está acumulando dados que serão usados para
construir uma máquina de previsão e não para sua operação.
Agora você tem dados de treinamento. Eles podem ser usados como material para aprender o algoritmo. E esse algoritmo já é usado para gerar previsões de ações.
Ou seja, sim, isso significa que seus dados são valiosos. Mas isso não significa que sua empresa sobreviverá à tempestade. Depois que os dados são usados para treinar a máquina de previsão, eles se depreciam e se tornam inúteis para esse tipo de previsão. Continuando a analogia com o óleo, os dados podem queimar. Eles são perdidos após o uso. Os cientistas estão cientes disso. Eles passam anos coletando dados, mas assim que produzem resultados, começam a coletar poeira em uma prateleira ou em uma unidade flash esquecida. Seu negócio pode estar em um poço de petróleo, mas suas reservas são limitadas. Isso não garante nada mais na economia da IA do que apenas um valor de revenda mais lucrativo.
Independentemente da importância dos seus dados, a capacidade de se beneficiar pode ser limitada. Quantas fontes de dados comparativos existem? Se você é um dos muitos fornecedores de iogurte, seus bancos de dados que contêm informações sobre a venda de iogurte nos últimos 10 anos e dados relacionados (preço, temperatura, vendas de produtos relacionados, por exemplo, sorvete) terão menos valor de mercado do que se você seria o único proprietário desses dados. Em outras palavras, como no petróleo, quanto mais fornecedores tiverem dados semelhantes aos seus, menor será o valor dos dados de treinamento. O valor dos seus dados de treinamento é ainda mais influenciado pelo valor obtido através do aumento da precisão das previsões. Seus dados de treinamento serão mais valiosos se a precisão aprimorada da previsão aumentar as vendas de iogurte em US $ 100 milhões, e não apenas 10.
Além disso, o valor atual dos dados geralmente depende das ações tomadas nos negócios cotidianos - novos dados recebidos todos os dias que permitem que você use sua máquina para fazer previsões após o treinamento. Também ajuda a melhorá-lo através do treinamento. 10 anos de dados de vendas de iogurte são úteis para treinar um modelo de IA para prever vendas futuras de iogurte, mas previsões reais usadas para gerenciar a cadeia de suprimentos exigem dados contínuos de forma contínua. E este é um ponto importante para as empresas de hoje.
Uma startup de IA que adquire dados de vendas de iogurte do passado pode treinar o modelo de IA para prever vendas futuras. Ele não poderá usar o modelo para tomada de decisão, a menos que receba dados operacionais atuais para treinamento. Diferentemente das startups, as grandes empresas geram dados operacionais todos os dias. Isso é valioso. Quanto mais operações, mais dados. Além disso, o proprietário da operação pode realmente usar a previsão para melhorar ainda mais as operações futuras.
Na economia da IA, o valor dos dados acumulados é limitado ao benefício único de aprender o modelo de IA. E o valor dos dados de treinamento, como o petróleo, depende da quantidade total - quanto mais as pessoas as possuem, menos valiosas elas se tornam. Por outro lado, o valor dos dados operacionais atuais não se limita a um ganho único, mas fornece um benefício permanente na operação e subsequente aprimoramento da máquina preditiva. Portanto, apesar de toda a conversa de que os dados são novos, seus dados acumulados antigos não são a principal coisa. No entanto, eles podem levar à principal coisa. Seu valor para seus clientes em potencial é baixo, mas se você puder encontrar maneiras de gerar um novo fluxo de dados constante que ofereça uma vantagem funcional em termos da capacidade preditiva de sua IA, isso proporcionará uma vantagem estável quando aparecer.
Faça perguntas, escreva seus comentários e não esqueça que amanhã, 10 de abril, será um
dia aberto , que será realizado por
Denis Afanasyev , CEO da CleverDATA.