Olá pessoal.
Depois de trabalhar em 12 startups na área de aprendizado de máquina, tirei oito conclusões úteis sobre produtos, dados e pessoas.
Todas as startups foram de diferentes áreas (fintech, biotecnologia, saúde, tecnologia de treinamento) e em diferentes estágios: tanto no estágio pré-semente quanto no estágio de aquisição por uma grande empresa. Meu papel também mudou. Eu era um consultor estratégico, o chefe do departamento de análise de dados, sobrecarregado pelos assuntos de um membro da equipe. Todas essas empresas tentaram criar um bom produto, e muitas conseguiram.
Durante o trabalho, cheguei às seguintes conclusões:
O produto é mais importante que a IA
Essas startups estão desenvolvendo produtos, não aprendendo inteligência artificial. Como matemático convencido, no começo eu estava mais interessado em aprendizado de máquina e na criação de novos métodos e algoritmos.
Logo percebi que mesmo modelos precisos de aprendizado de máquina não eram valiosos por si só. O valor da IA e do aprendizado de máquina depende diretamente do valor do produto no qual eles são usados. O objetivo de uma startup é aprender a criar produtos de aprendizado de máquina.
Com essa abordagem, às vezes acontece que o aprendizado de máquina não é a ferramenta mais eficaz. Às vezes, o assunto não está na tarefa em questão, mas no processo de solução. Mesmo em tais situações, é útil recorrer aos cientistas: eles usam uma abordagem científica baseada em dados. No entanto, não perca tempo com a IA em que você precisa corrigir o processo.
Busque sinergias entre dados e produto
Você não pode criar algo valioso adicionando previsões baseadas em um modelo de aprendizado de máquina a um produto existente. Uma IA forte não é um complemento de produto, é a base. Nesses casos, é a IA que cria valor. Tais produtos são desenvolvidos levando em consideração esse fato: neles, tanto o produto quanto os dados funcionam em sinergia.
Uma boa execução resulta em uma interação que chamo de "combinação de produto e dados". O produto realiza totalmente o potencial dos dados e, ao mesmo tempo, gera novos dados necessários para a melhoria.
Ao trabalhar com IA, não são necessários apenas engenheiros e cientistas que trabalham com esses dados. O trabalho no valor do produto é mais rápido se outros membros da equipe participarem da discussão, de gerentes de produto a gerentes. Isso requer um nível de conhecimento e envolvimento com o qual nem os engenheiros que trabalham em startups estão acostumados.
Primeiros dados, depois AI
A IA e o aprendizado de máquina precisam de muitos dados de alta qualidade. Ao criar um produto do zero, pense em coletar dados desde o primeiro dia. Antes de introduzir a tecnologia de inteligência artificial em um produto existente, esteja preparado para investir muito em engenharia de dados e alterações arquiteturais.
Primeiro, descubra o valor do produto e só então comece a trabalhar. Quanto melhor o processamento dos dados, mais informativas são as análises - isso é extremamente importante para o desenvolvimento da empresa. Então você demonstra o valor do produto e atrai investidores. Comece a pensar em inteligência de máquina quando a análise for confiável.
Invista em comunicação
Para criar um produto, você precisa de gerentes de produto qualificados e suporte de gerenciamento. A IA forte e o aprendizado profundo interessam a muitos, mas as pessoas que estão longe do setor de TI não são versadas nessas tecnologias. Para discutir o aprendizado de máquina e a IA, você precisa entender as estatísticas: a comunicação ineficiente leva a expectativas irreais.
O gerente de produto e os engenheiros de dados devem discutir constantemente as métricas de negócios e como elas são transformadas em um produto. Isso é especialmente importante para os engenheiros: para um trabalho eficaz, eles precisam aprofundar o conhecimento em seu campo e na esfera comercial.
"Soluções simples e óbvias" não são tão óbvias
Como mencionei acima, muitas vezes a tarefa é mais fácil de resolver usando métodos simples e óbvios. Isso ocorre em parte porque as decisões “simples e óbvias” de hoje eram complexas e originais ontem. Usar o
word2vec agora
é tão fácil quanto a
regressão . Mais novas ferramentas estão surgindo todos os dias, e o entendimento dessas ferramentas é importante para um analista de dados.
O advento de novas ferramentas de código aberto levou ao fato de que agora as plataformas proprietárias de aprendizado de máquina não são uma solução eficaz. Obviamente, você deve usar algoritmos proprietários se eles forem eficazes em seu setor e resolverem seu problema. Mas vamos deixar os estudos detalhados dos funcionários do Google - concentre-se nas tarefas de negócios.
Em caso de dúvida, mostre os dados aos usuários
Em um estágio inicial, é importante estabelecer feedback com o mercado. No entanto, o aprendizado de máquina requer dados que levam muito tempo para serem coletados. Este é o problema: como analisar a imagem sem grandes quantidades de dados?
Mais frequentemente, a melhor solução é mostrar os dados acumulados para os usuários. Não importa que você tenha poucos dados: as pessoas processam apenas pequenas quantidades de dados por vez. Veja como os usuários interagem com os dados: o que eles ignoram e o que eles querem entender com mais detalhes? Dessa forma, você entenderá o potencial de seus dados comerciais.
Criar confiança
A confiança é a base do sucesso da maioria das tecnologias: as pessoas querem confiar nas tecnologias que usam. Algumas pessoas temem que a automação os roube de seu trabalho, enquanto outras confiam na tecnologia para tomar decisões importantes. Nos dois casos, é importante confiar em aplicativos e algoritmos de aprendizado de máquina.
Se a inteligência artificial não ajudar uma pessoa a tomar decisões, mas decidir, os usuários perdem rapidamente a confiança no aplicativo.
A confiança é fácil de perder e extremamente difícil de recuperar. Crie produtos em que as pessoas confiem.
Compartilhe o artigo com os colegas, tire conclusões e trabalhe produtivamente. Se você tem algo para compartilhar, escreva nos comentários. Mais informações sobre aprendizado de máquina no
canal de telegrama Neuron (@neurondata).
Todo conhecimento!