
Em 25 de maio, a
segunda reunião da Metaconf será realizada em Voronezh, desta vez dedicada ao aprendizado de máquina. Existem cinco relatórios no programa mitap, o registro gratuito está disponível
aqui . Em particular, Anton Dolgikh, especialista em DataArt em projetos de IA no campo da saúde, falará sobre o "Modelo Probabilístico de Rede Neural da Linguagem Natural". Hoje, pedimos a Anton para falar sobre a experiência de sistematizar o conhecimento de aprendizado de máquina no DataArt.
O escopo do ML está em constante expansão (da área de saúde à indústria de viagens). Dentro do DataArt, em algum momento, o número de solicitações de desenvolvimento de ML excedeu um valor crítico. Antes disso, conseguimos resolver esses problemas pelos engenheiros que trabalhavam na empresa.
Quando ficou difícil gerenciar com nossos próprios recursos, dois caminhos de desenvolvimento se tornaram aparentes: contratar novos funcionários ou treinar especialistas dentro da empresa. No primeiro caso, corremos o risco de que o desenvolvedor de ML que contratamos posteriormente não caia imediatamente em um novo projeto de nosso campo profissional. Ao mesmo tempo, as pessoas que estão estreitamente envolvidas no aprendizado de máquina geralmente não estão prontas para se envolver, por exemplo, no desenvolvimento de pilha completa. Portanto, contamos com engenheiros da DataArt que estão interessados em desenvolver o ML, mas que podem retornar ao trabalho anterior, se necessário.
O processo de preparação precisa ser sistematizado. Pode parecer que a Internet esteja cheia de toneladas de cursos on-line e de vídeo. Mas, para se desenvolver produtivamente, uma pessoa precisa de um vetor de desenvolvimento - de ouvir aleatoriamente todos os cursos, é de pouca utilidade.
O que fizemos:- Antes de tudo, eles formaram o núcleo - um grupo de iniciativas de colegas com mais experiência e conhecimento em várias áreas do aprendizado de máquina. Eles prepararam uma série de apresentações, fizeram uma visão geral dos cursos existentes e fizeram recomendações: quais cursos você precisa fazer para adquirir habilidades relevantes para as tarefas que o DataArt resolve.
- Organizamos cursos de matemática. Obviamente, ML é inerentemente estatística matemática e métodos de otimização. Para entender e usar corretamente os métodos de aprendizado de máquina, é necessário um certo conhecimento matemático. À primeira vista, os especialistas que receberam educação técnica sempre conhecem bem a matemática. Mas, na prática, verifica-se que as habilidades são esquecidas muito rapidamente. Isso impõe uma restrição ao curso: uma empresa, ao contrário de uma universidade, não pode fornecer conhecimentos fundamentais, mas o conhecimento deve ser adequado e profundo o suficiente. Convidamos um professor de fora para ler o curso (nossos colegas estavam muito ocupados). O programa foi focado em áreas diretamente relacionadas ao aprendizado de máquina: álgebra linear, análise, teoria das probabilidades, métodos de otimização. O curso é complementado por aulas regulares com especialistas, onde, com base na teoria, consideramos problemas práticos de projetos com aprendizado de máquina.
- Todo mês, nossos especialistas em ML realizam seminários educacionais sobre as mais recentes realizações neste campo. A gravação de seminários está disponível para todos os funcionários da empresa.
- Além dos seminários, os especialistas em DataArt ML publicam regularmente um resumo de materiais interessantes (métodos, artigos, livros) com breves anotações e comentários.
A empresa apóia essas iniciativas, um orçamento é alocado para a compra de literatura e a participação de colegas em conferências, para programas de ferro e orientação. O resultado do treinamento individual de mentoria é um protótipo pronto que pode ser usado em conferências ou reuniões com clientes em potencial. Como exemplo, podemos citar o resultado do trabalho de nosso especialista Andrei Sorokin - um modelo que detecta e classifica lesões de pele (
arxiv.org/pdf/1807.05979.pdf ). Para otimizar o modelo resultante para uso em dispositivos móveis, o funcionário acabou de ajudar na estrutura do programa de tutoria. O modelo ficou em 12º lugar na competição internacional
ISIC 2018 , vencendo não apenas participantes individuais, mas também equipes universitárias.
A sistematização acima do processo nos permitiu processar rápida e habilmente todas as solicitações do campo de aprendizado de máquina que chegam ao DataArt de clientes em potencial. Preparamos materiais de marketing e as equipes de vendas estão sempre disponíveis, especialistas em responder às perguntas dos clientes. Vários projetos já foram concluídos com sucesso.
Como muitas grandes empresas de tecnologia, o DataArt dimensiona conhecimentos e programas educacionais para um público externo. Em 25 de maio, Voronezh promove um
encontro aberto de
Machine Learning , cujos participantes aprendem sobre tendências em tecnologias de ML, problemas e tarefas que podem ser resolvidas com a ajuda deles, sobre projetos da vida real que usam métodos de aprendizado de máquina e inteligência artificial.