Em meados de outubro, como parte do fórum da juventude U-NOVUS em Tomsk, realizamos um workshop sobre ciência de dados.
Tomsk, em princípio, goza merecidamente da fama de uma cidade de cientistas e estudantes, afinal, 15 institutos de pesquisa, 9 universidades e várias incubadoras de empresas - isso é sério. Portanto, decidimos convidar estudantes e especialistas de várias empresas para participar.

Damos um exemplo da vida (leitura - da produção), que era uma tarefa para análises avançadas em uma empresa petroquímica.
Sobre como foi - sob o corte.
O workshop durou três dias, quanto tempo as equipes tiveram para resolver nossos problemas e mostrar que a solução criada por eles é algo que realmente ajudará a indústria, ou simplesmente levará uma série de mecânicas úteis que podem ser aplicadas na produção de química digital no futuro.
Desafio
Era necessário criar um cenário de trabalho, no âmbito do qual seria realizado o desenvolvimento e a implementação de um sistema de monitoramento proativo dos equipamentos tecnológicos que usamos na produção.
Ao mesmo tempo, era importante levar em consideração que é lógico dividir esse equipamento em vários tipos (de acordo com a criticidade); portanto, as abordagens para seu gerenciamento e monitoramento não devem ser as mesmas, e um único script não funcionaria aqui. Também era necessário levar em conta que a empresa utiliza os sistemas de visualização mais simples para dados já coletados, que também podem ser utilizados. Além disso, atribuímos vários fatores à carga - a influência da condição do equipamento na margem do produto; frequência de reparos programados; Cenários para instalar estandes adicionais nos casos em que um sistema de monitoramento básico já esteja em vigor, e assim por diante.
E imediatamente prescrevemos várias estruturas e limitações que devem ser levadas em consideração; caso contrário, você tomará uma decisão, mas não poderá aplicá-la, porque se esqueceu de alguns desses fatores. Isso ajuda, porque essa solução deve funcionar em produção ao vivo e muitas coisas diferentes podem acontecer no processo.
Entre esses fatores foram:
- Má qualidade dos dados coletados.
- A presença da equipe na criação de um sistema de monitoramento de especialistas com vários conhecimentos - programadores, tecnólogos de produção, pessoas familiarizadas com o equipamento e especialistas no campo da modelagem matemática.
- A relutância dos funcionários em usar o novo sistema (bem, de que outra forma).
- Uma completa falta de dados para resolver problemas (algum parâmetro não é considerado, não há sensor que leve informações, etc.).
- Se houver algum dado, pode haver dificuldades com ele - por exemplo, nem todos eles são digitalizados (mas você precisa trabalhar com eles), eles são armazenados em formatos diferentes, alguns não podem ser alcançados em alguns cliques e você precisa percorrer alguns círculos aprovações.
Componentes obrigatórios do sistema: um módulo que encontra anomalias no equipamento (algo está esquentando, não deveria, algo está saindo, mas deve aguentar, e comportamento semelhante) e um módulo de previsão que pode prever uma situação semelhante com base nos dados já coletados .

Na saída, eu queria obter uma descrição detalhada da solução, que permitirá, levando em conta todas essas condições, introduzir um sistema de monitoramento proativo de equipamentos. Pode incluir algoritmos de aprendizado de máquina, quaisquer soluções e estruturas prontas.
E idealmente (e é por isso que havia pessoas da empresa como parte das equipes) - para observar os processos de negócios que serão afetados pela introdução de um sistema assim; talvez você precise introduzir novos processos de negócios para garantir que a solução funcione.
Sumário
Devemos prestar homenagem às equipes - elas se mostraram excelentes. As equipes eram bastante mistas, no âmbito de uma, estudantes e programadores com analistas de dados e chefes de direção, e diretores de empresas locais podiam trabalhar imediatamente. E essa composição influenciou bastante as soluções resultantes, verificamos e notamos imediatamente que alguém tinha uma grande ênfase na parte arquitetônica, alguém colocou a interação com os usuários em primeiro plano, alguém decidiu que o principal era planejamento e conformidade com KPI. Em geral, você olha para a solução - e imediatamente imagina quem exatamente a inventou.

Os critérios de avaliação para nós eram bastante simples. O principal é a aplicabilidade prática da solução em nossas empresas. Quase todos conseguiram, das 6 soluções apresentadas, apenas 2 não eram adequadas para nós (embora, com uma amostra de 6, este seja um terço). Mas o problema era que os funcionários falharam na solução em si sem entrar em detalhes, ou a solução não era adequada para a indústria petroquímica. Infelizmente, isso também acontece - e parece que a solução em si não é ruim, resolve problemas, talvez até dimensione, mas especificamente, nós não a usamos, a pilha não é a mesma. Geralmente.
As quatro soluções restantes se mostraram perfeitamente, decidimos que os caras entendiam exatamente o que fizeram e o que farão, para que agora participem de nossos projetos.
Nikolay Ksenzik, chefe do Centro de Tecnologias Digitais em Tomsk, SIBUR IT.