Os engenheiros da Hitachi produziram milhares de gravações de áudio que descrevem a operação de equipamentos industriais em condições de combate. Com a ajuda dessa biblioteca, os algoritmos da máquina podem detectar operações anormais dos sistemas e prever possíveis falhas.
Contamos o que foi inserido no conjunto de dados e quem ainda está trabalhando em projetos semelhantes.
Foto abi ismail / UnsplashPor que isso é necessário?
Os médicos usam estetoscópios para diagnosticar certas doenças. Mas a precisão com que a patologia pode ser detectada dessa maneira
é de 20 a 40%. Portanto, hoje os estetoscópios eletrônicos com sistemas de inteligência artificial vêm em socorro. Por exemplo, esse dispositivo é
fabricado por especialistas do Northwest Memorial Hospital de Chicago. Os algoritmos inteligentes ajudam a aumentar a precisão do diagnóstico em até 97%.
Uma abordagem semelhante está ganhando força no campo da produção - os modelos de aprendizado de máquina revelam avarias nas máquinas industriais: ruídos não naturais na operação de transmissões, bombas, ventiladores ou válvulas. Para melhorar a precisão e a qualidade do aprendizado de máquina, a Hitachi preparou e disponibilizou publicamente um conjunto de gravações de áudio de máquinas industriais. O trabalho foi realizado em condições reais de fábrica.
Segundo os autores, este é o
primeiro conjunto de dados desse tipo no mundo . É chamado de Conjunto de dados MIMII - Conjunto de dados de som para investigação e inspeção de máquinas industriais com mau funcionamento.
O que há dentro
A seleção contém os sons de válvulas, bombas, ventiladores e guias de trilhos. Todos eles são de diferentes fabricantes. O arquivo contém mais de 26 mil amostras de dez segundos com o som de máquinas operando em condições normais. Além disso, existem 6 mil arquivos de áudio com gravações do trabalho de dispositivos e máquinas defeituosos que estão em um "estado imperfeito".
Entre essas condições: danos às guias e falta de lubrificação, desequilíbrio durante a rotação das pás e seu encravamento, vazamento de óleo e picos de energia.
Foto Sergei Akulich / UnsplashA duração das amostras de áudio é de 10 segundos, todas elas são gravadas no formato WAV com uma frequência de amostragem de 16 kHz. A gravação foi realizada de uma só vez em várias fábricas de produção. Oito microfones foram usados, montados em uma matriz circular e instalados a uma distância de 10 a 50 cm das máquinas-ferramentas e equipamentos (o diagrama pode ser encontrado
no whitepaper na página 3 ).
O kit é licenciado sob o CC BY-SA 4.0 . Os arquivos estão no site Zenodo, mas seu peso total excede 150 GB . Você pode ouvir várias gravações de áudio aqui .
Planos de autor
Para cada modelo de uma máquina industrial - uma vez que todas têm características acústicas próprias - os engenheiros desenvolveram detectores de anomalia. Os lançamentos de teste mostraram que os sistemas inteligentes treinados detectam melhor os defeitos dos ventiladores e das guias do trilho. Mas os detectores tiveram dificuldade em analisar o funcionamento das válvulas.
Os engenheiros explicaram isso pelo fato de o som de abertura e fechamento da válvula ser curto e raramente ocorrer. Assim, é mais difícil identificar defeitos do que no caso de sons estáticos e contínuos de outros mecanismos. Com o desenvolvimento de algoritmos eficazes para detectar anomalias na operação de válvulas, os especialistas da Hitachi irão lidar no futuro.
Projetos similares
Na primeira subseção, observamos que os sistemas de inteligência artificial penetram no setor de saúde. Portanto, um grande número de conjuntos de dados para treinamento de algoritmos que diagnosticam doenças de órgãos internos também aparecem nessa área. Por exemplo, um engenheiro da Universidade de Stanford publicou
publicamente uma classificação de anormalidades dos batimentos cardíacos.
É usado para desenvolver estetoscópios inteligentes - o conjunto de dados foi
baixado mais de 7 mil vezes por especialistas da Índia, EUA, Canadá, França, Alemanha e outros países.
Foto Marcelo Leal / UnsplashOutro exemplo é do mundo dos carros. A empresa israelense 3dsignals está
desenvolvendo um sistema de diagnóstico inteligente. Graças a isso, os proprietários de carros poderão receber informações oportunas sobre problemas de funcionamento. Os autores afirmam que o sistema é capaz de prever o intervalo de tempo durante o qual ocorrerá um colapso.
A precisão desses diagnósticos, de acordo com os resultados do teste,
é de 98%. Infelizmente, o conjunto de dados no qual a rede neural foi treinada não é divulgado nos 3dsignals. A solução da empresa também é adequada para monitorar grandes instalações industriais. Por exemplo, ele já está sendo
usado na Enel Green Power Corporation para avaliar a condição das turbinas de energia.
Leitura adicional do nosso blog:
Bitchy Betty: Por que as interfaces de áudio falam em uma voz feminina
"Machine Sound": sintetizadores baseados em redes neurais
Bibliotecas com uma variedade de sons da natureza
Sons para a interface do usuário: uma compilação de recursos temáticos
Onde obter amostras de áudio para projetos: uma seleção de nove recursos temáticos
Música para seus projetos: 12 recursos temáticos com faixas do Creative Commons
Como visualizar o som na web: uma seleção de materiais temáticos e palestras em vídeo