Observations sur l'application du ML en affaires sur les actions ŽijemeIT

Il y a quelques semaines, j'ai assisté à une action pour les étudiants de l'Université technique de Brno (République tchèque) appelée ŽijemeIT. Il s'agit d'une mini-conférence annuelle pour les étudiants, au cours de laquelle un certain nombre de grandes entreprises informatiques bien connues à Brno présentent des présentations générales sur leurs activités, leurs orientations intéressantes et leurs projets. Cette année, les entreprises ont eu tendance à utiliser l'apprentissage automatique et l'intelligence artificielle pour résoudre divers problèmes commerciaux. Dans cette brève revue, je voudrais partager quelques observations intéressantes sur ce sujet. Peu importe, je demande une coupe

L'action se déroule sous forme de présentations d'entreprises et de stands d'information avec des supports publicitaires. Lors de la présentation, vous pouvez avoir une idée générale des activités de l'entreprise, et pendant la pause, vous pouvez poser des questions d'intérêt aux journalistes ou discuter avec les représentants de l'entreprise sur les stands et en savoir plus sur les projets et les postes vacants. Le but de l'action est de présenter aux étudiants des employeurs potentiels et éventuellement de trouver un futur emploi.

image

Où l'apprentissage automatique a trouvé son application


Cette année, de nombreuses présentations ont été consacrées à des sujets d'apprentissage automatique et d'intelligence artificielle. Ces technologies sont utilisées dans divers domaines et domaines de l'informatique.

Par exemple, la société américaine Mavenir analyse la sécurité des réseaux des opérateurs mobiles et identifie les transactions frauduleuses (ce que l'on appelle l'audit de vulnérabilité des réseaux). Pour analyser les spams et identifier les attaques frauduleuses, Mavenir utilise des méthodes classiques d'apprentissage automatique.

Au début, les spécialistes de l'entreprise collectent des données auprès des opérateurs mobiles, en particulier des données sur les appels téléphoniques et les SMS (durée de l'appel, numéro de l'appelant, numéro de l'expéditeur du message, texte du message). Ensuite, des graphiques statistiques sont construits sur leur base et diverses méthodes analytiques sont appliquées: graphiques sociaux, analyse sémantique. L'objectif est d'identifier toute activité suspecte sur le réseau. L'analyse des données statistiques vous permet de construire un classificateur de texte des messages. En fin de compte, sur la base de la recherche, les experts Mavenir fournissent à un fournisseur de services mobiles un rapport détaillé et des prévisions du potentiel de toute activité frauduleuse dans son réseau mobile.

Ici, il y a le problème de recevoir des données sur les appels et les messages dans différents pays. Pour analyser les vulnérabilités du réseau, de vraies données d'opérateur sont nécessaires. Différents régulateurs du contrôle des données personnelles opèrent dans différents pays: le RGPD opère en Europe et les États ont leurs propres lois.

En termes de technologie, Keras et scikit-learn sont utilisés. En ce qui concerne Python, il existe une limitation au multithreading - la limitation bien connue de Global Interpret Locker (GIL), qui est une limitation critique lors du traitement de grandes quantités de données. Auparavant utilisé C ++ XGBoost. Il vous permet d'obtenir un très petit retard (moins de 0,1 ms).

image

Un autre exemple est Y Soft. La société développe des interfaces utilisateur pour les imprimantes. L'une des tâches importantes ici est de tester le programme terminé. Les tests manuels prennent beaucoup de temps, prennent beaucoup de temps et n'excluent pas la possibilité d'erreur. Par conséquent, la société a automatisé le test manuel de l'interface utilisateur du programme en utilisant la vision par ordinateur et un bras robotique (le projet RQA peut être lu ici et ici ).

image

Le bras robotisé est autorisé dans le terminal à l'aide des informations d'identification, va à l'écran cible, sélectionne la tâche souhaitée (numérisation, impression), vérifie le succès et va finalement à l'écran principal.

image

Le robot est surveillé par une caméra qui enregistre ses actions sur vidéo. Ici, les tâches de détection d'écran et de reconnaissance d'éléments dans l'application sont résolues. Les méthodes classiques de vision par ordinateur ont été utilisées à l'origine: descripteurs de fonctionnalités, OCR. L'un des problèmes était ce que l'on appelle l'effet Moiré - l'apparition d'une série de bandes horizontales sur l'écran du moniteur, qui se produit souvent lorsque l'on regarde l'écran du moniteur à travers la caméra. À la suite d'expériences, des problèmes ont été résolus en utilisant un nouveau classificateur d'images basé sur des histogrammes de bords déformés cumulatifs locaux. Dans ce cas, l'utilisation de l'IA peut augmenter considérablement la vitesse de l'opération (environ une seconde contre 20 secondes avec les méthodes de traitement d'image traditionnelles).

image

En termes de technologie, ils ont d'abord utilisé CNTK (wrapper over C ++) et Accord. CNTK a une API complexe, et Accord n'est plus pris en charge et a une faible simultanéité. En fin de compte, la bibliothèque ML .NET est utilisée conjointement avec les technologies .NET (ASP .NET).

Lorsque l'apprentissage automatique n'est pas encore applicable


Dans certains cas, les méthodes traditionnelles pour résoudre les problèmes sans utiliser l'apprentissage automatique restent la meilleure option. Par exemple, Thermo Fisher Scientific développe un programme d'imagerie pour un microscope électronique avec prétraitement d'image. Pour le traitement d'image, des méthodes traditionnelles de vision par ordinateur sont utilisées.

image

Cela est dû à plusieurs facteurs. Premièrement, les méthodes d'apprentissage automatique ne peuvent pas donner une précision de 100%, même une erreur insignifiante se produit toujours. Dans ce cas, lorsque le client est une organisation scientifique (par exemple, des laboratoires de recherche impliqués dans la production de micropuces), la précision critique pour le client est le facteur d'acceptation. Deuxièmement, afin d'atteindre une efficacité de prédiction maximale, les mêmes modèles d'apprentissage d'éponge nécessitent une énorme quantité de données pour la formation, de préférence autant que possible à celles sur lesquelles leur précision sera évaluée. Dans le cas de Thermo Fisher Scientific, le client n'est pas prêt à fournir ses données pour les tests de performance.

image

Enfin, le résultat obtenu par l'inférence d'un réseau neuronal est difficile à expliquer (le phénomène connu des réseaux neuronaux comme la «boîte noire»). C'est le cas lorsque la précision et la compréhension extrêmes du processus décisionnel ont une priorité plus élevée que la mise en œuvre de la tâche et la vitesse d'exécution.

C'est tout pour l'instant. Bonne chance Ă  tous et Ă  bientĂ´t!

Source: https://habr.com/ru/post/fr475028/


All Articles