Le chien a mangé sur des réseaux de neurones

Vous vous voyez dans la rue toutou. Vous voyez toujours des chiens dans la rue. Quelqu'un ne les remarque pas du tout et n'a pas de soucis, il n'y a pas ces tourments mentaux, et en général, nous pouvons supposer qu'ils ont des normes dans la rue. Mais toi! Et il a remarqué, et vos yeux sont dans un endroit humide, on pense: «levrette. oui, si mignon, je le prendrais mais je ne peux pas. Mais c'est direct, mais en aucune façon. " Et il est allé si loin. Mais il a pris une photo, l'a caressée.


Voici de si gentils petits enfants que vous devez insérer dans le système la position géographique de l'animal en ce moment et quelques photos.

Il y a ceux qui veulent vraiment retrouver leur compagnon échappé ou autre chose un petit toutou. Je veux juste vraiment trouver un animal de compagnie avec ça. Ils placent eux-mêmes des publicités, passent par les portes, les sous-sols et divers sites.

2019 est propice à davantage de solutions technologiques. Et notre projet avec le titre de travail PetSI (PetSearchInstrument) n'est que cela.

Concept


Dans le cadre de la Machine Learning for Social Good direction de la communauté Open Data Science, nous créons , avec 9851754 et notre équipe, un service de recherche d'animaux disparus, dans lequel le propriétaire peut spécifier la photo de l'animal, l'adresse de la perte et d'autres caractéristiques, et en retour recevoir les plus pertinentes du point de vue de notre algorithme pour signaler les animaux trouvés ou vus.

Un bref algorithme de notre service: nous agrégons les données (photos, localisation, race, etc.) de plusieurs sites, convertissons les images par un réseau de neurones en un vecteur, formons-nous et montrons les voisins les plus proches de la photo saisie. Vous trouvez l'animal perdu, l'animal rentre chez lui. Tout le monde est heureux)



En plus de rechercher des animaux disparus, nous développons un système de recommandation pour accélérer l'ajout d'animaux de refuge aux nouveaux propriétaires. Bien que nous ne disposions pas de statistiques sur le comportement des utilisateurs sur le site, nous utilisons donc des recommandations basées sur le contenu basées sur la similitude visuelle.



Ce qui est déjà là


  • Une excellente équipe de débutants et de professionnels expérimentés;
  • http://petsiai.ru - un prototype fonctionnel avec une interface Web pour saisir une photo d'un animal et en afficher des similaires (le prototype sera disponible quelques jours après sa publication);
  • Pipeline automatisé pour la collecte et le traitement des informations;
  • Base de données sur les animaux mise à jour (environ 11 000 chiens et 6 000 chats).

Sous le capot


Le développement est en cours en python. Nous utilisons la pile technologique suivante:

  • Docker, Gitlab CI / CD pour le déploiement d'applications;
  • Google Kubernetes Engine pour l'hébergement de nos services et applications;
  • Scrapy, RabbitMQ pour la collecte de données;
  • Sklearn, keras pour ML;
  • Django, Flask, Bootstrap pour le site;
  • Elasticsearch pour la recherche de texte.

Pour synchroniser toutes les étapes de notre workflow, nous utilisons Airflow:

Collecte de données en plusieurs étapes. Tout d'abord, les araignées collectent des informations et les transmettent sous forme brute à la file d'attente. De l'autre côté de la file d'attente, des processeurs spéciaux convertissent les données au format souhaité (par exemple, convertissent le texte en une adresse) et l'ajoutent au SGBD.



Les données collectées sont validées et envoyées aux modèles de formation. Un service spécial a été écrit pour le site qui télécharge de nouvelles données et modèles, et lance également un recomptage des résultats de recherche pour chaque utilisateur. L'ensemble du cycle dure environ 8 heures.

Comment nous utilisons l'apprentissage automatique et l'analyse des données:

  • Détermination du sexe par texte;
  • Définition de la race par texte;
  • Attribution d'adresses à partir de messages;
  • Segmentation d'image;
  • Traduction de l'image en vecteur et ANN.

Plans immédiats


  • Confirmez l'opérabilité du projet et connectez la première paire de "maître perdu";
  • Développer la coopération avec les refuges et simplifier l'appariement du couple hôte-animal de compagnie;
  • Collaborez avec d'autres ressources et rendez le service aussi convivial que possible.

Venez chez nous!




Pour un développement ultérieur, nous avons besoin de:

  • Combattants des armées avant et arrière;
  • Spécialistes ML;
  • Ingénieurs de données et administrateurs système pour prendre en charge la fonctionnalité du pipeline;
  • DevOps pour déployer des applications sur k8 et aider à son administration;
  • Artisans araignées (tremblants);
  • Des journalistes pour vulgariser le projet;
  • Programmeurs en python.

Pourquoi pourriez-vous en avoir besoin:

  • Responsabilité sociale si elle vous intéresse. Tout à coup, aimez-vous en bénéficier?
  • Un vrai projet où vous pouvez mettre en œuvre vos compétences cool ou les pomper;
  • Vous êtes étrange et allez partout où vous invitez. C'est aussi une bonne option;
  • Vous cherchiez vous-même un animal de compagnie, vous savez ce que ça fait;
  • Ou êtes-vous celui qui ne peut pas simplement passer par les événements dans la rue, mais ne sait pas quoi en faire.

Il y a un plan. Besoin de gens en équipe.

Écrivez-nous personnellement ou remplissez le formulaire et inscrivez-vous!

Au lieu d'une conclusion


Enfin, nous avons préparé une sélection de chiens mèmes et de chiens similaires dans des abris que nous avons trouvés en utilisant nos algorithmes

Source: https://habr.com/ru/post/fr459988/


All Articles