Du siehst dich auf dem Straßenhund. Sie sehen immer Hunde auf der Straße. Jemand bemerkt sie überhaupt nicht und hat keine Probleme, es gibt keine dieser mentalen Qualen und im Allgemeinen können wir davon ausgehen, dass sie Normen auf der Straße haben. Aber du! Und er bemerkte, und deine Augen sind an einem feuchten Ort, man denkt: „Hund. Ja, so süß, ich würde es nehmen, aber ich kann nicht. Aber es ist direkt, aber in keiner Weise. " Und er ging so weit. Aber er machte ein Foto und streichelte es.
Hier sind solche netten Kleinen, die Sie brauchen, um die geografische Position des Tieres im Moment und ein paar Fotos in das System zu werfen.
Es gibt diejenigen, die wirklich ihren entkommenen Partner oder etwas anderes als ein kleines Hündchen finden wollen. Ich möchte einfach nur ein Haustier damit finden. Sie selbst schalten Anzeigen, gehen durch die Tore, Keller und verschiedene Standorte.
2019 ist förderlicher für technologischere Lösungen. Und genau das ist unser Projekt mit dem Arbeitstitel PetSI (PetSearchInstrument).
Konzept
Im Rahmen der
maschinellen Lernfunktion für soziales Wohl der Open Data Science-Community
erstellen wir zusammen mit
9851754 und unserem Team
einen Dienst für die Suche nach vermissten Tieren, bei dem der Eigentümer das Foto des Tieres, die Adresse des Verlusts und andere Merkmale angeben und im Gegenzug aus unserer Sicht das relevanteste erhalten kann Algorithmus zur Meldung gefundener oder gesehener Tiere.
Ein kurzer Algorithmus unseres Dienstes: Wir aggregieren Daten (Fotos, Standort, Rasse usw.) von mehreren Standorten, konvertieren Bilder durch ein neuronales Netzwerk in einen Vektor, trainieren knn und zeigen die nächsten Nachbarn des eingegebenen Fotos. Sie finden das verlorene Tier, das Tier kehrt nach Hause zurück. Jeder ist glücklich)

Zusätzlich zur Suche nach vermissten Haustieren entwickeln wir ein Empfehlungssystem, um das Hinzufügen von Schutztieren zu neuen Besitzern zu beschleunigen. Wir haben zwar keine Statistiken zum Benutzerverhalten auf der Website, verwenden jedoch inhaltsbasierte Empfehlungen, die auf visueller Ähnlichkeit basieren.

Was ist schon da
- Ein exzellentes Team von Anfängern und erfahrenen Profis;
- http://petsiai.ru - ein funktionierender Prototyp mit einer Weboberfläche zum Eingeben eines Fotos eines Tieres und Anzeigen ähnlicher Fotos (der Prototyp wird innerhalb weniger Tage nach Veröffentlichung verfügbar sein);
- Automatisierte Pipeline zur Erfassung und Verarbeitung von Informationen;
- Aktualisierte Tierdatenbank (ca. 11.000 Hunde und 6.000 Katzen).
Unter der Haube
In Python ist die Entwicklung im Gange. Wir verwenden den folgenden Technologie-Stack:
- Docker, Gitlab CI / CD für die Anwendungsbereitstellung;
- Google Kubernetes Engine zum Hosten unserer Dienste und Anwendungen;
- Scrapy, RabbitMQ zur Datenerfassung;
- Sklearn, Keras für ML;
- Django, Flask, Bootstrap für die Site;
- Elasticsearch für die Textsuche.
Um alle Phasen unseres Workflows zu synchronisieren, verwenden wir Airflow:

Mehrstufige Datenerfassung. Zuerst sammeln Spinnen Informationen und senden sie in Rohform an die Warteschlange. Auf der anderen Seite der Warteschlange konvertieren spezielle Prozessoren die Daten in das gewünschte Formular (z. B. konvertieren Sie den Text in eine Adresse) und fügen sie dem DBMS hinzu.

Die gesammelten Daten werden validiert und an Trainingsmodelle gesendet. Für die Site wurde ein spezieller Dienst geschrieben, der neue Daten und Modelle herunterlädt und außerdem eine Nachzählung der Suchergebnisse für jeden Benutzer initiiert. Der gesamte Zyklus dauert ca. 8 Stunden.
Wie wir maschinelles Lernen und Datenanalyse einsetzen:
- Geschlechtsbestimmung durch Text;
- Definition der Rasse durch Text;
- Zuweisung von Adressen aus Nachrichten;
- Bildsegmentierung;
- Übersetzung des Bildes in einen Vektor und ANN.
Sofortige Pläne
- Bestätigen Sie die Funktionsfähigkeit des Projekts und verbinden Sie das erste Paar "Master-Lost Pet".
- Entwickeln Sie die Zusammenarbeit mit Tierheimen und vereinfachen Sie das Match-up des Wirt-Haustier-Paares.
- Arbeiten Sie mit anderen Ressourcen zusammen und machen Sie den Service so benutzerfreundlich wie möglich.
Komm zu uns!

Für die weitere Entwicklung benötigen wir:
- Kämpfer der Front- und Backend-Armeen;
- ML-Spezialisten;
- Dateningenieure und Systemadministratoren zur Unterstützung der Funktionalität der Pipeline;
- DevOps für die Bereitstellung von Anwendungen auf k8s und die Unterstützung bei der Verwaltung;
- Spinnenhandwerker (kratzig);
- Journalisten, um das Projekt bekannt zu machen;
- Programmierer in Python.
Warum brauchen Sie das vielleicht:
- Soziale Verantwortung, wenn es Sie interessiert. Nutzen Sie plötzlich gerne?
- Ein echtes Projekt, in dem Sie Ihre coolen Fähigkeiten umsetzen oder pumpen können.
- Sie sind seltsam und gehen überall hin, wo Sie einladen. Dies ist auch eine gute Option;
- Sie selbst haben nach einem Haustier gesucht, Sie wissen, wie es sich anfühlt;
- Oder sind Sie derjenige, der nicht nur an den Ereignissen auf der Straße vorbeikommt, sondern nicht weiß, was er damit anfangen soll?
Es gibt einen Plan. Brauchen Sie Leute in einem Team.
Schreiben Sie persönlich oder füllen Sie das
Formular aus und machen Sie mit!
Anstelle einer Schlussfolgerung
Schließlich haben wir eine Auswahl von Meme-Hunden und ähnlichen Hunden aus Tierheimen vorbereitet, die wir mithilfe unserer Algorithmen gefunden haben