Unternehmensinternes Data Science-Training und thematisches Mitap in Woronesch



Am 25. Mai findet in Woronesch das zweite Metaconf-Treffen statt, das diesmal dem maschinellen Lernen gewidmet ist. Das Mitap-Programm enthält fünf Berichte. Eine kostenlose Registrierung finden Sie hier . Insbesondere Anton Dolgikh, DataArt-Experte für KI-Projekte im Bereich des Gesundheitswesens, wird über das „Probabilistische Modell der natürlichen Sprache für neuronale Netze“ sprechen. Heute haben wir Anton gebeten, über die Erfahrungen mit der Systematisierung des Wissens über maschinelles Lernen in DataArt zu sprechen.

Der Anwendungsbereich von ML wird ständig erweitert (vom Gesundheitswesen bis zur Reisebranche). In DataArt hat die Anzahl der ML-Entwicklungsanforderungen irgendwann einen kritischen Wert überschritten. Zuvor konnten wir solche Probleme von den im Unternehmen tätigen Ingenieuren lösen.

Als es schwierig wurde, mit unseren eigenen Ressourcen umzugehen, wurden zwei Entwicklungspfade offensichtlich: neue Mitarbeiter einzustellen oder Spezialisten innerhalb des Unternehmens auszubilden. Im ersten Fall besteht das Risiko, dass der ML-Entwickler, den wir später eingestellt haben, nicht sofort in ein neues Projekt aus unserem Berufsfeld fällt. Gleichzeitig sind Menschen, die sich eng mit maschinellem Lernen beschäftigen, in der Regel nicht bereit, sich beispielsweise auf die Fullstack-Entwicklung einzulassen. Daher haben wir uns auf DataArt-Ingenieure verlassen, die an einer Entwicklung in Richtung ML interessiert sind, aber bei Bedarf zu ihrer vorherigen Arbeit zurückkehren können.

Der Vorbereitungsprozess muss systematisiert werden. Es scheint, dass das Internet mit Tonnen von Online- und Videokursen gefüllt ist. Aber um sich produktiv zu entwickeln, braucht eine Person einen Entwicklungsvektor - vom zufälligen Hören von Kursen ist er wenig nützlich.

Was haben wir getan:

  1. Zunächst bildeten sie den Kern - eine Initiativgruppe von Kollegen mit der größten Erfahrung und dem größten Fachwissen in verschiedenen Bereichen des maschinellen Lernens. Sie bereiteten eine Reihe von Präsentationen vor, gaben einen Überblick über bestehende Kurse und gaben Empfehlungen ab: Welche Kurse müssen Sie belegen, um Fähigkeiten zu erwerben, die für die von DataArt gelösten Aufgaben relevant sind.
  2. Wir haben Mathematikkurse organisiert. Offensichtlich handelt es sich bei ML inhärent um mathematische Statistiken und Optimierungsmethoden. Um maschinelle Lernmethoden zu verstehen und richtig anzuwenden, sind bestimmte mathematische Kenntnisse erforderlich. Fachleute, die eine technische Ausbildung erhalten haben, kennen sich auf den ersten Blick immer gut mit Mathematik aus. In der Praxis stellt sich jedoch heraus, dass Fähigkeiten sehr schnell vergessen werden. Dies führt zu einer Einschränkung des Kurses: Ein Unternehmen kann im Gegensatz zu einer Universität kein grundlegendes Wissen bereitstellen, aber das Wissen muss angemessen und tief genug sein. Wir haben einen Lehrer von außen eingeladen, um den Kurs zu lesen (unsere Kollegen waren zu beschäftigt). Das Programm konzentrierte sich auf Bereiche, die in direktem Zusammenhang mit maschinellem Lernen stehen: lineare Algebra, Analyse, Wahrscheinlichkeitstheorie, Optimierungsmethoden. Der Kurs wird durch regelmäßige Kurse mit Experten ergänzt, in denen wir theoretisch praktische Probleme aus Projekten mit maschinellem Lernen betrachten.
  3. Unsere ML-Spezialisten führen jeden Monat Schulungsseminare zu den neuesten Errungenschaften auf diesem Gebiet durch. Die Aufzeichnung von Seminaren steht allen Mitarbeitern des Unternehmens zur Verfügung.
  4. Zusätzlich zu den Seminaren veröffentlichen die DataArt ML-Spezialisten regelmäßig eine Zusammenfassung interessanter Materialien (Methoden, Artikel, Bücher) mit kurzen Anmerkungen und Kommentaren.

Das Unternehmen unterstützt diese Initiativen, es wird ein Budget für den Kauf von Literatur und die Teilnahme von Kollegen an Konferenzen für Eisen- und Mentoring-Programme bereitgestellt. Das Ergebnis eines individuellen Mentoring-Trainings ist ein vorgefertigter Prototyp, der bei Konferenzen oder bei Besprechungen mit potenziellen Kunden verwendet werden kann. Als Beispiel können wir das Ergebnis der Arbeit unseres Experten Andrei Sorokin anführen - ein Modell, das Hautläsionen erkennt und klassifiziert ( arxiv.org/pdf/1807.05979.pdf ). Um das resultierende Modell für die Verwendung auf Mobilgeräten zu optimieren, half der Mitarbeiter nur im Rahmen des Mentoring-Programms. Das Modell belegte im internationalen Wettbewerb ISIC 2018 den 12. Platz und schlug nicht nur einzelne Teilnehmer, sondern auch Hochschulteams.

Die obige Systematisierung des Prozesses ermöglichte es uns, alle Anfragen aus dem Bereich des maschinellen Lernens, die von potenziellen Kunden an DataArt kommen, schnell und effizient zu verarbeiten. Wir haben Marketingmaterialien vorbereitet und Verkaufsteams stehen immer Experten zur Verfügung, die Kundenfragen beantworten können. Mehrere Projekte wurden bereits erfolgreich abgeschlossen.

Wie viele große Technologieunternehmen skaliert DataArt Fachwissen und Bildungsprogramme für ein externes Publikum. Am 25. Mai veranstaltet Voronezh ein offenes Treffen zum maschinellen Lernen , bei dem die Teilnehmer Trends in Bezug auf ML-Technologien, Probleme und Aufgaben kennenlernen, die mit ihrer Hilfe gelöst werden können, sowie Projekte aus der Praxis , die Methoden des maschinellen Lernens und künstliche Intelligenz verwenden.

Source: https://habr.com/ru/post/de452996/


All Articles