So implementieren Sie Technologie für maschinelles Lernen in Ihrem Unternehmen

Laut Gartner ist das maschinelle Lernen auf dem Höhepunkt. Unser DATA4-Team befasst sich mit der Entwicklung und Implementierung von Lösungen im Bereich Datenanalyse und maschinelles Lernen und hat Erfahrungen in wichtigen Phasen und Fallstricken gesammelt, die ich in diesem Artikel erläutern werde.



Betrachten Sie die Phasen der Implementierung:


1. Erklärung des Problems


Jede Technologie muss bestimmte geschäftliche Probleme lösen. Ein separater Artikel wird benötigt, um alle Anwendungen des maschinellen Lernens zu beschreiben, es können jedoch mehrere Hauptbereiche unterschieden werden. Dies sind Vorhersageanalysen (Bewertung, Abfluss, Ermittlung des besten Angebots, verwandte Produkte usw.), Textanalysen (Überprüfungen im Internet, Moderation von Inhalten, Referenzthemen usw.), Sprachanalysen und Videoanalysen.

Für eine erfolgreiche Implementierung muss ermittelt werden, welches KPI-Geschäft wir verbessern, wie und anhand welcher Metrik wir das Ergebnis messen.

2. Erfassung, Speicherung und Vorverarbeitung von Daten


Wenn die Aufgabe festgelegt ist, muss ein Schulungsbeispiel erstellt werden (leider werden die meisten Geschäftsaufgaben durch "Lernen mit einem Lehrer" gelöst). Nach unserer Erfahrung ist die Probenahme der längste Schritt. Um dies zu reduzieren, muss das Unternehmen eine Kultur des Umgangs mit Daten haben.

Neben der Datenerfassung müssen diese gelöscht und die Merkmale ermittelt werden, die sich auf das Endergebnis auswirken.

3. Algorithmus-Training


Die Entwicklung des algorithmischen Teils ist die interessanteste, aber auch die schnellste Stufe. Normalerweise dauert es mehrere Stunden bis mehrere Wochen.

4. Entwicklung von hochrangigen Umreifungsbändern


Die Lösung sollte nicht nur dem Spezialisten für Datenanalyse klar sein, sondern auch dem Programmierer oder Administrator, der diese Lösung implementieren wird. Und wenn dies eine hoch geladene Lösung oder eine Lösung mit erhöhten Sicherheitsanforderungen ist, müssen Sie sie möglicherweise von Python in eine andere Sprache umschreiben.

5. Integration


In der Regel nimmt dies viel Zeit in Anspruch, da zusätzliche Mitteilungen und Genehmigungen erforderlich sind. Diese Phase wird am besten von den internen Kräften des Kundenteams durchgeführt.

6. Feedback-Sammlung, Modellanpassung


Die Welt verändert sich ständig, nicht alle Funktionen können zu Beginn der Entwicklung berücksichtigt werden. Mithilfe der Feedback-Erfassung können Modelle rechtzeitig umgeschult werden. Idealerweise beginnt der Zyklus zu diesem Zeitpunkt von neuem, jedoch mit weniger Zeit.

Merkmale von Lösungen, die auf maschinellem Lernen basieren:


  1. Maschinelles Lernen basiert auf Statistiken, und wenn der Algorithmus eine falsche Vorhersage liefert, ist dies normal. Es ist besser, dem Geschäftskunden sofort zu erklären, anhand welcher Metriken die Qualität bewertet wird, was diese Metriken bedeuten (nicht jeder weiß, was das F-Maß und Roc-Auc sind) und dass es interessant, aber statistisch nicht signifikant ist, 3 Beispiele von Hand zu setzen und das Ergebnis zu betrachten .
  2. Schlecht vorhergesagtes Ergebnis. Die Daten enthalten nicht immer ein nützliches Signal, und es ist unmöglich, das Ergebnis im Voraus genau vorherzusagen. Wir nehmen normalerweise Daten, erstellen einfache Modelle und sagen bereits basierend darauf, welche Art von Ergebnis erzielt werden kann. Dieses Problem tritt bei einigen klassischen Aufgaben (Gesichtserkennung, Spracherkennung usw.) nicht auf.
  3. Maschinelles Lernen ist eine Technologie der letzten Meile, nicht eine Silberkugel aller Probleme. Wenn Verkäufer kein Telefon von einem Kunden abholen und Kunden nicht zurückrufen, ist die Einführung von Sprachanalysen wenig sinnvoll.
  4. Die meiste Zeit wird für die Integration und die Erfassung und Verarbeitung von Daten aufgewendet und nicht für das Training des Algorithmus (mit seltenen Ausnahmen).

Optionen für die Zusammenarbeit mit Drittentwicklern:


  1. Stundenweise Zahlung. Nur für Rapid Prototyping und MVP geeignet. Aber nicht geeignet für Lösungen, die weitere Unterstützung benötigen.
  2. Vertragsentwicklung. Geistiges Eigentum geht auf den Kunden über, Support ist möglich, TK muss jedoch sorgfältig vorgeschrieben werden.
  3. Zahlung aus nachgewiesener Wirksamkeit. Aus persönlicher Erfahrung mit DATA4, einem Fall, der im Hinblick auf Zulassungen zu kompliziert ist und in der Praxis praktisch nicht angewendet wird.

Alternativ können Sie vorgefertigte Plattformen von IBM, Microsoft usw. verwenden. In der Praxis ist dies jedoch bei ständiger Verwendung teuer. Es ist nicht immer möglich, einen bestimmten Fall mit vorgefertigten Tools zu implementieren, und es gibt Einschränkungen, welche Daten dorthin gesendet werden können.

Fazit


Technologien für maschinelles Lernen steigern die Geschäftseffizienz, aber wir müssen uns daran erinnern, dass es nicht ausreicht, nur den Algorithmus zu trainieren, um eine vollständige Entscheidung zu treffen, sondern die Daten vorzubereiten und die Lösung in interne Systeme zu integrieren. Und seien Sie darauf vorbereitet, dass das Ergebnis von der Qualität der Trainingsprobe abhängt.

Source: https://habr.com/ru/post/de417009/


All Articles