
In letzter Zeit sind viele akademische und private Kurse erschienen, die darauf abzielen, Datenanalysen und Spezialisten auszubilden, die in der Lage sind, geschäftliche Probleme mithilfe von maschinellem Lernen zu lösen. Wenn Sie sich die Programme dieser Kurse genau ansehen, sind sie alle ungefähr gleich. Der Unterschied besteht nur in den Schulungsformaten (online offline) und in den Lehrern.
Die School of Data begann bereits 2015 mit solchen Kursen. Darüber hinaus begannen sie nach dem gleichen Szenario zu arbeiten. Wir haben eine große Anzahl von Programmen verschiedener akademischer Kurse zum maschinellen Lernen geprüft, basierend auf Erfahrung, nur das ausgewählt, was wirklich zur Lösung praktischer Probleme benötigt wird, und eine große Anzahl von Jupyter-Notizbüchern erstellt, in denen wir versucht haben, Mathematik und maschinelles Lernen an unseren Fingern zu erkennen.
Wir haben versucht, hauptsächlich maschinelles Lernen, Textverarbeitungsmethoden, neuronale Netze, Analyse von Netzwerkstrukturen, Empfehlungssysteme und andere Bereiche der Datenanalyse zu vermitteln. Und es scheint, dass die Bewertungen der Schüler gut waren, aber immer noch etwas fehlte.
Da unsere Haupttätigkeit in der Entwicklung realer Aufgaben im Rahmen des
Data Studio besteht, haben wir uns zunächst auf die Studenten vorbereitet. Wir haben schnell erkannt, dass in der Praxis Kenntnisse über Datenanalyse und Methoden des maschinellen Lernens, wie Mathematiker sagen, „eine notwendige, aber nicht ausreichende Bedingung“ sind. Aus diesem Grund haben wir das Programm unserer Klassen sehr schnell aktualisiert und dabei die tatsächlichen Bedürfnisse berücksichtigt.
Kurz gesagt, zu den Schlussfolgerungen, zu denen wir gekommen sind (und auf deren Grundlage wir jetzt unser Training aufbauen):
- Maschinelles Lernen und neuronale Netzwerktechnologien überbewertet
- Techniken des maschinellen Lernens können eine Kultur des analytischen Denkens ausschlachten
- Um die wirtschaftlichen Auswirkungen von Projekten mit Datenanalyse zu erzielen, sind Soft Skills wichtiger als tiefes Wissen über ML
- Der Beruf von Data Scientist wird stark überbewertet, es wird keine universellen Spezialisten mehr geben
In den folgenden Abschnitten werden alle diese Probleme behandelt.
Die meisten Aufgaben in großen Unternehmen, die jetzt versuchen, mit modernen Methoden der Datenanalyse und neuronalen Netzen zu lösen, sind seit langem gelöst. Banken sind die erfolgreichsten Fälle im Risikomanagement. In der Telekommunikation ist dies CRM / CBM, bei dem das gesamte Geschäftsmodell an eine Zunahme der LTV-Abonnenten gebunden ist. Der Einzelhandel funktioniert ähnlich - es gibt verschiedene Aufgaben (RTO-Prognose, Bestandsverwaltung, Werbeaktionen), die das Kerngeschäft ausmachen.
Es gibt produzierende Unternehmen, bei denen die Hauptaufgabe darin besteht, einerseits die Stabilität des Regimes zu erhöhen, Verluste und vorausschauende Wartung zu reduzieren und andererseits Lagerbestände und Marketing zu verwalten.
Diese Aufgaben sind nicht neu, ihre Analysten haben sie schon lange gelöst. Darüber hinaus Analysten, die den Themenbereich verstehen. Darüber hinaus gibt es in den meisten Fällen eine beträchtliche Anzahl von Anbietern, die de facto Standards für einzelne Aufgaben sind, wie z. B. das Preismanagement (im Einzelhandel) oder APC-Systeme (im Falle der Produktion). Darüber hinaus sind in der Regel bereits Optimierungsalgorithmen einschließlich maschinellem Lernen in solchen Systemen vorhanden.
Hier etwas grundlegend Neues zu machen und damit Geld zu verdienen, ist äußerst schwierig. Wie das Sprichwort sagt, wurden "Äpfel, die von einem Baum gefallen sind" bereits geerntet. Es bleibt nur nach neuen Geschäftsfällen zu suchen, in denen die Analyse einen wirtschaftlichen Effekt hat. Es gibt wirklich solche Beispiele - und es gibt immer mehr davon.
Es ist jedoch nicht einfach, solche Beispiele zu finden und die Auswirkungen der Analyse zu sehen. Dazu müssen Sie in der Lage sein, den Themenbereich eines bestimmten Prozesses (dessen Beschreibung oft einfach nicht ist) tief zu verstehen. Verstehen Sie, welche Art von Daten im Allgemeinen benötigt werden, und verstehen Sie, worauf genau das Geschäft ausgerichtet ist. Um zu verstehen, ob hier überhaupt Analysen erforderlich sind, ob einige Vorhersagealgorithmen erforderlich sind (meistens), ob der Geschäftsprozess geändert werden muss (häufig ja), ob Betriebshebel vorhanden sind (was ist der Grund für die Vorhersage des Herunterfahrens von Geräten, wenn es noch keine Möglichkeiten gibt, dies zu vermeiden? ?).
Bei der Implementierung eines solchen digitalen Produkts stellen sich viele Fragen, die einen analytischen Ansatz, eine bestimmte Kultur des Arbeitens mit Daten, die Fähigkeit, Hypothesen aufzustellen, sich Fragen zu stellen und in Bezug auf einen Geschäftsinhaber zu denken, erfordern. Tatsache ist, dass dies nicht an Datenanalyseschulen unterrichtet wird, sondern nicht an Coursera. Ja, moderne Kurse bilden wahrscheinlich gute Ingenieure und Mathematiker aus, aber keine Analysten, das tun sie nicht.
Darüber hinaus ist es wahrscheinlicher, dass Kenntnisse über Methoden des maschinellen Lernens und neuronale Netze die Kultur des analytischen Denkens zerstören. Die meisten modernen Data Scientists, wie Kinder hinter einem Sportwagen, betrachten sich als einzigartig (sie kennen viele kluge Wörter über xgboost, neuronale Netze usw.), sie wissen nicht, wie man fährt (aber warum, wenn das Auto alles für Sie tut) und sie fahren nur schnell weil es viel PS gibt (starkes Eisen, obwohl es hier eher umschult).
Als Ergebnis erhalten wir ungefähr das folgende Bild: Einige kluge, liebe Leute kommen, stellen fast keine Fragen und sagen, dass die Daten uns alles erzählen werden. Sie nehmen einige Daten und kommen dann - sie sagen, dass sie eine Art Modell gebaut haben, sie nennen Genauigkeit in Prozent und das war's. Sobald Sie anfangen herauszufordern - sie sagen in seltsamen Worten, vernichten Sie die Intelligenz, aber es gibt keinen Sinn von ihnen.
Dies erklärt, dass jetzt unter den Auftragnehmern für digitale Transformation oder Datenanalyse hauptsächlich Beratungsunternehmen (nicht IT) dominieren. Weil sie eine Kultur der Analytik, eine Kultur des Geschäftsdenkens haben, lindern sie immer Kopfschmerzen und bieten Lösungen an. Sie beschränken sich nicht nur auf die Erstellung eines maschinellen Lernmodells, sondern führen echte Analysen durch, die bei der Entscheidungsfindung helfen.
Ein weiterer Trend, der derzeit in der Welt stattfindet, ist, dass der Data Scientist, selbst wenn er weniger erfolgreich ist, nicht universell sein kann. In vielen Unternehmen hat sich die ursprünglich geschaffene zentralisierte Struktur für die Datenanalyse verteilt. Die Zentrale hat nur die Aufgabe, die Infrastruktur bereitzustellen, und im gesamten Lebensmittelbereich werden echte digitale Produkte bereits direkt in den Geschäftsbereichen hergestellt. In dieser Struktur wird der Data Scientist (vorausgesetzt, er ist „korrekt“) ein Experte auf dem Fachgebiet - die Funktion wird auf ihn übertragen, was bis dahin von den „alten“ Analysten unterstützt wurde, die vor ihm gearbeitet haben. Im Erfolgsfall erhält er auch die Bedienhebel.
Infolgedessen besteht eine zunehmende Tendenz, erfolgreichen Analysten eine operative Hebelwirkung in die Hand zu geben, und ihre Verantwortung nimmt zu. Aber nur in einem Fachgebiet. Wir gehen davon aus (wie von großen Unternehmen auf dem Markt bestätigt), dass es keine universellen Analysten mehr geben wird - der Hype ist vorbei, es ist Zeit, für das Ergebnis verantwortlich zu sein. Diejenigen, die geschäftliche Probleme mit Hilfe von Analysen lösen können, gehen zum Lebensmittelgeschäft, und diejenigen, die xgboost unterrichten können, kehren zur Akademie zurück oder halten Vorlesungen über maschinelles Lernen.
Aus diesem Grund haben wir unsere Kurse komplett überarbeitet (auch weil wir viele unserer Absolventen in unser
Data Studio bringen ) und jetzt:
0. Zunächst sehen wir am Eingang in jedem Schüler unsere zukünftigen Mitarbeiter, die mit uns im selben Boot segeln und an großen Projekten teilnehmen werden. Wir sind daher daran interessiert, dass der Student in diesen 3,5 Monaten so effizient wie möglich vorbereitet ist. Sie können jederzeit Zeit haben, um den nächsten Kurs bei Coursera zu belegen, wenn Sie die Details eines bestimmten Algorithmus verstehen müssen. Es ist jedoch viel schwieriger, Erfahrungen mit realen Fällen zu sammeln. Und deshalb:
1. Das Training basiert auf der Fallmethode. Wir übernehmen die eigentliche Aufgabe, analysieren zunächst das Geschäftsmodell, die Einheitsökonomie und verstehen, welche Qualität wir bei dieser Aufgabe auf der Grundlage realer Zahlen erreichen müssen. Wir bewerten die möglichen wirtschaftlichen Auswirkungen. Und erst danach beschäftigen wir uns mit dem technischen Teil und tauchen allmählich in analytische Methoden, maschinelles Lernen und neuronale Netze ein. Und was wichtig ist - wir tun es nur, wenn es für diese Aufgabe wirklich notwendig ist
2. Wir arbeiten mit jedem Schüler individuell. Trotz der Tatsache, dass wir versuchen, eine homogene Gruppe zu rekrutieren, verstehen wir, dass die Menschen unterschiedlich sind - jeder hat seinen eigenen individuellen Trainingsplan und seine Hausaufgaben. Unserer Meinung nach ist dies Unsinn, wenn ein paar Dutzend Menschen das gleiche Problem lösen. Dies ist selbst im Sinne des gesunden Menschenverstandes nicht effektiv. Alle Schüler erhalten die Antworten des Lehrers im Chat. Der Schüler wird niemals eins zu eins mit der Aufgabe geworfen.
Das einzige, was wir im Voraus am Eingang warnen, ist, dass das Training viel Zeit in Anspruch nimmt, Sie ständig Hausaufgaben machen, in die Details eintauchen und oft das Wochenende mit Training verbringen müssen.
Wir verstehen, dass dies keine Massengeschichte ist.
Das Data Studio ist seit mehreren Jahren erfolgreich in Betrieb, auch weil es schwierig ist, darauf zuzugreifen. Wir sind uns bewusst, dass es in der gegenwärtigen Realität einfacher ist, Analysen zu erweitern, als nach Kursen mit Coursera zu belegen. Deshalb kommen die motiviertesten Schüler zunächst an die
School of Data . Normalerweise - die Gruppengröße überschreitet nicht 15 bis 20 Personen, wodurch Sie das Training praktisch individuell gestalten können.
Ganz zu schweigen von der Tatsache, dass wir die gesamte technische Seite vollständig durchdacht haben - vorbereitete Jupyter-Notizbücher, ein effektives Kommunikationssystem für Remote-Teilnehmer, Online-Sendungen - all dies hilft auch Remote-Teilnehmern, direkt mit anderen Kindern im Unterricht zu kommunizieren.
Wir unterrichten keine Data Scientists - wir bilden vollwertige Mitarbeiter aus, die mithilfe von Analysen geschäftliche Probleme lösen können.
Der Beginn des neuen
Kurses ist am 23. September. Bei Projektfragen wenden Sie sich bitte an
Data Studio .