Ich heiße Azat Bulyakkulov. Ich arbeite als Risikoanalyst bei der Fintech-Firma ID Finance. Ich begann mit Analysen und erstellte Berichte für Risiko-, Marketing- und Finanzabteilungen. In unserer relativ kleinen Firma musste ich mit allen Abteilungen interagieren. Infolgedessen konnte ich eine vielfältige Berufserfahrung sammeln. Ich nahm an der Berechnung der Finanzreserven teil, verglich die Leistung in A / B-Tests, segmentierte Kunden für Marketing usw. In weniger als einem Jahr Arbeit beteiligte ich mich an der Entwicklung von Scoring-Karten. Und mir wurde klar, dass ich die Datenanalyse und -verarbeitung besser verstehen möchte.

Wir haben klassische logistische Regressionen verwendet, um Kundenausfälle vorherzusagen. Eine der Quellen unserer Daten sind Finanztransaktionen, auf die uns Kunden auf Wunsch Zugriff gewähren. Die Arbeit mit ihnen erforderte einen kreativen Ansatz, da viele nützliche Informationen aus diesem Datenspeicher extrahiert werden konnten. Wie ich später erfuhr, wird dieser Prozess als Feature-Engineering bezeichnet. Es hat mich gefangen genommen - ich interessierte mich noch mehr für Datenwissenschaft.
In Zusammenarbeit mit anderen Abteilungen habe ich festgestellt, dass der Anwendungsbereich für ML enorm ist. Nicht die geringste Rolle in meinem Interesse an DS spielte die Tatsache, dass wir uns im schweren SAS-e entwickelten. Es hat nicht die bequemste Oberfläche und unvollständige Funktionalität. Ich wollte mit einem flexibleren Werkzeug arbeiten.
Ich erkannte, dass das Selbststudium der Datenwissenschaft zum Beispiel bei Coursera einen starken Willen und Selbstdisziplin erfordert, die ich nicht genug habe. Daher begann ich mich nicht mit Online-Kursen zu beschäftigen, sondern mit „Live“ -Kursen mit Vorträgen, Diskussionen und Hausaufgaben.
Ich habe meinen Vorgesetzten bei der Arbeit über die Richtung informiert, in die ich mich entwickeln möchte. Das Management kam zu mir und bot an, die Kurse zu bezahlen und anschließend in die Abteilung für Datenwissenschaft innerhalb des Betriebs zu gehen.
Also fing ich an, Kurse zu wählen. Seltsamerweise setzen sich Online-Kurse auf dem DS-Bildungsmarkt durch. Selbst in Moskau gibt es keine große Auswahl an seriösen Kursen, die nicht dem Stil "Wir werden Ihnen in 21 Tagen Datenwissenschaft beibringen" entsprechen. Ich habe verstanden, dass ein qualitativ hochwertiges Training mindestens sechs Monate dauern sollte. Ich habe Yandex SHAD nicht in Betracht gezogen, da es ein völliges Eintauchen und tägliche Aktivitäten erfordert. Wenn man Vollzeit arbeitet, ist es schwierig, Lehrmaterial auf qualitativ hochwertige Weise aufzunehmen und zu verarbeiten. Mit Blick auf die Zukunft werde ich sagen, dass ich im gewählten Kurs Probleme mit der Zeit zum Lernen hatte, ganz zu schweigen von dem kostenlosen. Infolgedessen habe ich den sechsmonatigen Data Scientist-Kurs einer der beliebtesten Schulen besucht: 5 Monate intensives Training + einen Monat für das Schreiben eines Diploms.
Über den Kurs
Das Training kostete ungefähr 200.000 Rubel. Es gab viele Klassen - 3 mal pro Woche für 3 Stunden. Nach ungefähr 2 von 3 Klassen gab es Hausaufgaben. Das Programm war klassisch und umfasste die grundlegenden Methoden des maschinellen Lernens, Empfehlungssysteme, Bilderkennung, Bildverarbeitung, Verarbeitung von Natursprachen (NLP) und Zeitreihen. Außerdem gab es mehrere Hackathons und ein Diplom für diejenigen, die die erforderliche Mindestmenge an Hausaufgaben übergeben würden.

Der Unterricht fand in Baumanskaya statt, 30 Personen waren in der Gruppe eingeschrieben, aber sie gingen stetig zwischen 15 und 20. Ich habe wochentags und samstags von 10:00 bis 13:00 Uhr zweimal abends geübt. Es ist merkwürdig, dass Menschen aus verschiedenen Bereichen, die nicht unbedingt mit IT zu tun haben, zu den Kursen gekommen sind. Ja, es gab Front- / Backend-Entwickler, aber die Hälfte des Kurses befasste sich mit Produkt- / Geschäfts- oder Risikoanalysen. Und für fast alle bedeuteten diese Kurse einen Berufswechsel. Einige kamen, weil es jetzt einen gewissen Hype um Data Science gibt, andere sind gelangweilt von ihren aktuellen Aktivitäten, während andere planen, DS in ihrer Arbeit zu verwenden. Fast jeder hat das Training selbst bezahlt, daher war das Interesse recht hoch.
Meine Eindrücke
Alles begann mit Grundkenntnissen und Programmierkenntnissen in Python, Datenvisualisierung. Dann wechselten wir in einen Galopp und begannen, in einer Lektion eine Methode des maschinellen Lernens zu befolgen: entscheidende Bäume, lineare / logistische Regression, zufällige Wälder, Boosts. Persönlich denke ich, dass es mehr Zeit braucht, um diese klassischen Methoden zu lernen.
Was mir gefallen hat
- Wir haben fast alle modernen Methoden und Ansätze des maschinellen Lernens untersucht.
- Es gab einen separaten Block für Feature-Engineering - bis zu 3 Lektionen. Dies sind nützliche Informationen, aber leider hat der Dozent diesen Teil nicht optimal gelesen.
- Ein Teil der Hausaufgaben stammte vom Kaggle-Wettbewerb. Nach dem Absenden der Ergebnisse konnten Sie Ihre Position sehen. Danach gab es eine Motivation, Ihr Modell zu verbessern, seine Parameter anzupassen und nicht nur die Hausaufgaben in der „Hölle“ zu machen.
- Es gab ausführliche Kurse zu Empfehlungssystemen, NLP und Computer Vision mit jeweils 6-8 Klassen. Und meiner Meinung nach gab es die besten Dozenten.
- Nach Blockaden in Computer Vision und Zeitreihen gab es 2 Hackathons.
Dies stellte sich als sehr nützliche Übung heraus. Die Notwendigkeit, in kürzester Zeit ein akzeptables Ergebnis zu erzielen, aktiviert und belastet das Gehirn in vollen Zügen. Wenn Sie in einem Team arbeiten, sehen Sie außerdem die Ansätze anderer Personen.
- In meinem persönlichen Konto gab es eine Schülerbewertung, in der ich den Fortschritt meiner Klassenkameraden bei den Hausaufgaben sah. Das war hilfreich. Seit der Pause habe ich mich an die „Nerds“ gewandt und gefragt, wie sie diese oder jene Hausaufgaben gemacht haben.
- Der Vorteil von „Live“ -Vorträgen sind Fragen während des Unterrichts.
- Im Publikum machten wir auf Anweisung des Dozenten sofort kleine Übungen in Python
- Studentengemeinschaft - Kommunikation mit Klassenkameraden, Meinungsaustausch, es war interessant, von anderen über ihre Motivation und Bereiche zu hören, die für sie von Interesse sind ML.
Was hat nicht gefallen
- Hohe Dichte in der Übersicht der Hauptmethoden - nur eine Lektion pro Methode.
- Im Allgemeinen möchte ich 2 Stunden pro Woche, nicht 3. Persönlich war das Lernen für mich schwierig, ich habe fast meine gesamte Freizeit gegessen. Zu meinem Neid konnte ein Teil meiner Klassenkameraden bei der Arbeit lernen.
- Aus unbekannten Gründen wurde das Gerät über NLP übertragen und an Computer Vision (CV) weitergeleitet. Infolgedessen mussten wir bei NLP neuronale Netze verwenden, die nur im Hinblick auf den Lebenslauf ausführlicher beschrieben wurden.
- Es gab Dozenten mit extrem geringen pädagogischen Fähigkeiten. Außerdem haben sie die Hausaufgaben nicht rechtzeitig überprüft.
Der Umfang der Datenwissenschaft hat sich in letzter Zeit erweitert.Insgesamt
Ich hatte 5 Monate intensives Training, wo ich tief genug in die Welt der ML eintauchte. Ich habe gelernt, Datenverarbeitung in Python zu schreiben, sie zu visualisieren und verschiedene Modelle zu erstellen. Auch generierter Text unter Verwendung neuronaler Netze, klassifizierte Bilder.
Ich denke, ich habe eine gute Erfahrung gemacht, um anzufangen. Mein Diplom-Mentor sagte, dass unser Wissen von einem mittleren Datenwissenschaftler und die Erfahrung von einem Junior gezogen wird. Nun, wir werden in ein paar Monaten sehen. Da ich für zwei Wochen in die Data Science-Abteilung unseres Unternehmens wechsle.