So erstellen Sie eine Data Science-Abteilung und vermasseln sie nicht



Data Science kam nicht nur zu großen Unternehmen, sondern auch zu kleinen und sogar Start-ups. Sehr oft haben Top-Manager jedoch kein Verständnis dafür, was für eine erfolgreiche Anwendung erforderlich ist. Viele Leute denken, dass ein Datenwissenschaftler in einem Monat alle Probleme des Unternehmens lösen wird und künstliche Intelligenz beim Klicken in allen Abteilungen perfekt funktioniert. Dies ist leider nicht so. Mein Name ist Ivan Serov und in diesem Beitrag werde ich Ihnen erklären, warum Sie mit dem Aufbau einer DS-Abteilung beginnen müssen und welche Schwierigkeiten damit verbunden sind.

Erwartungsmanagement


Eine der wichtigsten Aufgaben beim Aufbau einer Abteilung ist die sofortige Festlegung von Erwartungen und KPI. Bei DS müssen Sie wie bei jeder anderen Innovation den gesamten Zyklus durchlaufen, der mit Betriebsverlusten beginnt. Im besten Fall können die Kosten für Architektur und Spezialisten in sechs Monaten und je nach Unternehmensgröße in zwei oder drei Jahren in einem Jahr wieder erfasst werden. Es ist notwendig, darauf vorbereitet zu sein und nach ein paar Fehlern nicht alles aufzugeben. Oft schließen Top-Manager die Abteilung nach einem Jahr, weil er keinen Gewinn erzielt hat. Dadurch geht das Vertrauen in den DS verloren. Nur durch die Festlegung der notwendigen Erwartungen und Ziele (vorzugsweise von SMART ) kann eine erfolgreiche Abteilung erstellt werden.



Fangen Sie klein an


Beginnen Sie am besten mit einem sogenannten Proof-of-Concept-Projekt - es ist nicht sehr kompliziert und kurzlebig, kann aber geschäftliche Vorteile bringen. Steigern Sie beispielsweise den Umsatz aufgrund des Empfehlungssystems um 2%. Versuchen Sie nicht, ein Ensemble aus 5 benutzerdefinierten neuronalen Netzen zu erstellen und das ganze Jahr daran zu arbeiten. Selbst bei Textklassifizierungsprojekten können Sie beispielsweise mit einfachen Algorithmen (z. B. einer Wortsammlung) beginnen und bereits Wachstum erzielen. Infolgedessen wird dieses Pilotprojekt der Ausgangspunkt für die weitere Entwicklung sein und dem Management ein Verständnis dafür vermitteln, dass Geld für nützliche Dinge verwendet wird und dass DS entwickelt werden muss. Dies gibt Zeit, um an komplexeren Dingen zu arbeiten. In Ermangelung von Kompetenzen ist es für ein Pilotprojekt sinnvoll, ein externes Team von DS-Beratern einzustellen. Sie können helfen, Ihre Wünsche mit ziemlich guter Qualität zu verwirklichen oder zu verstehen, welche Projekte Sie in Ihrer Branche durchführen können, wo Sie anfangen sollen und wie Sie eine weitere KI-Strategie entwickeln sollten.



Daten sammeln


Hier ist alles einfach und kompliziert zugleich: Idealerweise sollte das Unternehmen alle vorhandenen Daten verwenden. Wenn Sie beispielsweise ein Online-Händler sind, verfügen Sie mindestens über Daten zum Verkauf bestimmter Produkte, zum Kundenverhalten auf der Website und zu Marketing-Mailings. Bereits darauf können Sie viele Modelle bauen, zum Beispiel ein persönliches Mailing-System.

Tatsächlich ist das Sammeln aller Unternehmensdaten in einer Datenbank aufgrund der unterschiedlichen Quellen, des Mangels an klarer Interaktion zwischen den Abteilungen oder sogar des Mangels an BI-Spezialisten im Unternehmen oft ein großes Problem. Unternehmen, in denen alle Daten in Excel gespeichert sind, sollten sie zuerst in einer Datenbank (SQL) sammeln und erst dann an DS denken.

Alle verfügbaren Daten müssen in der Form gesammelt werden, in der Analysten und Datenwissenschaftler sie bequem erfassen können (meistens handelt es sich um SQL). Es ist erforderlich, im Voraus mit der BI-Abteilung zu vereinbaren, in welcher Form Sie Daten empfangen, verarbeiten und in der Produktion verwenden möchten.
Mit einer kleinen Datenmenge können Sie diese bei Drittunternehmen kaufen. Zum Beispiel eine Telekommunikation: Verbinden Sie diese Daten über die Telefonnummer mit Ihrer und bereichern Sie sie so. In jedem dieser Fälle muss jedoch berechnet werden, ob sich daraus ein Nutzen ergibt.



Analysten finden


Es ist wichtig, dass das Unternehmen zum Zeitpunkt der Einrichtung der DS-Abteilung bereits über eine Analyseabteilung verfügte. Dies sind die Leute, die Wissenschaftlern helfen, die Daten zu finden, ihnen zu sagen, was sie bedeuten, wie sie die erforderlichen Variablen korrekt erfassen und vieles mehr. Analytics ist der erste Schritt in Richtung eines datengesteuerten Entscheidungsansatzes eines Unternehmens (dh wenn alle Entscheidungen im Unternehmen auf den empfangenen Daten und nicht auf dem Wunsch des Managements basieren). Sie helfen dabei, Daten ohne Verwendung von Modellen zu nutzen, und Berichte helfen dem Management, die richtigen Entscheidungen zu treffen. Darüber hinaus werden in Zukunft Analysten den Status aller DS-Modelle überwachen und auf der Grundlage der Ergebnisse Berichte erstellen.

Nimm ein Team auf


Es wurden bereits viele Artikel zu diesem Artikel geschrieben. Ich werde nur versuchen, das bereits Gesagte zusammenzufassen. Ein gutes DS-Team besteht also meistens aus:

  • Projektmanager - verwaltet das Projekt, ist für den gesamten Geschäftsteil verantwortlich;
  • Data Scientist - baut Modelle;
  • Data Engineer - sammelt Daten und bereitet Produktionspipelines vor;
  • Entwickler - stellt eine DS-Lösung vor.

Alle Rollen sind sehr variabel und können je nach Ihren Wünschen variieren. Zum Beispiel kann ein Team manchmal noch einen Geschäftsanalysten haben, manchmal können mehrere Datenwissenschaftler gleichzeitig sein, manchmal können ein Dateningenieur und ein Entwickler eine Person sein. Es gibt viele Optionen für das Team und Sie müssen auf Ihren Bedürfnissen aufbauen. Oder probieren Sie mehrere Optionen aus und wählen Sie die beste aus.

Um eine Abteilung von Grund auf neu zu erstellen, benötigen Sie neben dem Standardteam nicht nur gute Spezialisten aus der obigen Liste, sondern auch einen Evangelisten, der allen erklärt, was DS ist und welche Vorteile es für andere Abteilungen hat - derselbe Chief AI Officer / Chief Data Officer / Chief Digital Officer (wählen Sie Ihren eigenen Namen). Es ist wichtig zu erwähnen, dass Sie, wenn Sie einen Datenwissenschaftler einstellen und ihm, dem Analysten, dem Architekten und dem Entwickler Aufgaben übertragen, kein schnelles Ergebnis erwarten sollten. Außerdem kann dies diese Person der Motivation berauben und das Unternehmen ist in der zukünftigen Abteilung erfolgreich.

Wenn das Unternehmen groß ist und es viele Möglichkeiten für die Entwicklung von Big Data gibt, benötigen Sie auch Data Architect, das die Architektur konfiguriert, Multithread-Daten erfasst und Hadoop oder Spark (Systeme zur Verarbeitung großer Datenfelder) bereitstellt, mit denen die Datenwissenschaftler des Unternehmens bereits arbeiten .



Vergessen Sie nicht die interne Kommunikation und Schulung


Nach dem Pilotprojekt ist es notwendig, das Team aktiv zu entwickeln. Ein Unternehmen sollte mindestens zwei Arten von Schulungen organisieren:
Für Datenwissenschaftler können dies Workshops zu verschiedenen Themen, wöchentliche Treffen, Hackathons und Meisterkurse sein. Außerdem sollten Sie darauf achten, Online-Kurse für das Team zu kaufen (z. B. mit coursera) und diese möglicherweise sogar in den KPI aufnehmen. Dies wird dazu beitragen, das Team in einem sich schnell entwickelnden Bereich auf dem neuesten Stand zu halten und die interne Interaktion zu verbessern.
Für Projektmanager und Top-Manager können es auch Workshops in Form von Analysen von Geschäftsfällen oder KI-Strategien von Unternehmen sein, oder zum Beispiel Grundkurse verstehen maschinelles Lernen und Deep-Learning-Technologien (was getan werden kann und was nicht, die Grundlagen Technologie). Dies wird dem Management nur helfen, Erwartungen an den DS zu generieren.

Wahrscheinlich hat das Unternehmen bereits vor der Einrichtung der DS-Abteilung bereits interessierte Mitarbeiter - dies können Entwickler sein, die an DS-Kursen teilgenommen haben, oder Geschäftsleute, die DS-Projektmanager werden möchten -, die von der Abteilung angezogen werden und bei der Entwicklung helfen sollten . Wenn Sie beispielsweise einen Entwickler in Methoden des maschinellen Lernens geschult haben, können Sie einen guten und motivierten Spezialisten finden, der die interne Struktur des Unternehmens kennt und billiger ist als ein durchschnittlicher Marktdatenwissenschaftler, der auch Zeit benötigt, um dies herauszufinden.



Externe Kommunikation ist wichtig


Dieser Gegenstand wird oft vergessen, ist aber nicht weniger wichtig als der Rest. Auf dem Markt für Spezialisten für maschinelles Lernen herrscht großer Personalmangel (in den letzten Jahren hat sich alles verbessert, aber immer noch). Jeder gute Datenwissenschaftler versteht seinen Wert und wählt eher das Unternehmen, in dem er arbeiten möchte. Daher reicht es jetzt nicht mehr aus, ein hohes Gehalt anzubieten. müssen sich auf Projekte einlassen. Um dies zu erreichen, sollten Sie Ihre externe Kommunikation korrekt aufbauen - mit den Medien, Meinungsführern, der Community zusammenarbeiten, über umgesetzte Projekte sprechen, Artikel in verschiedenen thematischen Veröffentlichungen schreiben, auf Konferenzen sprechen, Industrieveranstaltungen wie Hackathons sponsern usw. - dies ist nur ein kleiner Teil davon Was tun, um Talente für das Unternehmen zu gewinnen?

Abschließend möchte ich nur sagen, dass ich die Schwierigkeiten im Prozess der Data Science-Abteilung nicht ausdrücklich erwähnt habe, sondern nur erklärt habe, was zur Erstellung erforderlich ist. Wenn Sie etwas hinzuzufügen haben - willkommen zu Kommentaren.

Source: https://habr.com/ru/post/de436052/


All Articles