Data Science - Data Science, die an der Schnittstelle mehrerer breiter Bereiche entstanden ist: Programmierung, Mathematik und maschinelles Lernen. Dies ist auf die hohe Schwelle für den Berufseinstieg und die Notwendigkeit zurückzuführen, ständig neues Wissen zu erhalten.
Schlüsselkompetenzen für Anfänger sind:
- Fähigkeit, Code zu schreiben (Python);
- Fähigkeit, Ihre Ergebnisse zu visualisieren;
- Verständnis dafür, was „unter der Haube“ passiert.
Die Bücher, die die Spezialisten von Plarium Krasnodar für Leser mit Grundkenntnissen in Data Science ausgewählt haben, sind in diese drei Kategorien unterteilt.

Python
Einige Leute suchen in R nach sich selbst, aber der Weg der Wahrheit führt über Python. Die folgenden Bücher sind eine gute Wahl zum Lernen.
Python-Tricks: Das Buch
Dan BaderDas Buch handelt von verschiedenen Tricks und Nützlichkeiten, die dazu beitragen, produktiver zu werden und besser zu programmieren.
Wir sprechen über die grundlegenden Datentypen der Python-Sprache und Ansätze zum Schreiben von Code - von OOP bis zur Arbeit mit Abhängigkeiten. Es lohnt sich sowohl für Anfänger als auch für alle, die ihr Gedächtnis mit typischen pythonischen Designs auffrischen möchten.
Hochleistungs-Python: Praktische performante Programmierung für Menschen
Micha Gorelick, Ian OzsvaldDas Buch beschreibt die Sprache intern. Es enthält Erläuterungen zur Arbeit des Interpreters und zur Mechanik des Codes, zu den wichtigsten Datentypen und zu deren Interaktion mit dem Speicher. In diesem Handbuch erfahren Sie auch, wie Sie die verborgenen Funktionen von Python nutzen können.
Visualisierung
Jeder Data Scientist muss einmal das Ergebnis seiner Arbeit präsentieren. Und wie Sie wissen, gibt es keinen besseren Weg als eine qualitativ hochwertige Visualisierung. Hier entstehen ausgefallene Tortendiagramme ...
Geschichtenerzählen mit Daten: Ein Handbuch zur Datenvisualisierung für Geschäftsleute
Cole nussbaumer knaflicEin wunderbares Buch darüber, wie Sie Ihre Ergebnisse auf hochwertige Weise visualisieren können. Darin beschreibt Ex-Googler detailliert alle Phasen der Erstellung der richtigen Grafiken und gibt Gegenbeispiele.
Sie können auch die Website des Autors besuchen, auf der eine Vielzahl von Optionen für die Präsentation von Daten der besten Spezialisten gesammelt wurden. Eine schrittweise Anleitung zum Erstellen perfekter Arbeiten finden Sie hier natürlich nicht - und wo Sie sie finden!
Das große Buch der Dashboards. Visualisierung Ihrer Daten mithilfe realer Geschäftsszenarien
Steve Wexler, Jeffrey Shaffer und Andy CotgreaveDatenvisualisierung ist mühsame Arbeit, aber wenn Sie wissen, wie das Ideal aussehen sollte, verstehen Sie, wonach Sie streben müssen.
Dies ist eine hervorragende Auswahl an Dashboards für alle Gelegenheiten, in denen Lösungen für fast jede Geschäftsaufgabe empfohlen werden. Leider wird nichts über die Implementierung in Tableau gesagt - nur die visuellen Komponenten und eine Erklärung, wie am besten und warum besser ist.
ML-Algorithmen
Dies ist der Bereich, in dem es relativ einfach ist zu verstehen, was die Algorithmen tun, aber es ist sehr schwierig, eine Beherrschung zu erreichen.
Praktisches maschinelles Lernen mit Scikit-Learn und Tensor Flow: Konzepte, Tools und Techniken zum Aufbau intelligenter Systeme
Aurélien géronDas Buch kann jedem sicher empfohlen werden, der verstehen möchte, wie Modelle gebaut werden - von linear bis zu Bäumen. Im ersten Teil werden die Funktionsprinzipien der Algorithmen in einer zugänglichen Sprache beschrieben. Dies ist besonders nützlich für diejenigen, die gerade erst in den Beruf eintreten. Der zweite Teil ist TensorFlow gewidmet.
Tiefes Lernen. Eintauchen in die Welt der neuronalen Netze
S. Nikolenko, A. Kadurin, E. ArkhangelskayaFast die gesamte IT-Literatur der modernen Welt wird in englischer Sprache veröffentlicht, und der Bereich Data Science ist keine Ausnahme. Es gibt sogar einen Ausdruck: „Ich möchte Programmierer werden, welche Sprache soll ich lernen? Lerne zuerst Englisch. “
Dies ist das einzige lohnende Buch über Deep Learning und Neuronale Netze, das von russischen Autoren in russischer Sprache verfasst wurde. Darüber hinaus ist es mit einer Reihe von Beispielen, verschiedenen Geschichten aus der Wissenschaft und Verweisen auf Quellen sehr ausdrucksstark (eine Liste der Literatur in dieser Arbeit ist nützlicher als viele Veröffentlichungen).
Die Elemente des statistischen Lernens: Data Mining, Inferenz und Vorhersage, 2. Auflage
Trevor Hastie, Robert Tibshirani und Jerome FriedmanNur ein Muss in jeder Data Science-Sammlung. Grundlegende Arbeit an Algorithmen für maschinelles Lernen, die als Handbuch verwendet werden können. Erfordert einige Vorbereitungen, die für Fortgeschrittene geeignet sind.
Optional
Statistik-Grundlagen Kurz und bündig
Katharine Alexis KormanikIn der Succinctly-Reihe werden oft Perlen gefunden, und dies ist eine davon. Am Anfang des Buches stehen die grundlegenden Definitionen mit Bildern und Kommentaren, und der Rest ist der Bedeutung von Tests (T- und Z-Tests) gewidmet.
Eine zugängliche Sprache und ein Minimum an Mathematik (die Menge, die zum Verstehen benötigt wird) machen dieses Handbuch aus praktischer Sicht zu einer hervorragenden Einführung in die Statistik.
Deep Work: Regeln für fokussierten Erfolg in einer abgelenkten Welt
Cal Newport
Der Autor spricht über seine Erfahrungen und die Erfahrungen von Kollegen bei der Arbeit an einer Aufgabe mit maximaler Konzentration. Das Buch ist recht einfach zu lesen und besteht aus einer Beschreibung des Ansatzes selbst, verschiedenen Beispielen und Regeln.
Die Hauptidee ist, dass ein solcher Zustand des Gehirns es uns ermöglicht, die ultimative Leistung zu erzielen und die Ergebnisse auf ein ganz neues Niveau zu bringen. Die Gehirngrenze ist leider begrenzt, aber wir trainieren. Wir empfehlen jedem, es zu lesen.