Hallo Leser.
In den Fußstapfen meines
ersten Beitrags einer Auswahl von Datensätzen für maschinelles Lernen werde ich eine Auswahl relativ neuer Datensätze mit Arbeitsbeispielen für die Datenverarbeitung treffen. Schließlich ist es für niemanden ein Geheimnis, dass das Lernen mit guten Beispielen effektiver und schneller ist. Lassen Sie uns sehen, was für uns interessant ist, um einige der besten Beispiele für die Datenverarbeitung zu zeigen.
Das Schema der Arbeit mit dem aktuellen Beitrag wird von meinem Beitrag über die
besten Notizbücher auf ML und DS übernommen , nämlich in Lesezeichen gespeichert → an einen Kollegen übertragen.
+ Bonus am Ende des Artikels - ein cooler Kurs von FPMI MIPT.

Also fangen wir an.
Eine Auswahl von Datensätzen mit Arbeitsbeispielen zur Datenverarbeitung:
Selbstmordratenübersicht 1985 bis 2016 - Vergleich sozioökonomischer Informationen mit Selbstmordraten nach Jahr und Land.
Verarbeitungsbeispiele:
Das weltweite tägliche Song-Ranking von Spotify ist ein tägliches Ranking der 200 meistgesehenen Songs in 53 Ländern aus den Jahren 2017 und 2018 von Spotify-Benutzern.
Verarbeitungsbeispiel:
Verbrechen in Boston - Aufzeichnungen aus dem Meldesystem für
Straftaten in Boston , die Vorfälle und Informationen darüber enthalten, wann und wo sie passiert sind.
Verarbeitungsbeispiel:
Google Play Store-Apps - Kategorien, Bewertungen, Größe aller Google Play-Anwendungen.
Verarbeitungsbeispiel:
Pokémon für Data Mining und maschinelles Lernen - Statistiken und Funktionen von Pokemon;
Verarbeitungsbeispiel:
Eine Million Schlagzeilen - Daten aus Schlagzeilen, die in den letzten 15 Jahren veröffentlicht wurden.
Verarbeitungsbeispiel:
Flugzeugabstürze seit 1908 - Eine vollständige Geschichte der Flugzeugabstürze auf der ganzen Welt von 1908 bis heute.
Verarbeitungsbeispiel:
News Schlagzeilen Datensatz zur Sarkasmuserkennung ist ein hochwertiger Datensatz zur Sarkasmuserkennung.
Verarbeitungsbeispiel:
Historische Luftqualität -
Luftqualitätsdaten , die auf Außenmonitoren in den USA gesammelt wurden.
Verarbeitungsbeispiel:
Nährwertangaben für das McDonald's-Menü -
Nährwertangaben für jeden Menüpunkt in McDonald's USA.
Verarbeitungsbeispiel:
LEGO-Datenbank - Details / Sets / Farben und Bestände jedes offiziellen LEGO-Sets in der Rebrickable-Datenbank.
Verarbeitungsbeispiel:
Global Commodity Trade Statistics - Import- und Exportvolumen für 5.000 Produkte in den meisten Ländern der Welt in den letzten 30 Jahren.
Verarbeitungsbeispiel:
Kriminalität in Indien - vollständige Informationen zu verschiedenen Aspekten der seit 2001 in Indien begangenen Straftaten.
Verarbeitungsbeispiel:
Vorhersage eines Pulsarsterns - Pulsardaten, die während einer Untersuchung des Universums gesammelt wurden.
Verarbeitungsbeispiele:
Französische Beschäftigung, Gehälter, Bevölkerung pro Stadt - Daten zeigen Gleichheit und Ungleichheit in Frankreich.
Verarbeitungsbeispiel:
Volkszählung der Vereinigten Staaten - Volkszählung der
Vereinigten Staaten .
Verarbeitungsbeispiel:
California Housing Prices - der Preis für Wohnraum in Kalifornien.
Verarbeitungsbeispiel:
US-Arbeitslosenquote nach Landkreisen, 1990-2016 - Daten zur Arbeitslosigkeit des US-Arbeitsministeriums.
Verarbeitungsbeispiel:
World of Warcraft-Avatar-Geschichte - Eine Reihe von Aufzeichnungen, die Informationen über die Charaktere des Spielers im Spiel im Laufe der Zeit enthalten.
Verarbeitungsbeispiel:
Die Gravitationswellen-Entdeckungsdaten - Daten zu Ereignissen von Gravitationswellen GW150914.
Verarbeitungsbeispiel:
Bonus!
Und der Bonus heute ist ein
großartiger Deep Learning-Kurs, der für Schüler konzipiert ist, die sich für Programmierung und Mathematik interessieren, sowie für Schüler, die mit Deep Learning beginnen möchten.
Ziel des Kurses ist es, die Grundprinzipien des Deep Learning (Neuronale Netze) in einem interaktiven Format und am Beispiel praktischer Aufgaben vorzustellen.
Kursprogramm
- Python: Grundlagen, Google Colab;
- Einführung in die lineare Algebra. Vektoren. Matrizen und Operationen mit ihnen. NumPy-Bibliothek;
- Pandas und MatPlotlib-Bibliotheken. Die Grundlagen des maschinellen Lernens;
- Elemente der Optimierungstheorie. Farbverlauf Gefälle Abstieg. Lineare Modelle;
- Einführung in das tiefe Lernen. Perceptron. Ein Neuron mit einem Sigmoid (und anderen Aktivierungsfunktionen). OOP-Grundlagen in Python;
- PyTorch-Bibliothek. Mehrschichtige neuronale Netze;
- Training neuronaler Netze in der Praxis. Cifar10, notMNIST;
- Faltungs-Neuronale Netze. Faltungsschicht. Pooling-Schicht;
- Die Praxis des Trainings neuronaler Netze. Klassifizierung von Verkehrszeichen;
- Transfer Dearning. Beliebt in der Computer Vision Architektur;
- Bildsegmentierung. U-Net;
- Wettbewerb bei Kaggle;
- Objekterkennung YOLOv3;
- Klassisches GAN. Übertragung des neuronalen Stils;
- Grundlegende Textverarbeitungsmethoden;
- Worteinbettungen;
- Wiederkehrende neuronale Netze;
- LSTM, GRU-Zellen;
- Sprachmodelle;
- Maschinelle Übersetzung
- Text2Speech;
- SuperResolution.
Sie können auch einen Blick auf den
Youtube-Kanal der Deep Learning School werfen. Es gibt viele tolle Videos;)
Damit ist unsere kurze Auswahl an Datenverarbeitungsbeispielen beendet. Ich hoffe du hast etwas Neues für dich gelernt. Wie bei Habré üblich, hat mir der Post-Put ein Plus gefallen. Vergessen Sie nicht, mit Kollegen zu teilen. Wenn Sie etwas haben, das Sie selbst teilen können, schreiben Sie es in die Kommentare. Weitere Informationen zu maschinellem Lernen und Data Science auf
Habré und im Telegrammkanal
Neuron (@neurondata).
Alles Wissen!