Une sélection d'exemples pratiques de traitement de données

Bonjour lecteur.

Sur les traces de mon premier post d'une sélection d'ensembles de données pour l'apprentissage automatique - je ferai une sélection d'ensembles de données relativement récents avec des exemples pratiques de traitement de données. Après tout, ce n'est un secret pour personne qu'apprendre avec de bons exemples est plus efficace et plus rapide. Voyons ce qui nous intéresse sera en mesure de montrer certains des meilleurs exemples de traitement de données.

Le schéma de travail avec le message actuel sera hérité de mon message sur les meilleurs cahiers sur ML et DS , à savoir - enregistré dans les signets → transmis à un collègue.

+ bonus à la fin de l'article - un cours sympa de FPMI MIPT.

image

Commençons donc.

Une sélection d'ensembles de données avec des exemples pratiques de traitement des données:


Aperçu des taux de suicide 1985 à 2016 - Comparaison des informations socio-économiques avec les taux de suicide par année et par pays.

Exemples de traitement:


Le classement mondial quotidien des chansons de Spotify est un classement quotidien des 200 chansons les plus écoutées dans 53 pays de 2017 et 2018 par les utilisateurs de Spotify.

Exemple de traitement:


Crimes in Boston - enregistrements du système de signalement des incidents criminels de Boston, qui comprend des incidents et des informations sur le moment et l'endroit où ils se sont produits.

Exemple de traitement:


Applications Google Play Store - catégories, notes, taille de toutes les applications Google Play.

Exemple de traitement:


Pokémon pour l'exploration de données et l'apprentissage automatique - statistiques et fonctionnalités de Pokemon;

Exemple de traitement:


Un million de titres d'actualités - Données provenant des titres d'actualités publiées au cours des 15 dernières années.

Exemple de traitement:


Accidents d'avion depuis 1908 - Une histoire complète des accidents d'avion dans le monde, de 1908 à nos jours.

Exemple de traitement:


News Headlines Dataset for Sarcasm Detection est un ensemble de données de haute qualité pour la détection de sarcasmes.

Exemple de traitement:


Qualité historique de l'air - Données sur la qualité de l'air recueillies sur des moniteurs extérieurs aux États-Unis.

Exemple de traitement:


Valeur nutritive pour le menu McDonald's - Valeur nutritive pour chaque élément de menu dans McDonald's USA.

Exemple de traitement:


Base de données LEGO - détails / ensembles / couleurs et stocks de chaque ensemble LEGO officiel dans la base de données Rebrickable.

Exemple de traitement:


Statistiques du commerce mondial des produits de base - volumes d'importation et d'exportation de 5 000 produits dans la plupart des pays du monde au cours des 30 dernières années.

Exemple de traitement:


Crime en Inde - informations complètes sur divers aspects des crimes commis en Inde depuis 2001.

Exemple de traitement:


Prédiction d'une étoile pulsar - données pulsar recueillies lors d'une étude de l'univers.

Exemples de traitement:


Emploi, salaires, population par ville en France - données montrant l'égalité et les inégalités en France.

Exemple de traitement:


Recensement des États-Unis - Recensement des États- Unis.

Exemple de traitement:


Prix ​​du logement en Californie - le prix du logement en Californie.

Exemple de traitement:


Taux de chômage aux États-Unis par comté, 1990-2016 - Données sur le chômage du Département du travail des États-Unis.

Exemple de traitement:


Historique des avatars de World of Warcraft - Un ensemble d'enregistrements qui détaillent les informations sur les personnages du joueur dans le jeu au fil du temps.

Exemple de traitement:


Les données de découverte des ondes gravitationnelles - données sur les événements des ondes gravitationnelles GW150914.

Exemple de traitement:


Bonus!


Et le bonus d'aujourd'hui est un excellent cours d'apprentissage en profondeur conçu pour les étudiants du secondaire intéressés par la programmation et les mathématiques, ainsi que les étudiants qui souhaitent commencer l'apprentissage en profondeur.

L'objectif du cours est de présenter les principes de base de l'apprentissage profond (réseaux de neurones) dans un format interactif et sur l'exemple des tâches pratiques.

Programme de cours


  1. Python: notions de base, Google Colab;
  2. Introduction à l'algèbre linéaire. Vecteurs. Matrices et opérations avec eux. Bibliothèque NumPy;
  3. Bibliothèques Pandas et MatPlotlib. Les bases de l'apprentissage automatique;
  4. Éléments de la théorie de l'optimisation. Dégradé Descente en pente. Modèles linéaires;
  5. Introduction à l'apprentissage en profondeur. Perceptron. Un neurone avec un sigmoïde (et d'autres fonctions d'activation). Bases de la POO en Python;
  6. Bibliothèque PyTorch. Réseaux de neurones multicouches;
  7. Formation des réseaux de neurones en pratique. Cifar10, notMNIST;
  8. Réseaux de neurones convolutifs. Couche convolutionnelle. Couche de mise en commun;
  9. La pratique de l'entraînement des réseaux de neurones. Classification des panneaux de signalisation;
  10. Transfert Dearning. Populaire dans l'architecture de vision par ordinateur;
  11. Segmentation d'image. U-Net;
  12. Compétition à Kaggle;
  13. Détection d'objets YOLOv3;
  14. GAN classique. Transfert de style neuronal;
  15. Méthodes de traitement de texte de base;
  16. Incorporations de mots;
  17. Réseaux de neurones récurrents;
  18. Cellules LSTM, GRU;
  19. Modèles linguistiques;
  20. Traduction automatique
  21. Text2Speech;
  22. SuperResolution.

Vous pouvez également consulter la chaîne Youtube de Deep Learning School. Il y a beaucoup de super vidéos;)

Avec cela, notre courte sélection d'exemples de traitement de données a pris fin. J'espère que vous avez appris quelque chose de nouveau par vous-même. Comme d'habitude sur Habré, j'ai aimé le post - mettez un plus. N'oubliez pas de partager avec vos collègues. Aussi, si vous avez quelque chose que vous pouvez partager vous-même - écrivez dans les commentaires. Plus d'informations sur l'apprentissage automatique et la science des données sur Habré et dans la chaîne de télégramme Neuron (@neurondata).

Toutes les connaissances!

Source: https://habr.com/ru/post/fr460557/


All Articles