Habr, bonjour. J'ai traduit un article qui va strictement (!) Aux signets et qui est transmis à mes collègues. Il contient une liste de cahiers et de bibliothèques ML et Data Science pour diverses industries. Tous les codes sont en Python et sont hébergés sur GitHub. Ils seront utiles à la fois pour élargir ses horizons et pour lancer une startup intéressante.

Je note que s'il y a des lecteurs qui veulent aider et ajouter un projet approprié à l'un des sous-secteurs, veuillez me contacter. Je les ajouterai à la liste. Commençons donc à explorer la liste.
1. Immobilier et alimentation
1.1. La nutrition
- RobotChef - amélioration des recettes alimentaires sur la base des avis des utilisateurs;
- Services alimentaires - prévoir la demande de produits alimentaires à l'aide de réseaux de neurones;
- Recette Cuisine et évaluation - prédire le nom de la cuisine de n'importe quel plat en fonction d'une liste de ses ingrédients;
- Classification des aliments - classification des aliments à l'aide de la bibliothèque Keras;
- Image à recette - traduction d'une image d'un aliment en une recette pour sa préparation
- Estimation des calories - évaluation des calories sur les photos d'aliments;
- Fine Food Reviews - Analyse segmentée des aliments basée sur les critiques d'Amazon Fine Food.
1.2. Les restaurants
1.3. L'immobilier
2. Comptabilité
2.1. Apprentissage automatique
2.2. Analytique
2.3. Analyse de texte
2.4. Données, analyse et API
- EDGAR - un guide étape par étape pour obtenir des données EDGAR;
- PyEDGAR - une bibliothèque pour télécharger, mettre en cache et accéder aux fichiers EDGAR;
- IRS - accès et analyse des fichiers IRS;
- Société financière - Ensembles de données financières d'entreprise Rutgers;
- Entreprise non financière - ensemble de données d'entreprise non financière Rutgers;
- Analyse PDF - extraire des données utiles à partir de documents PDF;
- Tabel PDF vers Excel - Créez un fichier Excel à partir de données au format PDF.
2.5. Recherche et articles
- Comprendre l'analyse comptable - Un article sur l'importance de l'analyse comptable.
- VLFeat est une bibliothèque ouverte et portable d'algorithmes de vision par ordinateur avec la boîte à outils Matlab.
2.6. Sites Web
- Rutgers Raw - Recherche en comptabilité numérique par Rutgers.
2.7. Cours
3. Agriculture
3.1. Économie
- Prix - prévision des prix des produits agricoles 1;
- Prix ​​2 - prévision des prix des produits agricoles 2;
- Rendement - analyse du rendement agricole en Ukraine;
- Récupération - utilisation stratégique des terres en agriculture, en tenant compte de la restauration des écosystèmes;
- MPR - données de déclaration des prix agricoles. Produits du Département américain de l'Agriculture.
3.2. Développement
- Segmentation - segmentation des champs agricoles Ă l'aide de l'imagerie satellite;
- Nappe phréatique - prédire la profondeur des eaux souterraines dans les zones agricoles;
- Assistant - ordinateurs portables de l'assistant virtuel de l'agriculture;
- Eco-évolutionnaire - dynamique éco-évolutive;
- Maladies - identification des maladies des cultures et des ravageurs Ă l'aide du cadre d'apprentissage en profondeur pour les images;
- Irrigation et prédiction des ravageurs - analyse de l'irrigation et prédiction de la probabilité des ravageurs.
4. Banque et assurance
4.1. Financement des consommateurs
4.2. Gestion et exploitation
- Carte de crédit - Évaluation CLV des clients de carte de crédit;
- Analyse de survie - analyse des clients LTV;
- Next Transaction - un modèle d'apprentissage en profondeur pour prédire le montant de la transaction et les jours jusqu'à la prochaine transaction;
- Credit Card Churn - prédiction des sorties de clients avec des cartes de crédit;
- Procès - verbal de la Banque d'Angleterre - les principales idées du traitement préliminaire du texte à l'aide des procès-verbaux des réunions du Comité de politique monétaire de la Banque d'Angleterre;
- PDG - Une analyse de la corrélation entre les récompenses du PDG d'un homme et du PDG d'une femme.
4.3. Évaluation
4.4. Fraude
4.5. Assurances et risques
4.6. Utile

5. Biotechnologie et science
5.1. Général
- Programmation - programmation pour les biologistes en Python;
- Introduction DL - Un manuel sur l'étude avancée de la génomique;
- Pose - évaluation de la pose d'un animal en utilisant DL;
- Confidentialité - l'échange de données cliniques, tout en préservant la confidentialité;
- Génétique des populations - conclusion génétique des populations;
- Cours de bioinformatique - supports de cours sur la biologie computationnelle et la bioinformatique;
- Statistiques appliquées - Statistiques appliquées pour la biologie haute performance;
- Scripts - scripts Python pour les biologistes;
- Molecular NN - un mini-cadre pour la construction et la formation de réseaux de neurones pour la biologie moléculaire;
- Simulations de biologie des systèmes - biologie système pratique lors de l'écriture de simulations avec F # et Z3;
- Mouvement cellulaire - LSTM pour prédire le mouvement biologique des cellules;
- Deepchem - Deep Learning pour la découverte de nouveaux médicaments, la chimie quantique, la science des matériaux et la biologie.
5.2. Séquence
5.3. Chemoinformatique et découverte de médicaments
5.4. Génomique
5.5. Science
- Plants Disease - une application qui identifie les maladies des plantes à l'aide d'un modèle d'apprentissage en profondeur;
- Identification des feuilles - identification des plantes Ă travers les feuilles en fonction de leur forme, couleur et texture;
- Crop Analysis - une bibliothèque d'images pour détecter et suivre la position future des épis de maïs sur les plants de maïs;
- Plants - plants de plantes, classification de Kaggle;
- Stress des plantes - une ontologie contenant le stress des plantes;
- Hiérarchie animale - un package pour calculer les hiérarchies de dominance animale;
- Identification des animaux - formation Ă l'identification profonde des animaux;
- Espèces - analyse des mégadonnées de diverses espèces animales;
- Vocalisations animales - un réseau générateur de vocalisation animale;
- Evolutionary - un outil pour les stratégies d'évolution;
- Glaciers - matériel éducatif sur les glaciers.
6. Machines de construction
6.1. La construction
6.2. Génie
6.3. Science des matériaux
- Python Materials Genomics - code d'analyse des matériaux utilisé dans un projet établi;
- Extraction de matériaux - scripts pour la modélisation et l'analyse des matériaux;
- Emmet - création de bases de données sur les propriétés des matériaux;
- Megnet - réseaux de graphes comme cadre ML pour les molécules et les cristaux;
- Atomate - workflows pour la science informatique des matériaux;
- Conformité aux règlements - prédiction des amendes immobilières;
- Asphalt Binder - matériaux de construction, énergie libre et composition chimique des chaussées en asphalte cimentaire;
- Awesome Materials Informatics est une liste de conservation d'ouvrages bien connus dans le domaine de la science des matériaux.
7. Économie
7.1. Général
7.2. Apprentissage automatique
- EconML - formation et analyse automatisées des relations de cause à effet;
- Enchères - enchères optimales utilisant le deep learning.
7.3. Calculs
- Quant Econ - cours d'économie quantitative de NYU;
- Calcul - méthodes de calcul en économie;
- Computational 2 - Petit cours en économie computationnelle;
- Théorie économétrique - cahiers de théorie économétrique pour les débutants.
8. Éducation et recherche
8.1. Étudiants
8.2. L'école
9. Urgences
9.1. La prévention
9.2.
9.3.
9.4.

10.
10.1.
10.2.
11. Santé
11.1. Général
12. Justice, droit et réglementation
12.1. Les outils
12.2. Politique et réglementation
12.3. Jurisprudence
13. Production
13.1. Général
13.2. L'entretien
13.3. Erreurs
13.4. La qualité
14. Médias et édition
14.1. Le marketing
15. Physique
15.1. Général
15.2. Apprentissage automatique
16. Gouvernement
16.1. Politique sociale
16.2. Charité
16.3. Analyse des élections
16.4. La politique
- Politique du Congrès - Chambre des représentants du Congrès américain;
- Politico - une plate-forme pour le profilage de personnalités publiques dans la politique brésilienne;
- Bots - outils et algorithmes pour analyser les tweets paraguayens pendant les élections;
- Tests Gerrymander - de nombreuses mesures pour quantifier Gerrymandering;
- Sentiment - analyse des journaux pour leur conviction politique en utilisant les sentiments subjectifs des représentants des partis;
- DL Politics - Une comparaison d'un parti socialiste avec un parti populaire au Brésil;
- PAC Money - l'influence de l'argent PAC sur la politique américaine;
- Power Networks - créer un chien de garde pour les réseaux d'entreprises et politiques indiens;
- Elite - l'élite politique aux États-Unis;
- Analyse des débats - un programme d'analyse des débats politiques;
- Affiliation politique - prévision de l'affiliation politique à l'aide des métadonnées Twitter;
- Annonces politiques - une enquĂŞte sur Facebook des annonces politiques et ciblage;
- Identité politique - un modèle politique multiaxial d'identité politique;
- YT Politics - affichage des politiques sur YouTube;
- Idéologie politique - Une étude incontrôlée de l'idéologie politique utilisant des projections vectorielles verbales.
17. Immobilier, location et crédit-bail
17.1. L'immobilier
- Finding Donuts - prévisions de quartier;
- Quartier - prévision des prix de l'immobilier dans la ville;
- Classification immobilière - classification du type de propriété en tenant compte de l'immobilier, des communications par satellite et de la vue sur la rue;
- Recommender - un système de recommandation des 5 meilleurs objets immobiliers qui correspondent à la recherche de l'utilisateur;
- Prix ​​du logement - prédiction du prix du logement en utilisant la régression linéaire et le GBR;
- House Price Portland - prévision des prix des logements à Portland;
- Zillow Prediction - Prévisions de score Zillow faites par Kaggle.
17.2. Loyer et leasing
18. Utilitaires
18.1. Énergie électrique
18.2. Charbon, pétrole et gaz
18.3. Pollution de l'eau
- Eau salubre - prédiction des troubles de la qualité de l'eau potable basée sur la santé humaine aux États-Unis;
- Hydrology Data - un ensemble de fonctions pratiques pour étudier les données sur l'eau en Python;
- Observatoire de l'eau - surveillance du niveau de l'eau dans les lacs et les réservoirs à l'aide d'images satellites;
- Conduites d'eau - utilisation de l'apprentissage automatique pour trouver des conduites d'eau dans des photographies aériennes;
- Modélisation de l'eau - Système de modélisation communautaire australien pour évaluer les ressources en eau;
- Restrictions de sécheresse - analyse de l'utilisation de l'eau à Los Angeles;
- Prédiction des inondations - application de LSTM aux données sur le niveau d'eau des rivières;
- Débordement des eaux usées - Analyse de débordement sanitaire (SSO);
- La prévision de la qualité de l'air est la prévision de la qualité de l'air (aq) à Beijing et à Londres au cours des prochaines 48 heures.
18.4. La logistique
19. Commerce de gros et de détail
19.1. Vente en gros
19.2. Commerce de détail
Sur ce point, notre article sur l'application du ML et du DS dans l'industrie a pris fin. J'espère que vous avez appris quelque chose de nouveau par vous-même. Si vous avez quelque chose que vous pouvez partager, écrivez dans les commentaires.
Plus d'informations sur le machine learning et la Data Science dans mon compte sur
Habré et sur la chaîne de télégramme
Neuron , abonnez-vous pour ne pas manquer les prochains articles.
Toutes les connaissances!