Application de l'apprentissage automatique et de la science des données dans l'industrie

Habr, bonjour. J'ai traduit un article qui va strictement (!) Aux signets et qui est transmis à mes collègues. Il contient une liste de cahiers et de bibliothèques ML et Data Science pour diverses industries. Tous les codes sont en Python et sont hébergés sur GitHub. Ils seront utiles à la fois pour élargir ses horizons et pour lancer une startup intéressante.

image

Je note que s'il y a des lecteurs qui veulent aider et ajouter un projet approprié à l'un des sous-secteurs, veuillez me contacter. Je les ajouterai à la liste. Commençons donc à explorer la liste.

1. Immobilier et alimentation


1.1. La nutrition


  • RobotChef - amĂ©lioration des recettes alimentaires sur la base des avis des utilisateurs;
  • Services alimentaires - prĂ©voir la demande de produits alimentaires Ă  l'aide de rĂ©seaux de neurones;
  • Recette Cuisine et Ă©valuation - prĂ©dire le nom de la cuisine de n'importe quel plat en fonction d'une liste de ses ingrĂ©dients;
  • Classification des aliments - classification des aliments Ă  l'aide de la bibliothèque Keras;
  • Image Ă  recette - traduction d'une image d'un aliment en une recette pour sa prĂ©paration
  • Estimation des calories - Ă©valuation des calories sur les photos d'aliments;
  • Fine Food Reviews - Analyse segmentĂ©e des aliments basĂ©e sur les critiques d'Amazon Fine Food.

1.2. Les restaurants



1.3. L'immobilier



2. Comptabilité


2.1. Apprentissage automatique



2.2. Analytique



2.3. Analyse de texte



2.4. Données, analyse et API


  • EDGAR - un guide Ă©tape par Ă©tape pour obtenir des donnĂ©es EDGAR;
  • PyEDGAR - une bibliothèque pour tĂ©lĂ©charger, mettre en cache et accĂ©der aux fichiers EDGAR;
  • IRS - accès et analyse des fichiers IRS;
  • SociĂ©tĂ© financière - Ensembles de donnĂ©es financières d'entreprise Rutgers;
  • Entreprise non financière - ensemble de donnĂ©es d'entreprise non financière Rutgers;
  • Analyse PDF - extraire des donnĂ©es utiles Ă  partir de documents PDF;
  • Tabel PDF vers Excel - CrĂ©ez un fichier Excel Ă  partir de donnĂ©es au format PDF.

2.5. Recherche et articles


  • Comprendre l'analyse comptable - Un article sur l'importance de l'analyse comptable.
  • VLFeat est une bibliothèque ouverte et portable d'algorithmes de vision par ordinateur avec la boĂ®te Ă  outils Matlab.

2.6. Sites Web


  • Rutgers Raw - Recherche en comptabilitĂ© numĂ©rique par Rutgers.

2.7. Cours



3. Agriculture


3.1. Économie


  • Prix - prĂ©vision des prix des produits agricoles 1;
  • Prix ​​2 - prĂ©vision des prix des produits agricoles 2;
  • Rendement - analyse du rendement agricole en Ukraine;
  • RĂ©cupĂ©ration - utilisation stratĂ©gique des terres en agriculture, en tenant compte de la restauration des Ă©cosystèmes;
  • MPR - donnĂ©es de dĂ©claration des prix agricoles. Produits du DĂ©partement amĂ©ricain de l'Agriculture.

3.2. Développement


  • Segmentation - segmentation des champs agricoles Ă  l'aide de l'imagerie satellite;
  • Nappe phrĂ©atique - prĂ©dire la profondeur des eaux souterraines dans les zones agricoles;
  • Assistant - ordinateurs portables de l'assistant virtuel de l'agriculture;
  • Eco-Ă©volutionnaire - dynamique Ă©co-Ă©volutive;
  • Maladies - identification des maladies des cultures et des ravageurs Ă  l'aide du cadre d'apprentissage en profondeur pour les images;
  • Irrigation et prĂ©diction des ravageurs - analyse de l'irrigation et prĂ©diction de la probabilitĂ© des ravageurs.

4. Banque et assurance


4.1. Financement des consommateurs



4.2. Gestion et exploitation


  • Carte de crĂ©dit - Évaluation CLV des clients de carte de crĂ©dit;
  • Analyse de survie - analyse des clients LTV;
  • Next Transaction - un modèle d'apprentissage en profondeur pour prĂ©dire le montant de la transaction et les jours jusqu'Ă  la prochaine transaction;
  • Credit Card Churn - prĂ©diction des sorties de clients avec des cartes de crĂ©dit;
  • Procès - verbal de la Banque d'Angleterre - les principales idĂ©es du traitement prĂ©liminaire du texte Ă  l'aide des procès-verbaux des rĂ©unions du ComitĂ© de politique monĂ©taire de la Banque d'Angleterre;
  • PDG - Une analyse de la corrĂ©lation entre les rĂ©compenses du PDG d'un homme et du PDG d'une femme.

4.3. Évaluation



4.4. Fraude



4.5. Assurances et risques



4.6. Utile



image

5. Biotechnologie et science


5.1. Général


  • Programmation - programmation pour les biologistes en Python;
  • Introduction DL - Un manuel sur l'Ă©tude avancĂ©e de la gĂ©nomique;
  • Pose - Ă©valuation de la pose d'un animal en utilisant DL;
  • ConfidentialitĂ© - l'Ă©change de donnĂ©es cliniques, tout en prĂ©servant la confidentialitĂ©;
  • GĂ©nĂ©tique des populations - conclusion gĂ©nĂ©tique des populations;
  • Cours de bioinformatique - supports de cours sur la biologie computationnelle et la bioinformatique;
  • Statistiques appliquĂ©es - Statistiques appliquĂ©es pour la biologie haute performance;
  • Scripts - scripts Python pour les biologistes;
  • Molecular NN - un mini-cadre pour la construction et la formation de rĂ©seaux de neurones pour la biologie molĂ©culaire;
  • Simulations de biologie des systèmes - biologie système pratique lors de l'Ă©criture de simulations avec F # et Z3;
  • Mouvement cellulaire - LSTM pour prĂ©dire le mouvement biologique des cellules;
  • Deepchem - Deep Learning pour la dĂ©couverte de nouveaux mĂ©dicaments, la chimie quantique, la science des matĂ©riaux et la biologie.

5.2. Séquence



5.3. Chemoinformatique et découverte de médicaments



5.4. Génomique



5.5. Science


  • Plants Disease - une application qui identifie les maladies des plantes Ă  l'aide d'un modèle d'apprentissage en profondeur;
  • Identification des feuilles - identification des plantes Ă  travers les feuilles en fonction de leur forme, couleur et texture;
  • Crop Analysis - une bibliothèque d'images pour dĂ©tecter et suivre la position future des Ă©pis de maĂŻs sur les plants de maĂŻs;
  • Plants - plants de plantes, classification de Kaggle;
  • Stress des plantes - une ontologie contenant le stress des plantes;
  • HiĂ©rarchie animale - un package pour calculer les hiĂ©rarchies de dominance animale;
  • Identification des animaux - formation Ă  l'identification profonde des animaux;
  • Espèces - analyse des mĂ©gadonnĂ©es de diverses espèces animales;
  • Vocalisations animales - un rĂ©seau gĂ©nĂ©rateur de vocalisation animale;
  • Evolutionary - un outil pour les stratĂ©gies d'Ă©volution;
  • Glaciers - matĂ©riel Ă©ducatif sur les glaciers.

6. Machines de construction


6.1. La construction



6.2. Génie



6.3. Science des matériaux


  • Python Materials Genomics - code d'analyse des matĂ©riaux utilisĂ© dans un projet Ă©tabli;
  • Extraction de matĂ©riaux - scripts pour la modĂ©lisation et l'analyse des matĂ©riaux;
  • Emmet - crĂ©ation de bases de donnĂ©es sur les propriĂ©tĂ©s des matĂ©riaux;
  • Megnet - rĂ©seaux de graphes comme cadre ML pour les molĂ©cules et les cristaux;
  • Atomate - workflows pour la science informatique des matĂ©riaux;
  • ConformitĂ© aux règlements - prĂ©diction des amendes immobilières;
  • Asphalt Binder - matĂ©riaux de construction, Ă©nergie libre et composition chimique des chaussĂ©es en asphalte cimentaire;
  • Awesome Materials Informatics est une liste de conservation d'ouvrages bien connus dans le domaine de la science des matĂ©riaux.

7. Économie


7.1. Général



7.2. Apprentissage automatique


  • EconML - formation et analyse automatisĂ©es des relations de cause Ă  effet;
  • Enchères - enchères optimales utilisant le deep learning.

7.3. Calculs


  • Quant Econ - cours d'Ă©conomie quantitative de NYU;
  • Calcul - mĂ©thodes de calcul en Ă©conomie;
  • Computational 2 - Petit cours en Ă©conomie computationnelle;
  • ThĂ©orie Ă©conomĂ©trique - cahiers de thĂ©orie Ă©conomĂ©trique pour les dĂ©butants.

8. Éducation et recherche


8.1. Étudiants



8.2. L'école



9. Urgences


9.1. La prévention



9.2.



9.3.



9.4.



image

10.


10.1.



10.2.



11. Santé


11.1. Général



12. Justice, droit et réglementation


12.1. Les outils



12.2. Politique et réglementation



12.3. Jurisprudence



13. Production


13.1. Général



13.2. L'entretien



13.3. Erreurs



13.4. La qualité



14. Médias et édition


14.1. Le marketing



15. Physique


15.1. Général



15.2. Apprentissage automatique



16. Gouvernement


16.1. Politique sociale



16.2. Charité



16.3. Analyse des élections



16.4. La politique


  • Politique du Congrès - Chambre des reprĂ©sentants du Congrès amĂ©ricain;
  • Politico - une plate-forme pour le profilage de personnalitĂ©s publiques dans la politique brĂ©silienne;
  • Bots - outils et algorithmes pour analyser les tweets paraguayens pendant les Ă©lections;
  • Tests Gerrymander - de nombreuses mesures pour quantifier Gerrymandering;
  • Sentiment - analyse des journaux pour leur conviction politique en utilisant les sentiments subjectifs des reprĂ©sentants des partis;
  • DL Politics - Une comparaison d'un parti socialiste avec un parti populaire au BrĂ©sil;
  • PAC Money - l'influence de l'argent PAC sur la politique amĂ©ricaine;
  • Power Networks - crĂ©er un chien de garde pour les rĂ©seaux d'entreprises et politiques indiens;
  • Elite - l'Ă©lite politique aux États-Unis;
  • Analyse des dĂ©bats - un programme d'analyse des dĂ©bats politiques;
  • Affiliation politique - prĂ©vision de l'affiliation politique Ă  l'aide des mĂ©tadonnĂ©es Twitter;
  • Annonces politiques - une enquĂŞte sur Facebook des annonces politiques et ciblage;
  • IdentitĂ© politique - un modèle politique multiaxial d'identitĂ© politique;
  • YT Politics - affichage des politiques sur YouTube;
  • IdĂ©ologie politique - Une Ă©tude incontrĂ´lĂ©e de l'idĂ©ologie politique utilisant des projections vectorielles verbales.

17. Immobilier, location et crédit-bail


17.1. L'immobilier


  • Finding Donuts - prĂ©visions de quartier;
  • Quartier - prĂ©vision des prix de l'immobilier dans la ville;
  • Classification immobilière - classification du type de propriĂ©tĂ© en tenant compte de l'immobilier, des communications par satellite et de la vue sur la rue;
  • Recommender - un système de recommandation des 5 meilleurs objets immobiliers qui correspondent Ă  la recherche de l'utilisateur;
  • Prix ​​du logement - prĂ©diction du prix du logement en utilisant la rĂ©gression linĂ©aire et le GBR;
  • House Price Portland - prĂ©vision des prix des logements Ă  Portland;
  • Zillow Prediction - PrĂ©visions de score Zillow faites par Kaggle.

17.2. Loyer et leasing



18. Utilitaires


18.1. Énergie électrique



18.2. Charbon, pétrole et gaz



18.3. Pollution de l'eau


  • Eau salubre - prĂ©diction des troubles de la qualitĂ© de l'eau potable basĂ©e sur la santĂ© humaine aux États-Unis;
  • Hydrology Data - un ensemble de fonctions pratiques pour Ă©tudier les donnĂ©es sur l'eau en Python;
  • Observatoire de l'eau - surveillance du niveau de l'eau dans les lacs et les rĂ©servoirs Ă  l'aide d'images satellites;
  • Conduites d'eau - utilisation de l'apprentissage automatique pour trouver des conduites d'eau dans des photographies aĂ©riennes;
  • ModĂ©lisation de l'eau - Système de modĂ©lisation communautaire australien pour Ă©valuer les ressources en eau;
  • Restrictions de sĂ©cheresse - analyse de l'utilisation de l'eau Ă  Los Angeles;
  • PrĂ©diction des inondations - application de LSTM aux donnĂ©es sur le niveau d'eau des rivières;
  • DĂ©bordement des eaux usĂ©es - Analyse de dĂ©bordement sanitaire (SSO);
  • La prĂ©vision de la qualitĂ© de l'air est la prĂ©vision de la qualitĂ© de l'air (aq) Ă  Beijing et Ă  Londres au cours des prochaines 48 heures.

18.4. La logistique



19. Commerce de gros et de détail


19.1. Vente en gros



19.2. Commerce de détail



Sur ce point, notre article sur l'application du ML et du DS dans l'industrie a pris fin. J'espère que vous avez appris quelque chose de nouveau par vous-même. Si vous avez quelque chose que vous pouvez partager, écrivez dans les commentaires.

Plus d'informations sur le machine learning et la Data Science dans mon compte sur Habré et sur la chaîne de télégramme Neuron , abonnez-vous pour ne pas manquer les prochains articles.

Toutes les connaissances!

Source: https://habr.com/ru/post/fr462769/


All Articles