Penerapan pembelajaran mesin dan ilmu data dalam industri

Habr, halo. Saya menerjemahkan sebuah posting yang berlaku ketat (!) Ke bookmark dan diteruskan ke kolega. Ini memiliki daftar buku catatan dan perpustakaan ML dan Data Science untuk berbagai industri. Semua kode menggunakan Python, dan di-host di GitHub. Mereka akan berguna baik untuk memperluas wawasan seseorang dan untuk meluncurkan startup yang menarik.

gambar

Saya perhatikan bahwa jika ada pembaca yang ingin membantu dan menambahkan proyek yang cocok untuk salah satu sub-sektor, silakan hubungi saya. Saya akan menambahkannya ke daftar. Jadi, mari kita mulai menjelajahi daftar.

1. Real estat dan makanan


1.1. Nutrisi



1.2. Restoran



1.3. Real estat



2. Akuntansi


2.1. Pembelajaran mesin



2.2. Analisis



2.3. Analisis teks



2.4. Data, Parsing, dan API



2.5. Penelitian dan artikel


  • Memahami Analisis Akuntansi - Artikel tentang pentingnya analisis akuntansi.
  • VLFeat adalah perpustakaan terbuka dan portabel dari algoritma visi komputer dengan Matlab toolkit.

2.6. Situs web


  • Rutgers Raw - Penelitian Akuntansi Digital oleh Rutgers.

2.7. Kursus



3. Pertanian


3.1. Ekonomi


  • Harga - perkiraan harga untuk produk pertanian 1;
  • Harga 2 - perkiraan harga untuk produk pertanian 2;
  • Hasil - analisis hasil pertanian di Ukraina;
  • Pemulihan - penggunaan strategis lahan dalam pertanian, dengan mempertimbangkan pemulihan ekosistem;
  • MPR - data pelaporan harga pertanian. Produk Departemen Pertanian AS.

3.2. Pengembangan


  • Segmentasi - segmentasi lahan pertanian menggunakan citra satelit;
  • Water Table - memprediksi kedalaman air tanah di area pertanian;
  • Asisten - laptop dari Asisten Pertanian virtual;
  • Eco-evolusioner - dinamika eko-evolusi;
  • Penyakit - identifikasi penyakit tanaman dan hama menggunakan kerangka Pembelajaran Jauh untuk gambar;
  • Irigasi dan Prediksi Hama - analisis irigasi dan prediksi kemungkinan hama.

4. Perbankan dan asuransi


4.1. Pembiayaan konsumen



4.2. Manajemen dan operasi



4.3. Peringkat



4.4. Penipuan



4.5. Asuransi dan Risiko



4.6. Berguna



gambar

5. Bioteknologi dan sains


5.1. Jenderal



5.2. Urutan



5.3. Chemoinformatika dan penemuan obat


  • Novel Molecules - jaringan konvolusional yang dapat mempelajari fungsi;
  • Automating Chemical Design - membuat molekul baru untuk penelitian yang efektif;
  • Penemuan obat GAN - metode yang menggabungkan model generatif dengan pelatihan dan penguatan;
  • Senyawa penghasil RL diprediksi aktif;
  • One-shot learning - penggunaan pembelajaran mesin di bidang pencarian obat dengan cara yang sederhana dan nyaman.

5.4. Genomik



5.5. Sains


  • Tanaman Penyakit - aplikasi yang mengidentifikasi penyakit pada tanaman menggunakan model pembelajaran yang mendalam;
  • Identifikasi Daun - identifikasi tanaman melalui daun berdasarkan bentuk, warna dan teksturnya;
  • Analisis Tanaman - perpustakaan gambar untuk mendeteksi dan melacak posisi telinga jagung di masa depan atas tanaman jagung;
  • Bibit - bibit tanaman, klasifikasi dari Kaggle;
  • Plant Stress - ontologi yang mengandung stres tanaman;
  • Hierarki Hewan - paket untuk menghitung hierarki dominasi hewan;
  • Identifikasi Hewan - pelatihan identifikasi hewan dalam;
  • Spesies - analisis data besar berbagai spesies hewan;
  • Animal Vocalisations - jaringan generatif untuk vokalisasi hewan;
  • Evolutionary - alat untuk strategi evolusi;
  • Gletser - materi pendidikan tentang gletser.

6. Mesin konstruksi


6.1. Konstruksi



6.2. Rekayasa



6.3. Ilmu material



7. Ekonomi


7.1. Jenderal



7.2. Pembelajaran mesin


  • EconML - pelatihan otomatis dan analisis hubungan sebab dan akibat;
  • Lelang - lelang optimal menggunakan pembelajaran mendalam.

7.3. Perhitungan



8. Pendidikan dan penelitian


8.1. Siswa



8.2. Sekolah



9. Keadaan darurat


9.1. Pencegahan



9.2. Kejahatan



9.3. Ambulans


  • Ambulance Analysis - studi tentang perubahan waktu kedatangan ambulans di Victoria;
  • Lokasi Situs - lokasi ambulan;
  • Pengiriman - aplikasi teori permainan dan simulasi peristiwa diskrit untuk menemukan solusi optimal untuk pengiriman ambulans;
  • Ambulance Allocation - analisis deret waktu tentang keberangkatan ambulans di kota San Diego;
  • Waktu Tanggap - analisis peningkatan waktu respons ambulan;
  • Routing Optimal - sebuah proyek untuk menemukan rute ambulan yang optimal;
  • Analisis Kecelakaan - memprediksi kemungkinan kecelakaan di segmen ini pada waktu tertentu.

9.4. Manajemen bencana



gambar

10. Keuangan


10.1. Perdagangan dan investasi



10.2.



11.


11.1. Jenderal



12. Keadilan, hukum dan peraturan


12.1. Alat-alatnya



12.2. Kebijakan dan Regulasi



12.3. Yurisprudensi



13. Produksi


13.1. Jenderal



13.2. Perawatan



13.3. Kesalahan



13.4. Kualitas



14. Media dan penerbitan


14.1. Pemasaran



15. Fisika


15.1. Jenderal



15.2. Pembelajaran mesin



16. Pemerintah


16.1. Kebijakan sosial



16.2. Amal


  • API Data Sensus - mengekstraksi variabel dari survei 5 tahun komunitas Amerika;
  • Identifikasi Donor - proyek pembelajaran mesin di mana Anda perlu mencari donor untuk amal;
  • Efektivitas Amal - Kumpulkan data online tentang amal untuk memahami efektivitasnya.

16.3. Analisis pemilihan



16.4. Politik


  • Politik Kongres - Dewan Perwakilan Kongres AS;
  • Politico - sebuah platform untuk membuat profil figur publik dalam politik Brasil;
  • Bot - alat dan algoritme untuk menganalisis tweet Paraguay selama pemilihan;
  • Tes Gerrymander - banyak metrik untuk mengukur Gerrymandering;
  • Sentimen - analisis surat kabar untuk keyakinan politik mereka menggunakan sentimen subjektif dari perwakilan partai;
  • DL Politics - Perbandingan antara partai sosialis versus partai populer di Brasil;
  • PAC Money - pengaruh uang PAC pada kebijakan AS;
  • Power Networks - membuat pengawas untuk jaringan korporat dan politik India;
  • Elite - elit politik di AS;
  • Analisis Debat - program untuk menganalisis debat politik;
  • Afiliasi Politik - perkiraan afiliasi politik menggunakan metadata Twitter;
  • Iklan Politik - penyelidikan Facebook tentang iklan dan penargetan politik;
  • Political Identity - model politis multi-politik dari identitas politik;
  • YT Politics - menampilkan kebijakan di YouTube;
  • Ideologi Politik - Studi ideologi politik yang tidak terkontrol menggunakan proyeksi vektor verbal.

17. Real estat, sewa dan leasing


17.1. Real estat



17.2. Sewa dan sewa



18. Utilitas


18.1. Tenaga listrik


  • Harga Listrik - Perbandingan harga listrik di Singapura;
  • Listrik-Batubara Korelasi - penentuan korelasi antara tarif negara untuk listrik dan produksi batubara selama dekade terakhir;
  • Kapasitas Listrik - analisis Los Angeles Times analisis listrik mahal di California;
  • Sistem Listrik - sistem listrik yang optimal untuk negara-negara Eropa;
  • Disagregasi Beban - tata letak muatan cerdas menurut model Markov yang tersembunyi;
  • Perkiraan Harga - perkiraan harga listrik untuk hari yang akan datang di zona perdagangan Jerman dengan jaringan saraf yang dalam;
  • Indeks Karbon - perhitungan COβ‚‚ dan intensitas listrik di wilayah negara tersebut, NERC sejak 2001;
  • Peramalan Permintaan - perkiraan permintaan listrik di Austin;
  • Konsumsi Listrik - perkiraan konsumsi listrik dari survei rumah tangga;
  • Distribusi Listrik Perancis - analisis data listrik yang disediakan oleh jaringan distribusi Perancis (RTE);
  • Pembangkit Listrik Terbarukan - seri waktu dari total kapasitas terpasang;
  • Wind Farm Flow - repositori model aliran farm Wind yang terhubung ke FUSED-Wind;
  • Pembangkit Listrik - kumpulan data berisi 9568 titik data yang dikumpulkan oleh pembangkit listrik siklus gabungan selama 6 tahun (2006-2011).

18.2. Batubara, minyak dan gas



18.3. Polusi air


  • Safe Water - prediksi gangguan kualitas air minum berdasarkan kesehatan manusia di Amerika Serikat;
  • Data Hidrologi - satu set fungsi yang mudah digunakan untuk mempelajari data air dengan Python;
  • Observatorium Air - memantau ketinggian air di danau dan waduk menggunakan gambar satelit;
  • Pipa Air - penggunaan pembelajaran mesin untuk menemukan pipa air dalam foto udara;
  • Pemodelan Air - sistem pemodelan komunitas Australia untuk menilai sumber daya air;
  • Pembatasan Kekeringan - analisis penggunaan air di Los Angeles;
  • Prediksi Banjir - menerapkan LSTM ke data ketinggian air sungai;
  • Sewage Overflow - Sanitary Overflow Analysis (SSO);
  • Prediksi Kualitas Udara adalah prakiraan kualitas udara (aq) di Beijing dan London selama 48 jam ke depan.

18.4. Logistik



19. Perdagangan grosir dan eceran


19.1. Grosir



19.2. Perdagangan eceran



Tentang ini, posting kami pada aplikasi ML dan DS di industri berakhir. Saya harap Anda belajar sesuatu yang baru untuk diri Anda sendiri. Jika Anda memiliki sesuatu yang dapat Anda bagikan sendiri - tulis di komentar.

Informasi lebih lanjut tentang pembelajaran mesin dan Ilmu Data di akun saya di HabrΓ© dan di saluran telegram Neuron , berlangganan agar tidak ketinggalan artikel mendatang.

Semua pengetahuan!

Source: https://habr.com/ru/post/id462769/


All Articles