Pelatihan Ilmu Data di perusahaan dan mitap tematik di Voronezh



Pada 25 Mei, pertemuan Metaconf kedua akan diadakan di Voronezh, kali ini didedikasikan untuk pembelajaran mesin. Ada lima laporan dalam program mitap, pendaftaran gratis tersedia di sini . Secara khusus, Anton Dolgikh, pakar DataArt pada proyek-AI di bidang perawatan kesehatan, akan berbicara tentang β€œModel Probabilitas Jaringan Neural Bahasa Alam”. Hari ini kami meminta anton untuk berbicara tentang pengalaman sistematisasi pengetahuan pembelajaran mesin dalam DataArt.

Ruang lingkup ML terus berkembang (dari layanan kesehatan ke industri perjalanan). Di dalam DataArt, pada titik tertentu, jumlah permintaan pengembangan ML melebihi nilai kritis. Sebelumnya, kami dapat memecahkan masalah seperti itu oleh para insinyur yang bekerja di perusahaan.

Ketika menjadi sulit untuk dikelola dengan sumber daya kita sendiri, dua jalur pengembangan menjadi jelas: untuk mempekerjakan karyawan baru atau melatih spesialis dalam perusahaan. Dalam kasus pertama, kami menghadapi risiko bahwa pengembang ML yang kami sewa setelahnya tidak langsung jatuh ke dalam proyek baru dari bidang profesional kami. Pada saat yang sama, orang-orang yang secara sempit terlibat dalam pembelajaran mesin biasanya tidak siap untuk terlibat, misalnya, dalam pengembangan fullstack. Oleh karena itu, kami mengandalkan insinyur DataArt yang tertarik untuk berkembang menuju ML, tetapi yang dapat kembali ke pekerjaan sebelumnya jika perlu.

Proses persiapan perlu disistematisasikan. Sepertinya Internet dipenuhi dengan banyak kursus online dan video. Tetapi untuk berkembang secara produktif, seseorang membutuhkan vektor pengembangan - mulai dari mendengarkan secara acak ke kursus apa pun, tidak banyak gunanya.

Apa yang telah kami lakukan:

  1. Pertama-tama, mereka membentuk inti - kelompok inisiatif rekan kerja dengan pengalaman dan keahlian paling banyak di berbagai bidang pembelajaran mesin. Mereka menyiapkan serangkaian presentasi, membuat ikhtisar kursus yang ada, dan membuat rekomendasi: kursus mana yang perlu Anda ambil untuk memperoleh keterampilan yang relevan dengan tugas-tugas yang dipecahkan DataArt.
  2. Kami menyelenggarakan kursus matematika. Jelas, ML secara inheren statistik matematika dan metode optimisasi. Untuk memahami dan menggunakan metode pembelajaran mesin dengan benar, diperlukan pengetahuan matematika tertentu. Pada pandangan pertama, spesialis yang telah menerima pendidikan teknis selalu mengenal matematika dengan baik. Namun dalam praktiknya, ternyata keterampilan itu dilupakan dengan sangat cepat. Ini memaksakan pembatasan pada kursus: perusahaan, tidak seperti universitas, tidak dapat memberikan pengetahuan mendasar, tetapi pengetahuan harus memadai dan cukup dalam. Kami mengundang seorang guru dari luar untuk membaca kursus (kolega kami terlalu sibuk). Program ini difokuskan pada bidang yang berhubungan langsung dengan pembelajaran mesin: aljabar linier, analisis, teori probabilitas, metode optimasi. Kursus ini dilengkapi dengan kelas reguler dengan para ahli, di mana berdasarkan teori kami mempertimbangkan masalah praktis dari proyek-proyek dengan pembelajaran mesin.
  3. Setiap bulan, spesialis ML kami melakukan seminar pendidikan tentang pencapaian terbaru di bidang ini. Rekaman seminar tersedia untuk semua karyawan perusahaan.
  4. Selain seminar, spesialis DataArt ML secara teratur menerbitkan ringkasan materi menarik (metode, artikel, buku) dengan anotasi dan komentar singkat.

Perusahaan mendukung inisiatif ini, anggaran dialokasikan untuk pembelian literatur dan partisipasi kolega dalam konferensi, untuk program besi dan mentoring. Hasil pelatihan pendampingan individu adalah prototipe siap pakai yang dapat digunakan di konferensi atau pada pertemuan dengan pelanggan potensial. Sebagai contoh, kita dapat mengutip hasil karya ahli kami Andrei Sorokin - model yang mendeteksi dan mengklasifikasikan lesi kulit ( arxiv.org/pdf/1807.05979.pdf ). Untuk mengoptimalkan model yang dihasilkan untuk digunakan pada perangkat seluler, karyawan hanya membantu dalam kerangka program mentoring. Model ini mengambil tempat ke-12 dalam kompetisi internasional ISIC 2018 , mengalahkan tidak hanya peserta individu, tetapi juga tim universitas.

Sistematisasi proses di atas memungkinkan kami untuk dengan cepat dan ahli memproses semua permintaan dari bidang pembelajaran mesin yang datang ke DataArt dari pelanggan potensial. Kami telah menyiapkan materi pemasaran, dan tim penjualan selalu merupakan pakar yang dapat menjawab pertanyaan pelanggan. Beberapa proyek telah berhasil diselesaikan.

Seperti banyak perusahaan teknologi besar, DataArt meningkatkan keahlian dan program pendidikan untuk audiens eksternal. Pada 25 Mei, Voronezh mengadakan pertemuan Machine Learning terbuka, para peserta yang belajar tentang tren dalam teknologi ML, masalah dan tugas yang dapat diselesaikan dengan bantuan mereka, tentang proyek-proyek kehidupan nyata yang menggunakan metode pembelajaran mesin dan kecerdasan buatan.

Source: https://habr.com/ru/post/id452996/


All Articles