
FunCorp baru-baru ini terlibat dalam pengalaman pembelajaran mesin yang indah. Insinyur backend kami mengajarkan mesin pencari untuk membaca meme. Pada kesempatan ini, kami memutuskan untuk mengumpulkan ML-mitap untuk berbagi praktik terbaik kami, dan pada saat yang sama untuk belajar dari spesialis yang lebih berpengalaman dari perusahaan lain, di mana pembelajaran mesin sudah menjadi bagian penting dari bisnis. Kami memutuskan untuk mengumpulkan - mengoleksi. Kami akan menghabiskan 9 Februari. Program ini sedang dalam tahap pemotongan.
Programnya
“Temukan pengalaman peluncuran untuk 90 juta pengguna: lima rekomendasi untuk pengembang ML”, Andrey Zakonov, vk.com
Tentang laporan itu
- Tidak hanya model yang penting: kami merumuskan masalah dengan benar dan memilih metrik.
- Berbagai cara untuk mengoptimalkan solusi Anda untuk memuat.
- Kami mengevaluasi eksperimen dengan benar: kami mempelajari grafik dan bekerja dengan umpan balik.
"Produksi dalam ML", Mark Andreev, Conundrum.ai
Tentang laporan itu
Laporan tersebut akan mencakup:
- tentang jenis prediksi: realtime, offline, realtime + offline
- bagaimana cara mendapatkan dari prototipe dalam Notebook Jupyter ke sebuah wadah
- tentang menentukan skala keputusan dan tentang kontrol kualitas.
“Cara mengajar mesin pencari membaca meme,” Grigory Kuzovnikov, FunCorp
Tentang laporan itu
iFunny adalah aplikasi dengan gambar dan video lucu. Satu-satunya konten tekstual yang ada adalah komentar pengguna, tetapi untuk menarik lalu lintas dari mesin pencari, itu tidak cukup, jadi diputuskan untuk mengekstraksi teks dari gambar dan meletakkannya di halaman. Khusus untuk ini, layanan dibuat bahwa:
- menemukan area yang mengandung "lelucon utama" pada gambar
- ekstrak teks dari area ini
- memeriksa kualitas teks yang dikenal.
Layanan ini ditulis dalam Python menggunakan tensorflow. Tidak seorang pun di tim memiliki pengalaman dalam mengembangkan layanan ML, jadi kami melewati semua tahapan:
- Pernyataan tugas.
- Eksperimen pertama, ketika kami mencoba melakukan sesuatu yang entah bagaimana berhasil, bereksperimen dengan arsitektur jaringan saraf.
- Membuat sampel pelatihan.
- Pelatihan dan pemilihan koefisien model.
- Menciptakan layanan menggunakan model terlatih kami. Membungkusnya dalam wadah buruh pelabuhan.
- Deployment dan layanan mengikat ke monolith php kami. Mulai tunggal.
- Hasil kerja pertama dan komentar dari rental.
- Menggunakan hasil pengakuan dalam pertempuran.
- Analisis hasil.
- Kami di sini sekarang. Kami masih harus mengulang dan melatih kembali model untuk meningkatkan jumlah meme yang dikenali dengan benar.
Pembelajaran Mesin di Yandex.Taxi, Roman Khalkachev, Yandex.Taxi
Tentang laporan itu
Laporan ini akan membahas perangkat Yandex.Taxi.
Akan ada cerita rinci:
- tentang tugas yang kami selesaikan menggunakan analisis data dan teknologi pembelajaran mesin
- tentang jalur perakitan kami untuk pengembangan, pengujian dan peluncuran model pembelajaran mesin dalam produksi
- mari kita lalui semua tahapan: dari percobaan di Notebook Jupyter hingga produksi penuh ML.
“Menyingkirkan kutukan Sklearn: menulis XGBoost dari awal”, Artyom Hapkin, Mail.ru Group
Tentang laporan itu
Sebuah cerita tentang peningkatan. Apa yang perlu Anda ketahui untuk menulisnya sendiri. Apa saja jebakannya, bagaimana cara meningkatkan kerjanya.
Saat ini, sulit untuk membayangkan tempat di mana algoritma ensemble untuk meningkatkan pohon keputusan tidak digunakan. Ini adalah mesin pencari, algoritma peringkat rekomendasi, kompetisi Kaggle, dan banyak lagi.
Ada banyak implementasi algoritma yang sudah jadi: Catboost, Lightgbm, Xgboost, dan banyak lagi. Namun, ada kalanya menggunakan solusi siap pakai di luar kotak tidak terlalu baik - pemahaman tentang algoritme hilang, dan untuk tugas-tugas tertentu implementasi seperti itu tidak begitu cocok, dll.
Dalam laporan ini, kami akan menganalisis prinsip-prinsip algoritma, dan bergerak dari yang sederhana ke kompleks, kami akan menerapkan algoritma Xgboosting kami sendiri, yang kemudian dapat disesuaikan untuk tugas pembelajaran mesin apa pun - klasifikasi, regresi, peringkat, dll.
Informasi lebih lanjut di
TelegramAnda dapat mendaftar di
Timepad . Jumlah tempat terbatas.
Bagi mereka yang tidak bisa datang atau tidak punya waktu untuk mendaftar,
siaran akan disiarkan di
saluran kami.