Hai
Pada 10 November (besok!) Di Moskow, Oktyabr Cinema Center akan menjadi tuan rumah konferensi
Hari Ilmu Data Sberbank yang besar, di mana pemenang SDSJ 2018 akan diberikan, pidato oleh sejumlah besar pakar internasional dan Rusia di bidang Ilmu Data, bagian tentang ML dan penggunaan kecerdasan buatan dalam sains dan bisnis. Dan jauh lebih menarik!
Anda dapat menonton siaran langsung di
sini . Di bawah katom dan
di situs web programnya. Kami juga menggambarkan bagaimana para pemenang Perjalanan Ilmu Pengetahuan Data Sberbank dinilai.
Programnya
Konferensi ini dibagi menjadi beberapa blok tematik, berikut adalah jadwalnya:
Ruang utama11:00 - 11:30. Pembukaan konferensi.
11:30 - 12:30. Diskusi panel "Analisis Data dan Teknologi Kecerdasan Buatan dalam Ekonomi Digital"
12:30 - 13:15. "Metode dan arsitektur yang dikondisikan secara biologis dalam pembelajaran yang mendalam." Sergey Bartunov, Deep Mind
13:15 - 14:00 "Agen Percakapan sebagai Sahabat Digital Cerdas untuk Memahami Emosi Manusia dan Mengungkapkan Emosi." Lee Soo-Young, KAIST
15:00 - 15:45. "Pembelajaran Mesin Otomatis yang Dapat Dikukur." Andrey Spiridonov, H2O
15:45 - 16:30. Diskusi panel "Tren Inovasi: Menggunakan DS / AI dan Meningkatkan Pengalaman Pelanggan"
17:15 - 18:00 Penganugerahan sungguh-sungguh dari para pemenang Sberbank Data Science Journey dan kompetisi
AI Klasik (kompetisi dalam versifikasi menggunakan kecerdasan buatan)
Aula "Sains"12:30 - 13:45 .DS / teknologi AI: AutoML
13:45 - 14:45. Teknologi DS / AI: Visi Komputer
14:45 - 15:45 .DS / teknologi AI: Natural Language Processing (NLP)
15:45 - 16:30 .DS / AI technology: Reinforcement Learning
16:30 - 17:15 .DS / teknologi AI: Speech Analytics
Aula "Bisnis" (aula 1)12:30 - 13:45. Aplikasi DS / AI di bidang perbankan dan keuangan
13:45 - 15:00. Penggunaan DS / AI dalam kedokteran dan bioinformatika
15:00 - 16:15 Penerapan DS / AI di sektor perbankan dan keuangan
16:15 - 17:15. Tulisan tangan: membuat platform untuk penelitian AI
Business Hall (Hall 2)12:30 - 14:45. Penggunaan DS / AI dalam ritel
14:45 - 16:30. Aplikasi industri DS / AI
16:30 - 17:15. Aplikasi DS / AI di media dan telekomunikasi
Balai Komunitas12:30 - 13:15. Presentasi poster "Poster Session Lightning Talk"
13:15 - 15:00. Presentasi proyek terbuka di bidang DS / AI "AI Open Projects"
15:00 - 15:45. Pengambilan Keputusan Kompetisi AI Klasik
15:45 - 17:15. Analisis Persaingan Perjalanan Sains Data Sberbank
Pemenang Perjalanan Sains Data Sberbank
Tahun ini, kami mengusulkan untuk menyelesaikan masalah menggunakan teknologi AutoML. Hingga akhir 3 November, para peserta mengunggah keputusan mereka, dalam 12 jam berikutnya mereka memilih yang terbaik dari keputusan mereka. Sekarang pilihannya adalah untuk juri. Pada konferensi tersebut, kami akan menghargai para pemenang Perjalanan Ilmu Pengetahuan Data Sberbank.
Peserta diberikan set data siap pakai dari Sberbank. Semua 24 dataset yang terlibat dalam kompetisi dikumpulkan oleh berbagai departemen: unit ritel, unit risiko, dan unit teknologi. Mereka semua dilatih secara khusus dan didepersonalisasi. Dasarnya adalah informasi seperti:
- Batas Pembatasan yang Disetujui
- Waktu Pengiriman Kartu
- Berbagai jenis penilaian
- Umpan balik penawaran kartu
- Menanggapi penawaran produk lain
- Kerusakan ATM
- Informasi penarikan tunai ATM
- Saldo akun dan informasi lainnya
Untuk mengevaluasi keputusan, kumpulan dataset dipilih: centang (terbuka untuk peserta), publik (disembunyikan dari peserta, tetapi Anda dapat melihat hasilnya selama kompetisi), pribadi (ditetapkan di mana hasil kompetisi dirangkum)
Dalam setiap set tersebut, ada tiga masalah regresi dan lima masalah klasifikasi biner. Solusi ini bekerja pada kumpulan data berbagai ukuran: dari 1MB dan 300 baris hingga 1GB dan 1mln baris. Sebelum dimulainya kompetisi, juri menyiapkan set data, sistem pengujian telah memeriksanya dalam mode otomatis, dan
sekarang Anda dapat melihat hasilnya di situs web (dengan mempertimbangkan keterbatasan yang terkait dengan intrik).
Keputusan dibuat dalam format arsip dengan kode. Peserta perlu membangun algoritma yang mengimplementasikan siklus penuh untuk menyelesaikan masalah pembelajaran mesin secara otomatis, menerima data sebagai input, dan mengembalikan jawaban yang siap di output.
Keputusan para peserta harus sesuai dengan batasan yang diberikan:
- sumber daya yang tersedia
- solusinya tidak memiliki akses ke sumber daya Internet
- ukuran maksimum arsip yang dikemas dan dibongkar dengan solusi: 1 GB
- arsip dibongkar ke sistem file yang terletak di memori akses acak (ramfs), tersedia untuk solusi penulisan
- sisa isi wadah hanya-baca
- CSV dengan dataset tidak melebihi 3 GB
- Keterbatasan diperlukan untuk mencapai perbandingan yang adil dengan menempatkan peserta dalam kondisi teknis yang sama.
Inilah sistem peringkat dalam kompetisi ini:
- Untuk setiap tugas (dataset), metrik khusus untuk tugas (RMSE untuk regresi, ROC-AUC untuk klasifikasi biner) dipertimbangkan pada bagian uji sampel.
- Untuk setiap tugas (dataset), metrik peserta diterjemahkan ke dalam skala umum sesuai dengan skema berikut. Untuk solusi metrik terbaik (di antara semua solusi yang dikirim dan berhasil diuji) 1 poin diberikan, solusi garis dasar diperkirakan pada 0 poin. Peserta yang berada dalam metrik antara solusi terbaik dan baseline menerima jumlah poin yang proporsional antara 0 dan 1. Keputusan mengenai kualitas dasar baseline diperkirakan pada 0 poin. Jika solusi terbaik dan keputusan dasar adalah sama, maka semua peserta mendapatkan 0 poin. Jika solusi peserta memberikan kesalahan pada tugas atau tidak melewati batas waktu, maka mereka mendapatkan 0 poin untuk tugas ini.
- Hasil akhir dari setiap peserta dianggap sebagai jumlah hasil untuk setiap tugas setelah konversi ke skala umum. Di papan peringkat umum, peserta diberi peringkat berdasarkan hasil akhir.
Hasil kompetisi tersedia di
sini .
Selain klasifikasi utama, para peserta bersaing untuk mendapatkan hadiah dalam nominasi "Keputusan Publik Terbaik". Sepanjang kompetisi, mereka menerbitkan pendekatan mereka untuk memecahkan masalah AutoML di GitHub, dan pemenangnya ditentukan oleh jumlah bintang GItHub.
Konferensi ini akan memiliki bagian terpisah yang didedikasikan untuk SDSJ'18, di mana para pemenang akan berbicara tentang keputusan mereka dan menjawab semua pertanyaan.
Sekali lagi, tinggalkan tautan ke
siaran online konferensi, sehingga semua orang yang tertarik dapat menonton Sberbank Data Science Day.