
Pada akhir Juni, sebuah pertemuan diadakan di kantor Moskow di mana 2 bagian dikumpulkan: laporan tentang Python, yang komposisinya dibentuk berdasarkan daftar umum laporan ke PyCon Rusia dan jalur
PyData dari
pertemuan PyData Moscow . Presentasi, rekaman laporan dan komentar kecil dikumpulkan di bawah potongan.

"Cara menggunakan JupyterHub hingga 100% pada contoh ML-school DataGym dan Lamoda"
Petr Ermakov, Ilmuwan Data Senior di Lamoda dan Pelatih Data di
DataGymLebih dari dua tahun yang lalu
saya berbicara tentang menggunakan jupyter 100%. Tetapi bagaimana jika Anda tidak sendirian? Bagaimana cara bergaul dengan satu mesin untuk 20 siswa yang belajar ML, atau tim RND 15? Resep siap pakai, rekomendasi dan menyapu dikumpulkan.

"SQL botkneki: menemukan dan menghilangkan hambatan saat penskalaan"
Mikhail Novikov, Pengembang Utama, Fasttrack (fstrk.io)
Anda memulai proyek baru. Instal kerangka kerja web, kerangka kerja ORM, tulis model, buat permintaan basis data. Semuanya baik-baik saja. Lalu 100.000 pengguna mendatangi Anda - dan proyek macet karena memuat. Tindakan Anda? Kami memiliki situasi seperti itu enam bulan lalu. Saya akan memberi tahu Anda bagaimana kami menemukan jalan keluar, menunjukkan pendekatan kami untuk menemukan kemacetan, layanan yang membantu dalam hal ini. Dan saya akan menjelaskan mengapa vanilla ORM itu jahat.

“Lokalisasi konten dan elemen antarmuka”
Alina Krasavina, Pengembang Utama, MAPS.ME, Grup Mail.ru
Sebuah cerita tentang bagaimana lokalisasi diatur di situs server MAPS.ME. Sebuah cerita menyentuh kecil tentang rasa sakit dari manajer konten dan mengatasi pengembang backend di Django.

“Perbandingan teknologi aiopg & asyncpg”
Alexey Firsov
lesha_firs , pengembang utama aio-libs / aiopg
Mari kita lihat bagaimana dua teknologi yang sama sekali berbeda aiopg & asyncpg bekerja - mari kita lihat cara kerjanya. Yang penting, kami tidak akan membandingkan kecepatan.

“Desain Saluran Pipa dalam Proyek NLP”
Vitaliy Radchenko, Ilmuwan Data, YouScan
Dalam laporan tersebut, kami akan fokus pada praktik terbaik dunia (AllenNLP) dan pengalaman kami sendiri. Kami akan memberi tahu Anda bagaimana menyusun pipa Anda dan fitur-fitur dari masing-masing komponennya: cara memformat data yang masuk, iterator sesuai dengan dataset, seperti apa kamus itu, persiapan data, dll. Contoh-contoh dari masalah nyata akan diberikan dan akan ditunjukkan bagaimana ini membantu dalam reproduktifitas dan kemudahan lebih lanjut. gunakan.

“Kami mengalir ke bawah dan Blendim. Parsing Perpustakaan Python Populer »
Dmitry Buslov, Arsitek Solusi Bisnis Senior, SAP CIS
Dalam laporan itu, kita akan berbicara tentang perpustakaan paling populer untuk pembentukan ansambel. Mari kita mulai dengan ansambel sederhana di Sklearn-e, kemudian secara manual merakit susunan paling sederhana dalam beberapa baris kode, dan kemudian mempertimbangkan perpustakaan paling populer: Vecstack, Heamy, Pystacknet, Mlxtend, Mlens.

PyMC3 - Pemodelan Statistik Bayesian dengan Python
Maxim Kochurov, PyMC Dev / Samsung AI / Skoltech
Statistik Bayesian baru-baru ini mulai dibahas dalam konteks pembelajaran yang mendalam. Sayangnya, ini menyembunyikan keunggulan utamanya dibandingkan pendekatan pembelajaran mesin standar. Tidak seperti model kotak hitam, pendekatan Bayesian untuk pemodelan kotak putih. Kotak putih itu baik dan buruk. Analis dituntut untuk sepenuhnya memahami sifat masalah, hanya kemudian pendekatan Bayesian digunakan pada kapasitas penuh. Ini memungkinkan kita untuk memperhitungkan tidak hanya apa yang “data beri tahu”, tetapi juga apa yang “akal sehat memberi tahu kita”. Laporan ini akan membahas mengapa dan kapan semua ini diperlukan dan bagaimana melakukan dan menafsirkan analisis semacam itu dengan python.

"'Kiss-kis, tarik napas saya melalui kes' atau apa yang dikatakan pecinta rap: Python untuk pemodelan tematik komentar VKontakte"
Dmitry Sergeev, Universitas Aalto /
DataGymKami akan menunjukkan cara mengumpulkan 10 juta komentar menggunakan VKontakte dan YouTube API, melihat apa yang didengar pengguna tentang berbagai genre musik, dan memberikan jawaban untuk pertanyaan penting seperti:
- Dapatkah pemodelan topikal membantu dengan genre clustering?
- Adakah kesamaan antara pendengar chanson dan jazz?
- Bagaimana mengukur kedekatan Kirkorov ke Antokha MS?
Tetap
disini untuk acara mendatang di
sini .