PyDaCon-Treffen bei Mail.ru Group: 22. Juni



22. Juni Die Mail.ru Group hält ein gemeinsames Treffen mit den Organisatoren der Konferenz PyCon Russia und PyData Moscow ab. Es warten zwei Abschnitte auf Sie: Berichte über Python, deren Zusammensetzung auf der Grundlage einer allgemeinen Liste von Berichten an PyCon Russia und des PyData-Tracks vom PyData Moscow-Treffen erstellt wurde. Das Programm der Veranstaltung: Keynote, technische Berichte, Quiz und viel nützliche Kommunikation.

Keynote: „Wie man JupyterHub am Beispiel von DataGym und Lamoda der ML-Schule zu 100% einsetzt“
Petr Ermakov, Senior Data Scientist bei Lamoda und Data Coach bei DataGym


Vor mehr als zwei Jahren habe ich über die 100% ige Verwendung von Jupyter gesprochen . Aber was ist, wenn Sie nicht allein sind? Wie komme ich mit einer Maschine zu 20 Studenten, die ML studieren, oder einem 15-köpfigen RND-Team? Fertige Rezepte, Empfehlungen und gesammelter Rechen.

Python-Track:
"SQL botkneki: Engpässe beim Skalieren finden und beseitigen"
Mikhail Novikov, Hauptentwickler, Fasttrack (fstrk.io)


Sie starten ein neues Projekt. Installieren Sie das Webframework, das ORM-Framework, schreiben Sie Modelle und führen Sie Datenbankabfragen durch. Alles läuft gut. Dann kommen 100.000 Benutzer zu Ihnen - und das Projekt stürzt unter Last ab. Deine Handlungen?

Wir hatten vor sechs Monaten eine solche Situation. Ich werde Ihnen sagen, wie wir einen Ausweg gefunden haben, und unsere Ansätze zur Suche nach Engpässen und Dienstleistungen zeigen, die dabei helfen. Und ich werde erklären, warum Vanille-ORM böse ist.

"Vergleich von Aiopg- und Asyncpg-Technologien"
Alexey Firsov, Hauptentwickler von aio-libs / aiopg


Mal sehen, wie zwei völlig unterschiedliche Technologien aiopg & asyncpg funktionieren - mal sehen, wie sie funktionieren. Was wichtig ist, werden wir die Geschwindigkeit nicht vergleichen.

PyData Moscow Meetup Track:
"Pipeline-Design im NLP-Projekt"
Vitaliy Radchenko, Datenwissenschaftler, YouScan


In dem Bericht werden wir uns auf die weltweit besten Praktiken (AllenNLP) und unsere eigenen Erfahrungen konzentrieren. Wir werden Ihnen erklären, wie Sie Ihre Pipeline und die Funktionen der einzelnen Komponenten strukturieren: wie Sie eingehende Daten formatieren, Iteratoren gemäß dem Datensatz formatieren, wie das Wörterbuch aussehen sollte, Datenaufbereitung usw. Es werden Beispiele aus realen Problemen gegeben und gezeigt, wie dies zur Reproduzierbarkeit und zur weiteren Vereinfachung beiträgt verwenden.

„Wir fließen runter und Blendim. Analysieren beliebter Python-Bibliotheken »
Dmitry Buslov


In dem Bericht werden wir über die beliebtesten Bibliotheken für die Bildung von Ensembles sprechen. Beginnen wir mit einem einfachen Ensemble in Sklearn-e, setzen dann das einfachste Stapeln manuell in ein paar Codezeilen zusammen und betrachten dann die beliebtesten Bibliotheken: Vecstack, Heamy, Pystacknet, Mlxtend, Mlens.

PyMC3 - Bayesianische statistische Modellierung in Python, Maxim Kochurov, PyMC Dev / Samsung AI / Skoltech


Die Bayes'sche Statistik wurde kürzlich im Kontext des tiefen Lernens diskutiert. Leider verbirgt dies seinen Hauptvorteil gegenüber Standardansätzen des maschinellen Lernens. Im Gegensatz zu Black-Box-Modellen ist der Bayes'sche Ansatz zur White-Box-Modellierung. White-Box ist sowohl gut als auch schlecht. Der Analytiker muss die Natur des Problems vollständig verstehen, nur dann wird der Bayes'sche Ansatz mit voller Kapazität verwendet. Es ermöglicht uns, nicht nur zu berücksichtigen, was „Daten uns sagen“, sondern auch, was „gesunder Menschenverstand uns sagt“. In dem Bericht wird erörtert, warum und wann dies alles erforderlich ist und wie eine solche Analyse in Python durchgeführt und interpretiert werden kann.

"'Kiss-kis, inhaliere mich durch kes' oder was Rap-Liebhaber sagen: Python für die thematische Modellierung von VKontakte-Kommentaren"
Dmitry Sergeev, Aalto University / DataGym


Wir werden zeigen, wie Sie mithilfe der VKontakte- und YouTube-APIs 10 Millionen Kommentare sammeln, sehen, worüber Benutzer verschiedene Musikgenres hören, und Antworten auf so wichtige Fragen geben wie:

  • Kann topische Modellierung beim Clustering von Genres helfen?
  • Gibt es Gemeinsamkeiten zwischen Chanson- und Jazzhörern?
  • Wie kann man die Nähe von Kirkorov zu Antokha MS messen?

Verfolgen und abonnieren Sie die Ereignisse der PyData.Moscow- Community

Teilnehmerversammlung und Anmeldung: 11:00 Uhr. Die Beiträge beginnen: 12:00 Uhr.
Adresse: Leningradsky Prospekt 39, S. 79.

Geben Sie im Registrierungsformular an, zu welchem ​​Abschnitt Sie gehen möchten: Python- oder PyData-Track. Die Registrierung auf einer Strecke verbietet nicht den Besuch einer anderen.

Source: https://habr.com/ru/post/de456076/


All Articles