
Ende Juni fand im Moskauer Büro ein Treffen statt, bei dem zwei Abschnitte gesammelt wurden: Berichte über Python, deren Zusammensetzung auf der Grundlage einer allgemeinen Liste von Berichten an PyCon Russia und des PyData-Tracks vom
PyData -
Treffen in Moskau erstellt wurde . Präsentationen, Aufzeichnungen von Berichten und kleine Kommentare wurden unter dem Schnitt gesammelt.

"Wie man JupyterHub zu 100% am Beispiel von DataGym und Lamoda der ML-Schule einsetzt"
Petr Ermakov, Senior Data Scientist bei Lamoda und Data Coach bei
DataGymVor mehr als zwei Jahren habe
ich über die 100% ige Verwendung von Jupyter
gesprochen . Aber was ist, wenn Sie nicht allein sind? Wie komme ich mit einer Maschine zu 20 Studenten, die ML studieren, oder einem 15-köpfigen RND-Team? Fertige Rezepte, Empfehlungen und gesammelter Rechen.

"SQL botkneki: Engpässe beim Skalieren finden und beseitigen"
Mikhail Novikov, Hauptentwickler, Fasttrack (fstrk.io)
Sie starten ein neues Projekt. Installieren Sie das Webframework, das ORM-Framework, schreiben Sie Modelle und führen Sie Datenbankabfragen durch. Alles läuft gut. Dann kommen 100.000 Benutzer zu Ihnen - und das Projekt stürzt unter Last ab. Deine Handlungen? Wir hatten vor sechs Monaten eine solche Situation. Ich werde Ihnen sagen, wie wir einen Ausweg gefunden haben, und unsere Ansätze zur Suche nach Engpässen und Dienstleistungen zeigen, die dabei helfen. Und ich werde erklären, warum Vanille-ORM böse ist.

"Lokalisierung von Inhalten und Schnittstellenelementen"
Alina Krasavina, Hauptentwicklerin, MAPS.ME, Mail.ru Group
Eine Geschichte darüber, wie die Lokalisierung auf der MAPS.ME-Server-Site angeordnet ist. Eine kleine bewegende Geschichte über den Schmerz von Content Managern und die Überwindung von Backend-Entwicklern auf Django.

"Vergleich von Aiopg- und Asyncpg-Technologien"
Alexey Firsov
lesha_firs , Hauptentwickler von aio-libs / aiopg
Mal sehen, wie zwei völlig unterschiedliche Technologien aiopg & asyncpg funktionieren - mal sehen, wie sie funktionieren. Was wichtig ist, werden wir die Geschwindigkeit nicht vergleichen.

"Pipeline-Design im NLP-Projekt"
Vitaliy Radchenko, Datenwissenschaftler, YouScan
In dem Bericht werden wir uns auf die weltweit besten Praktiken (AllenNLP) und unsere eigenen Erfahrungen konzentrieren. Wir werden Ihnen erklären, wie Sie Ihre Pipeline und die Funktionen der einzelnen Komponenten strukturieren: wie Sie eingehende Daten formatieren, Iteratoren gemäß dem Datensatz formatieren, wie das Wörterbuch aussehen sollte, Datenaufbereitung usw. Es werden Beispiele aus realen Problemen gegeben und gezeigt, wie dies zur Reproduzierbarkeit und zur weiteren Vereinfachung beiträgt verwenden.

„Wir fließen runter und Blendim. Analysieren beliebter Python-Bibliotheken »
Dmitry Buslov, Senior Business Solutions Architect, SAP CIS
In dem Bericht werden wir über die beliebtesten Bibliotheken für die Bildung von Ensembles sprechen. Beginnen wir mit einem einfachen Ensemble in Sklearn-e, setzen dann das einfachste Stapeln manuell in ein paar Codezeilen zusammen und betrachten dann die beliebtesten Bibliotheken: Vecstack, Heamy, Pystacknet, Mlxtend, Mlens.

PyMC3 - Bayesianische statistische Modellierung in Python
Maxim Kochurov, PyMC Dev / Samsung AI / Skoltech
Die Bayes'sche Statistik wurde kürzlich im Kontext des tiefen Lernens diskutiert. Leider verbirgt dies seinen Hauptvorteil gegenüber Standardansätzen des maschinellen Lernens. Im Gegensatz zu Black-Box-Modellen ist der Bayes'sche Ansatz zur White-Box-Modellierung. White-Box ist sowohl gut als auch schlecht. Der Analytiker muss die Natur des Problems vollständig verstehen, nur dann wird der Bayes'sche Ansatz mit voller Kapazität verwendet. Es ermöglicht uns, nicht nur zu berücksichtigen, was „Daten uns sagen“, sondern auch, was „gesunder Menschenverstand uns sagt“. In dem Bericht wird erörtert, warum und wann dies alles erforderlich ist und wie eine solche Analyse in Python durchgeführt und interpretiert werden kann.

"'Kiss-kis, inhaliere mich durch kes' oder was Rap-Liebhaber sagen: Python für die thematische Modellierung von VKontakte-Kommentaren"
Dmitry Sergeev, Aalto University /
DataGymWir werden zeigen, wie Sie mithilfe der VKontakte- und YouTube-APIs 10 Millionen Kommentare sammeln, sehen, worüber Benutzer verschiedene Musikgenres hören, und Antworten auf so wichtige Fragen geben wie:
- Kann topische Modellierung beim Clustering von Genres helfen?
- Gibt es Gemeinsamkeiten zwischen Chanson- und Jazzhörern?
- Wie kann man die Nähe von Kirkorov zu Antokha MS messen?
Seien Sie gespannt auf bevorstehende Veranstaltungen
hier .