Informe de la reunión de PyDaCon en Mail.ru Group, 22 de junio



A finales de junio, se celebró una reunión en la oficina de Moscú, donde se recopilaron 2 secciones: informes sobre Python, cuya composición se formó sobre la base de una lista general de informes a PyCon Rusia y la pista de PyData de la reunión de PyData Moscú . Se recogieron presentaciones, grabaciones de informes y pequeños comentarios bajo el corte.


"Cómo usar JupyterHub al 100% en el ejemplo de ML-school DataGym y Lamoda"

Petr Ermakov, Senior Data Scientist en Lamoda y Data Coach en DataGym

Hace más de dos años hablé de usar jupyter al 100%. Pero, ¿y si no estás solo? ¿Cómo llevarse bien en una máquina a 20 estudiantes que estudian ML, o un equipo RND de 15? Recetas preparadas, recomendaciones y rastrillo recogido.


Presentación



"SQL botkneki: encontrar y eliminar cuellos de botella al escalar"

Mikhail Novikov, desarrollador principal, Fasttrack (fstrk.io)

Estás comenzando un nuevo proyecto. Instale el marco web, el marco ORM, escriba modelos, haga consultas a la base de datos. Todo va bien Entonces, 100.000 usuarios acuden a usted, y el proyecto se bloquea bajo carga. Tus acciones Tuvimos tal situación hace seis meses. Te diré cómo encontramos una salida, mostrar nuestros enfoques para encontrar cuellos de botella, servicios que ayudan en esto. Y explicaré por qué el ORM de vainilla es malo.


Presentación



"Localización de contenido y elementos de interfaz"

Alina Krasavina, Desarrolladora Principal, MAPS.ME, Grupo Mail.ru

Una historia sobre cómo se organiza la localización en el sitio del servidor MAPS.ME. Una pequeña historia conmovedora sobre el dolor de los administradores de contenido y la superación de los desarrolladores de back-end en Django.


Presentación



"Comparación de las tecnologías aiopg y asyncpg"

Alexey Firsov lesha_firs , desarrollador principal de aio-libs / aiopg

Veamos cómo funcionan dos tecnologías completamente diferentes, aiopg y asyncpg, veamos cómo funcionan. Lo que es importante, no compararemos la velocidad.


Presentación



“Diseño de tuberías en proyecto de PNL”

Vitaliy Radchenko, científico de datos, YouScan

En el informe, nos centraremos en las mejores prácticas mundiales (AllenNLP) y nuestra propia experiencia. Le diremos cómo estructurar su canalización y las características de cada uno de sus componentes: cómo formatear datos entrantes, iteradores de acuerdo con el conjunto de datos, cómo debería ser el diccionario, preparación de datos, etc. Se darán ejemplos de problemas reales y se mostrará cómo esto ayuda en la reproducibilidad y la facilidad de uso.


Presentación



“Fluimos hacia abajo y Blendim. Análisis de bibliotecas populares de Python »

Dmitry Buslov, Arquitecto Senior de Soluciones Comerciales, SAP CIS

En el informe, hablaremos sobre las bibliotecas más populares para la formación de conjuntos. Comencemos con un conjunto simple en Sklearn-e, luego ensamble manualmente el apilamiento más simple en un par de líneas de código, y luego considere las bibliotecas más populares: Vecstack, Heamy, Pystacknet, Mlxtend, Mlens.


Presentación



PyMC3 - Modelado estadístico bayesiano en Python

Maxim Kochurov, PyMC Dev / Samsung AI / Skoltech

Las estadísticas bayesianas comenzaron a debatirse recientemente en el contexto del aprendizaje profundo. Desafortunadamente, esto oculta su principal ventaja sobre los enfoques estándar de aprendizaje automático. A diferencia de los modelos de caja negra, el enfoque bayesiano para el modelado de caja blanca. La caja blanca es buena y mala. Se requiere que el analista comprenda completamente la naturaleza del problema, solo entonces el enfoque bayesiano se usa a plena capacidad. Nos permite tener en cuenta no solo lo que nos dicen los "datos", sino también lo que nos dice el sentido común. El informe discutirá por qué y cuándo todo esto es necesario y cómo realizar e interpretar dicho análisis en Python.


Presentación



"'Kiss-kis, inhalame a través de kes' o lo que dicen los amantes del rap: Python para el modelado temático de los comentarios de VKontakte"

Dmitry Sergeev, Universidad de Aalto / DataGym

Mostraremos cómo recopilar 10 millones de comentarios utilizando las API de VKontakte y YouTube, veremos de qué hablan los usuarios de diferentes géneros musicales y daremos respuestas a preguntas tan importantes como:

  • ¿Puede el modelado tópico ayudar con los géneros de agrupamiento?
  • ¿Hay algo en común entre los oyentes de chanson y jazz?
  • ¿Cómo medir la proximidad de Kirkorov a Antokha MS?


Presentación

Estén atentos para los próximos eventos aquí .

Source: https://habr.com/ru/post/460555/


All Articles