Mi nombre es Sasha y me encanta el aprendizaje automático, además de enseñar a la gente. Ahora superviso programas educativos en el Computer Science Center y lidero una licenciatura en análisis de datos en la Universidad Estatal de San Petersburgo. Antes de eso, trabajó como analista en Yandex, e incluso antes como científico: se dedicó al modelado matemático en ICT SB RAS.
En esta publicación quiero contarles lo que surgió de la idea de lanzar capacitaciones de aprendizaje automático para estudiantes, graduados de la Universidad Estatal de Novosibirsk y todos.

Hace tiempo que quería organizar un curso especial para prepararme para competiciones de análisis de datos en Kaggle y otras plataformas. Esto parecía una gran idea:
- Los estudiantes y todos los recién llegados pondrán en práctica el conocimiento teórico y ganarán experiencia en la resolución de problemas en competiciones públicas.
- Los estudiantes que ocupan los primeros lugares en tales competencias tienen una buena influencia en el atractivo de NSU para los solicitantes, estudiantes y graduados. Con los entrenamientos de programación deportiva, sucede lo mismo.
- Un curso tan especial complementa perfectamente y expande el conocimiento fundamental: los participantes implementan independientemente modelos de aprendizaje automático, a menudo unidos en equipos que compiten a nivel global.
- Otras universidades ya han llevado a cabo dicha capacitación, por lo que esperaba el éxito del curso especial en NSU.
Lanzamiento
El Novosibirsk Academgorodok es un terreno muy fértil para tales empresas: estudiantes, graduados y maestros del Centro de Ciencias de la Computación y departamentos técnicos sólidos, por ejemplo, FIT, MMF, FF, un fuerte apoyo de la administración NSU, una comunidad activa de SAO, ingenieros experimentados y analistas de varias empresas de TI. Al mismo tiempo, aprendimos sobre el programa de subvenciones de
Botan Investments : el fondo apoya a los equipos que muestran buenos resultados en las competiciones deportivas de ML.
Encontramos una audiencia en NSU para reuniones semanales, creamos una sala de chat en Telegram y, desde el 1 de octubre, comenzamos con estudiantes y graduados del centro CS. 19 personas vinieron a la primera lección. Seis de ellos se convirtieron en participantes regulares en el entrenamiento. En total, durante el año académico, 31 personas asistieron a la reunión al menos una vez.
Primeros resultados
Nos reunimos con los chicos, intercambiamos experiencias, discutimos concursos y un plan aproximado para el futuro. Rápidamente se dieron cuenta de que la lucha por los lugares en las competiciones de análisis de datos es un trabajo agotador regular, similar al trabajo a tiempo completo no remunerado, pero muy interesante y emocionante :) Uno de los participantes, Maxim Kaggle-master, nos aconsejó avanzar individualmente en las competiciones. , y solo unas pocas semanas después de ese equipo, dado el puntaje público. Lo hicimos! En la capacitación a tiempo completo, discutimos modelos, artículos científicos y las complejidades de las bibliotecas de Python, y juntos resolvimos problemas.
El semestre de otoño resultó en tres medallas de plata en dos competiciones de Kaggle:
Identificación de sal TGS y
Clasificación astronómica PLAsTiCC . Y un tercer lugar en la competencia de CFT por errores tipográficos con el primer dinero ganado (en el dinero, como dicen los experimentados kegglers).
Otro resultado indirecto muy importante del curso especial fue el lanzamiento y la configuración del grupo de la Universidad Estatal de toda Rusia. Su potencia informática mejoró notablemente nuestra vida competitiva: 40 CPU, 755 Gb de RAM, 8 GPU NVIDIA Tesla V100.

Antes de eso, sobrevivimos lo mejor que pudimos: contamos con computadoras personales y de escritorio, en Google Colab y en Kaggle-kernels. Un equipo incluso tenía un guión autoescrito que guardaba automáticamente el modelo y reiniciaba el cálculo, que se detenía en el límite de tiempo.
En el semestre de primavera, continuamos reuniéndonos, intercambiando hallazgos exitosos y hablando sobre nuestras decisiones de competencia. Nuevos participantes interesados comenzaron a venir a nosotros. Para el semestre de primavera, resultó que ya tenía un oro, tres plata y nueve bronces en ocho competiciones en Kaggle:
PetFinder ,
Santander ,
resolución de pronombres de género ,
identificación de ballenas ,
Quora ,
hitos de Google y otros, bronce en el
desafío de Recco , tercer lugar en Changellenge >> Copa y primer lugar (nuevamente en el dinero) en la competencia de aprendizaje automático en el Yandex
Programming Championship .
¿Qué dicen los participantes en la capacitación?
Mikhail Karchevsky“Estoy muy contento de que tales actividades se estén llevando a cabo en nuestro país en Siberia, ya que creo que la participación en competiciones es la forma más rápida de dominar el LD. Para tales concursos, el hierro es lo suficientemente caro como para comprarlo por su cuenta, pero aquí puede probar ideas gratis ”.
Kirill Broadt“Antes del advenimiento del entrenamiento ml, no participé particularmente en competiciones, excepto para el entrenamiento y las competiciones hindúes: no entendí el punto en esto, ya que tenía trabajo en el campo de MO, y estoy familiarizado con eso. El primer semestre fue como oyente. Y a partir del segundo semestre, tan pronto como aparecieron los recursos informáticos, pensé, ¿por qué no participar? Y me chupó. La tarea, los datos y las métricas fueron inventados y preparados para usted, tómelos y use todo el poder de MO, verifique los modelos y técnicas de última generación. Si no fuera por la capacitación y, no menos importante, por los recursos informáticos, no comenzaría a participar pronto ".
Andrey Shevelev“La capacitación de ML en persona me ayudó a encontrar personas de ideas afines, junto con quienes pude profundizar mis conocimientos en el campo del aprendizaje automático y el análisis de datos. También es una gran opción para aquellos que no tienen mucho tiempo libre para analizar de forma independiente y profundizar en el tema de los concursos, pero aún así quieren estar en el tema ".
Únete a nosotros
Las competencias en Kaggle y otros lugares perfeccionan habilidades prácticas y rápidamente se convierten en un trabajo interesante en el campo de la ciencia de datos. Las personas que participaron juntas en una competencia difícil a menudo se convierten en colegas y continúan resolviendo con éxito las tareas laborales. Esto sucedió con nosotros: Mikhail Karchevsky, junto con un amigo del equipo, se cambió a trabajar en la misma compañía en el sistema de recomendación.
Con el tiempo, planeamos expandir esta actividad con publicaciones científicas y participación en conferencias de aprendizaje automático. Únase a nosotros como participantes o expertos en Novosibirsk; escríbame a
mí o a
Kirill . Organice capacitaciones similares en sus ciudades y universidades.
Aquí hay una pequeña hoja de trucos que lo ayudará a dar los primeros pasos:
- Considere un lugar y un horario convenientes para las clases regulares. Óptimo: 1-2 veces a la semana.
- Escriba a las posibles partes interesadas sobre la primera reunión. En primer lugar, estos son estudiantes de universidades técnicas, participantes de SAO.
- Obtenga una sala de chat para discutir asuntos de actualidad: Telegram, VK, WhatsApp o cualquier otro mensajero conveniente para la mayoría.
- Mantenga un plan de lección público, una lista de competencias y participantes, siga los resultados.
- En las universidades, institutos de investigación o empresas cercanas, encuentre potencia informática gratuita o subvenciones para ellos.
- BENEFICIOS!