Meu nome é Sasha e adoro aprendizado de máquina, além de ensinar as pessoas. Atualmente, supervisiono programas educacionais no Centro de Ciência da Computação e sou bacharel em análise de dados na Universidade Estadual de São Petersburgo. Antes disso, ele trabalhou como analista na Yandex e, ainda mais cedo, como cientista: ele estava envolvido em modelagem matemática no ICT SB RAS.
Neste post, quero contar o que surgiu da idéia de lançar treinamentos de aprendizado de máquina para estudantes, graduados da Universidade Estadual de Novosibirsk e para todos.

Há muito tempo eu queria organizar um curso especial para me preparar para competições de análise de dados no Kaggle e outras plataformas. Pareceu uma ótima idéia:
- Os alunos e todos os participantes colocarão em prática conhecimentos teóricos e ganharão experiência na solução de problemas em concursos públicos.
- Os estudantes que ocupam os primeiros lugares em tais competições têm uma boa influência sobre a atratividade da NSU para candidatos, estudantes e graduados. Com exercícios de programação esportiva, acontece o mesmo.
- Esse curso especial complementa e expande perfeitamente o conhecimento fundamental: os participantes implementam independentemente modelos de aprendizado de máquina, geralmente se unem em equipes que competem em nível global.
- Outras universidades já realizaram esse treinamento, então eu esperava o sucesso do curso especial na NSU.
Lançamento
O Novosibirsk Academgorodok é um terreno muito fértil para tais empreendimentos: estudantes, graduados e professores do Centro de Ciência da Computação e fortes departamentos técnicos, por exemplo, FIT, MMF, FF, forte apoio da administração da NSU, uma comunidade ativa de ODS, engenheiros e analistas experientes de várias empresas de TI. Ao mesmo tempo, aprendemos sobre o programa de bolsas da
Botan Investments - o fundo apoia equipes que mostram bons resultados em competições esportivas de ML.
Encontramos uma audiência no NSU para reuniões semanais, criamos uma sala de bate-papo no Telegram e, a partir de 1º de outubro, começamos com estudantes e graduados do centro de CS. 19 pessoas vieram para a primeira lição. Seis deles se tornaram participantes regulares do treinamento. No total, durante o ano acadêmico, 31 pessoas compareceram à reunião pelo menos uma vez.
Primeiros resultados
Nós nos encontramos com os caras, trocamos experiências, discutimos competições e um plano aproximado para o futuro. Eles rapidamente perceberam que a luta por vagas em competições de análise de dados é um trabalho cansativo regular, semelhante ao trabalho em tempo integral não remunerado, mas muito interessante e emocionante :) Um dos participantes, Maxim Kaggle-master, nos aconselhou a avançar individualmente nas competições. , e apenas algumas semanas depois dessa equipe, considerando a pontuação pública. Nós fizemos isso! No treinamento em tempo integral, discutimos modelos, artigos científicos e os meandros das bibliotecas Python e, juntos, resolvemos problemas.
O semestre do outono resultou em três medalhas de prata em duas competições Kaggle:
TGS Salt Identification e
PLAsTiCC Astronomical Classification . E um terceiro lugar na competição CFT por erros de digitação com o primeiro dinheiro ganho (no dinheiro, como dizem os kegglers experientes).
Outro resultado indireto muito importante do curso especial foi o lançamento e a configuração do cluster da Universidade Estadual da Rússia. Seu poder de computação melhorou significativamente nossa vida competitiva: 40 CPUs, 755Gb de RAM, 8 GPUs NVIDIA Tesla V100.

Antes disso, sobrevivíamos da melhor maneira possível: contava com laptops e desktops pessoais, no Google Colab e no Kaggle-kernels. Uma equipe ainda tinha um script auto-escrito que salvou o modelo automaticamente e reiniciou o cálculo, que foi interrompido pelo prazo.
No semestre da primavera, continuamos a reunir, trocar achados bem-sucedidos e conversar sobre nossas decisões de concorrência. Novos participantes interessados começaram a vir até nós. No semestre da primavera, já levou apenas um ouro, três prata e nove bronzes em oito competições no Kaggle:
PetFinder ,
Santander ,
resolução de pronome de gênero ,
identificação de baleias ,
Quora ,
Google Marcos e outros, bronze no
desafio Recco , terceiro lugar na Copa Changellenge >> e primeiro lugar (novamente no dinheiro) na competição de aprendizado de máquina no Yandex
Programming Championship .
O que os participantes do treinamento dizem?
Mikhail Karchevsky“Estou muito feliz que essas atividades estejam sendo realizadas em nosso país na Sibéria, pois acredito que a participação em competições é a maneira mais rápida de dominar o ML. Para esses concursos, o ferro é caro o suficiente para comprar por conta própria, mas aqui você pode experimentar idéias de graça. ”
Kirill Broadt“Antes do advento do ml-training, eu não participava particularmente de competições, exceto as de treinamento e hindus: não entendi o motivo disso, pois tinha trabalho no campo da MO e estou familiarizado com isso. O primeiro semestre foi como ouvinte. E a partir do segundo semestre, assim que os recursos de computação apareceram, pensei, por que não participar. E isso me chupou. A tarefa, os dados e as métricas foram inventados e preparados para você, pegue e use todo o poder do MO, verifique os modelos e as técnicas mais avançadas. Se não fosse por treinamento e, não menos importante, por recursos de computação, não começaria a participar em breve. "
Andrey Shevelev“O treinamento de ML pessoalmente me ajudou a encontrar pessoas com idéias semelhantes, com as quais pude aprofundar meus conhecimentos no campo de aprendizado de máquina e análise de dados. Também é uma ótima opção para quem não tem muito tempo livre para analisar e mergulhar de maneira independente no tópico de concursos, mas ainda quer estar no assunto ".
Junte-se a nós
As competições em Kaggle e em outros locais aprimoram habilidades práticas e rapidamente se transformam em trabalhos interessantes no campo da ciência de dados. As pessoas que participaram de uma competição difícil juntas tornam-se colegas e continuam a resolver com êxito as tarefas de trabalho. Isso aconteceu conosco: Mikhail Karchevsky, junto com um amigo da equipe, passou a trabalhar na mesma empresa no sistema de recomendação.
Com o tempo, planejamos expandir essa atividade com publicações científicas e participação em conferências de aprendizado de máquina. Junte-se a nós como participantes ou especialistas em Novosibirsk - escreva para
mim ou
Kirill . Organize treinamentos semelhantes em suas cidades e universidades.
Aqui está uma pequena folha de dicas que o ajudará a dar os primeiros passos:
- Considere um local e horário convenientes para as aulas regulares. Ótimo - 1-2 vezes por semana.
- Escreva para as partes interessadas em potencial sobre a primeira reunião. Antes de tudo, são estudantes de universidades técnicas participantes de ODS.
- Obtenha uma sala de bate-papo para discutir assuntos atuais: Telegrama, VK, WhatsApp ou qualquer outro mensageiro conveniente para a maioria.
- Mantenha um plano de aula público, uma lista de competições e participantes, siga os resultados.
- Em universidades, institutos de pesquisa ou empresas próximas, encontre poder ou subsídios de computação gratuitos para eles.
- LUCRO!