Viagem ao Alasca ou KDD'19 através dos olhos de uma testemunha ocular

Não é segredo que os cientistas gostam muito de explorar o mundo. Portanto, grandes conferências sempre são realizadas nas capitais históricas e culturais do mundo. Essas cidades são convenientes para visitar pessoas de todo o mundo e são interessantes do ponto de vista turístico. Mas, às vezes, o desejo de explorar o novo e o desconhecido toma conta, e a cidade da conferência se torna, por exemplo, Anchorage, no Alasca. Também não ouviu falar dele antes disso? E este ano uma das maiores conferências KDD'19 foi realizada lá .



Nós do Antiplagiarism não podíamos perder um evento assim e partimos para conhecer aventuras do outro lado do globo. O que aconteceu no KDD 2019 - leia nossa análise!


Minha jornada começou com um voo de 12 horas para Los Angeles, onde o amigo local do meu amigo já havia me encontrado no aeroporto. Inicialmente, planejei andar pela cidade por conta própria, mas o argumento "você não verá nada sem carro em Los Angeles e ninguém tem sorte em levá-lo de volta ao aeroporto em engarrafamentos" pareceu bastante convincente. Bem, sem um carro na cidade dos anjos, você realmente não consegue chegar a lugar algum - praticamente não há transporte público aqui, e o que está está em condições bastante indecentes. LA em si parecia uma lista: enormes engarrafamentos, uma praia em toda a cidade, colinas de Hollywood, Beverly Hills, almoço em um clássico fast food americano e pôr do sol na praia. Mas todas as coisas interessantes tendem a terminar, e o próximo vôo estava me esperando.



Desde que eu voei do outro hemisfério, meu corpo não pensou em nada, então o vôo noturno de cinco horas para o Alasca passou despercebido para mim. De alguma forma, para me recuperar, fui dormir por 4 horas, como sempre.


A mudança de fuso horário subseqüentemente se fez sentir: o tempo todo que eu queria dormir. Para não cair completamente, fui me registrar. Além disso, a caminhada do albergue até o local da conferência permitiu animar um pouco.


O dispositivo da conferência não era incomum em nada: várias sessões espalhadas em salas diferentes, onde apresentações e discussões de novas abordagens para aprendizado de máquina e soluções e implementações interessantes. Uma ressalva: no caso do KDD'19, a conferência inteira ocupou dois imensos prédios de conferências com vários andares, com várias audiências em cada um deles. Como sempre, algumas apresentações despertaram tanto interesse que nem se podia entrar no público através de uma multidão de pessoas. Em uma palavra, cada participante da conferência poderia encontrar algo interessante especificamente para si mesmo. O KDD sempre oferece muitos formatos diferentes para a apresentação de informações, portanto havia muito por onde escolher. São reportagens de cientistas famosos que transmitem para grandes audiências de "streaming" e apresentações de recém-chegados à ciência em pequenas salas de "seminários". Para aqueles que querem não apenas ouvir, mas também praticar, existem “tutoriais práticos” em que representantes de diferentes áreas realizam exercícios práticos. Por exemplo, o tutorial da Amazon sobre como usar o serviço de computação em nuvem era bastante popular. No entanto, o primeiro dia foi bastante claro: foi reservado para inscrição, não houve apresentações sérias aqui, apenas palavras de boas-vindas e palestras de revisão. Então eu fui para o meu quarto, me preparando para as próximas apresentações.


Onde o nosso não desapareceu

B - segurança, mas você não fará nada pelo bem da ciência. E, em geral, não foi em vão que o PhysTech terminou.


O segundo dia foi completamente dedicado às oficinas. Em palavras simples, um workshop é uma reunião em que os participantes trocam experiências na solução de problemas em uma determinada área. Como nosso departamento da empresa Anti-Plágio está engajado no sistema de busca de empréstimos entre idiomas , nosso trabalho, que apresentei na conferência, atendeu imediatamente aos tópicos de dois workshops: Aprendizado Profundo em Educação e Descoberta da Verdade e Verificação de Fatos. Antes dos meus relatórios, consegui ver algumas apresentações interessantes. Vale ressaltar a história de Ruslan Salakhutdinov sobre o modelo XLNet . Obviamente, eles escreveram sobre esse modelo antes do KDD, mas ouvir diretamente de um dos autores foi muito mais interessante. Parte do relatório foi dedicada a uma nova tendência no aprendizado de máquina: em vez de ensinar modelos pesados, use modelos pré-treinados e apenas personalize-os de acordo com suas necessidades. Isso é compreensível: a maioria das empresas que, de alguma forma, usa arquiteturas complexas em suas atividades, não tem poder de computação suficiente para aprender do zero. A reciclagem de modelos prontos para suas tarefas é muito mais simples e rápida. Além disso, a qualidade do trabalho desses modelos é muito superior à dos análogos simplificados.


Todo o tempo restante após o almoço foi gasto procurando por seus públicos, comunicando-se com os chefes das oficinas e outros detalhes da organização. Meu primeiro relatório foi no workshop Deep Learning for Education . Ele estava logo após o café, então a platéia estava vazia. Descrevi como o modelo de pesquisa de empréstimos entre idiomas e alguns detalhes de implementação funcionam. No final do relatório, eles perguntaram se esse sistema já estava funcionando na prática e ficaram surpresos ao receber uma resposta afirmativa. O próximo workshop, Descoberta da verdade e verificação de fatos , já tinha uma audiência completa. Após o discurso, houve várias perguntas. Por exemplo, um dos ouvintes perguntou se havia exemplos específicos desses empréstimos. Minha resposta de que, infelizmente, essa é uma prática bastante popular entre estudantes de instituições superiores da Rússia e dos países da CEI, o mergulhou em um leve mal-entendido. Em geral, o relatório foi recebido com interesse, o público estava claramente interessado em usar projetos entre idiomas para resolver problemas práticos no campo da educação.


A gama de tópicos, mesmo dentro de um workshop, é muito ampla. Por exemplo, um estudante da Universidade da Califórnia em Berkeley falou na minha frente e falou sobre um sistema que ajuda os estudantes dos EUA a escolherem cursos alternativos. Dado todo o curso de disciplinas ministradas por um aluno em particular, o sistema oferece a ele novos cursos com maior probabilidade de serem interessantes para esse aluno. Um banco de dados de estudantes da Universidade da Califórnia nos últimos 10 anos foi tomado como dados de treinamento. E são informações sobre quase 165 mil estudantes durante o treinamento! Outro relatório foi dedicado ao sistema de distribuição automática de bolsas de estudo entre os estudantes. Nas universidades dos EUA, a questão das bolsas de estudos é muitas vezes muito mais complicada do que na Rússia e requer a análise de uma grande quantidade de informações sobre o aluno. Como resultado, a decisão da comissão de bolsas é tomada por um período muito longo. Seria muito conveniente ter um sistema que analisasse e distribuísse bolsas de estudo. Depois de passear pelo resto das oficinas pelo resto do tempo, fui para casa com uma sensação de realização.


No dia seguinte, a conferência principal começou. Ao mesmo tempo, foi organizada uma sessão na qual os patrocinadores da empresa conversaram sobre seus últimos desenvolvimentos no modo de comunicação. Foi bastante interessante dar uma olhada, assistir ao Titan RTX da Nvidia ao vivo, ouvir as realizações da Facebook Research no campo do reconhecimento de imagens e aprender sobre muitos outros gigantes da indústria, alguns dos quais eu nunca tinha ouvido falar antes.



O quarto dia também consistiu principalmente em relatórios. Um, por exemplo, foi dedicado ao problema da interpretabilidade dos modelos de aprendizado de máquina. Mais precisamente, sua ausência em muitos casos. Os modelos modernos resolvem com precisão os problemas em diferentes áreas do conhecimento, como se costuma dizer, "prontos para uso". No entanto, em muitos casos, é necessário entender por que o modelo tomou essa ou aquela decisão. Nesses casos, a interpretabilidade é importante. Um método bastante popular é a aproximação local de modelos, que permite considerar o comportamento do modelo com um exemplo específico e com um certo grau de precisão para entender o que influenciou a decisão. A apresentação foi dedicada apenas a métodos semelhantes e suas melhorias.


Na parte de trás do globo

As montanhas não existem apenas onde há uma baía. Então você não pode simplesmente escapar desta cidade.


No final do dia, um banquete dedicado ao 25º aniversário do KDD estava esperando por todos. Mais uma vez eu estava convencido de que era uma conferência em grande escala, mas realizar um banquete para todos os participantes de uma só vez em uma sala era, obviamente, uma decisão controversa.



O dia seguinte foi o último, e isso foi sentido: o número de ouvintes diminuiu bastante (talvez isso tenha sido facilitado pelo bar no banquete, mas isso não é certo). Sim, e os relatórios foram revisados ​​principalmente. Muitas palestras destacaram problemas e tarefas atuais que precisam ser abordados. O processamento de dados, crescendo a uma velocidade incrível, segurança cibernética, tarefas médicas - em uma palavra, a conferência, embora altamente especializada, não pode ser dita pelo espectro dos tópicos discutidos. Mas, novamente, toda a diversão termina mais cedo ou mais tarde, e estava na hora de eu ir para casa.


Antes de sair, decidi fazer uma pausa e explorar os arredores. Ao dirigir do aeroporto de Anchorage, um motorista de táxi amigável recomendou subir o Mount Flattop - uma atração local com uma "vista fantástica". A julgar pelo número de pessoas que se encontraram no caminho para o topo, essa é realmente uma lenda local, embora eu não diria que a escalada é bastante simples - ao longo do caminho, você precisa superar uma rocha íngreme com um monte de pedras em ruínas. Mas o esforço valeu a pena - a vista de cima é realmente de tirar o fôlego!



A viagem de volta não diferiu em nada de especial. Passear por Los Angeles não estava mais previsto, então eu passei parte do tempo de transferência deitado em uma praia vazia da Califórnia (ninguém vai lá às 8 da manhã). Uma longa pesquisa pré-vôo, outras 12 horas no ar, e eu finalmente em Moscou chuvosa e fria. Em geral, a conferência deixou apenas impressões positivas. Reunir em um só lugar pessoas de diferentes interesses, nacionalidades e pontos de vista realmente vale a pena um esforço enorme. E isso também é feito para que todos tenham algo para ouvir ou contar, e tudo acontece em uma atmosfera propícia a isso. Eu acho que valeu a pena voar para quase o lado oposto do planeta.

Source: https://habr.com/ru/post/pt464381/


All Articles