Ciência de dados no CodeFest: o sabor da revolução

imagem

O eu, em uma primeira aproximação, é paralelo. O automatismo realmente cria egocentrismo. As idéias do hedonismo são centrais no utilitarismo de Mill e Bentham, mas a dúvida transforma o conflito fenomenológico. O código começa a entender o gênero.

Patrocinador da associação ao Yandex.

A ciência de dados e o aprendizado de máquina há muito tempo penetram em nossas vidas e no CodeFest, mas pela primeira vez os destacamos em uma seção separada . Porque existem mais seções para o deus das seções!

O piso é dado ao curador da seção bond005 . A propósito, ele ficará feliz com suas recompensas lois e kármicas.

O que acontecerá na seção Ciência de Dados?

Antes de escrever sobre isso, farei uma pequena (muito pequena!) Digressão filosófica.

Nós, seres humanos, somos criaturas sociais, e não podemos viver sem comunicação: em uma sala de reuniões do escritório no trabalho ou com um copo de cerveja em um bar aconchegante. Mas nem toda comunicação é "igualmente útil". Existem profissões - por exemplo, um operador de call center - em que a comunicação com pessoas diferentes, às vezes não muito agradáveis, constitui todo o ponto do trabalho e dura dia após dia, semana após semana. Então a comunicação se transforma em um trabalho difícil, psicologicamente exaustivo, que não pode ser facilitado ou automatizado. Ou talvez?

Parece que, nesse caso, o algoritmo precisa não apenas reconhecer o gato na imagem do ImageNet, mas entender (ouvir ou ler) o que o interlocutor deseja, responder adequadamente a ele, "em vão", se necessário, pedir ou esclarecer alguma coisa. Tarefa desafiadora!

Não é fácil, mas resolvido pelos métodos modernos de inteligência artificial. E, portanto, não foi por acaso que a maioria dos discursos de nossos oradores na seção será dedicada a métodos e tecnologias para resolver esse problema.

imagem As redes neurais nos ajudarão com isso ou não? E o que são, arquiteturas de redes neurais modernas para textos e comunicação? Um simples shnik de TI pode lidar com eles? “ Redes neurais no processamento de texto: exagero ou seriedade e por um longo tempo? ”- um especialista em linguística de computação, o fundador do projeto rusvetores.org e um pesquisador da Universidade de Oslo, Andrey Kutuzov, nos falará sobre isso.


imagem Mas e se quisermos ensinar nosso algoritmo não apenas a ler, mas também a ouvir? Como fazer um bom sistema de reconhecimento de fala? E, em geral, o que é “bom” em relação à tecnologia da fala? O que está “sob o capô” de uma nova geração de sistemas de reconhecimento de fala? Os bons e velhos clássicos são suficientes para nós - modelos ocultos de Markov ou uma rede neural - e aqui está o "nosso tudo"? As respostas a essas perguntas que interessam a muitos (e eu certamente) serão fornecidas em sua história por Nikolai Shmyrev , chefe da AC Technologies e um dos principais colaboradores dos projetos de reconhecimento de voz de código aberto CMU Sphinx e Kaldi.


imagem Bem, ouvimos uma pessoa ou lemos sua mensagem, reconhecemos o texto. E como extrair do texto a principal coisa que nosso interlocutor queria nos transmitir? Eles tentam resolver o problema de resumir o texto (auto-abstração) há muito tempo. Lembro que uma vez usei um dos sistemas de resumo para preparar um ensaio sobre filosofia na universidade. E isso agora? “ Resumindo textos: da geração de manchetes às notícias e ao resumo de tudo e de tudo ” - isso será dedicado à apresentação de Daniil Gavrilov, desenvolvedor e especialista em aprendizado de máquina da equipe VKontakte.


imagem Finalmente, o robô percebeu o que um homem quer dele. Agora ele deve responder adequadamente! Talvez nem prosa, mas poesia! Como desenvolver um algoritmo capaz de escrever textos, entender de forma independente o tópico que você precisa escrever e ao mesmo tempo imitar o estilo certo - é importante não apenas participar de um concurso de poesia, mas também criar um bot de bate-papo educado e cultural que se comunique com os clientes do setor bancário central de atendimento, por exemplo. Anya Mosolova, da Universidade Estadual de Novosibirsk, em seu conto " Imitando um poeta, ou como Pushkin teria escrito em duzentos anos ", nos apresentará o "recheio" algorítmico de um gerador de textos em russo que conhece tanto significado quanto rima!


imagem Todos esses tópicos, que serão revelados por nossos maravilhosos palestrantes, são muito importantes por si só e para a construção de um moderno bot de bate-papo. Em princípio, depois de ouvir suas histórias e conversar com elas na zona de especialistas, você já pode criar (ou tentar) seu próprio chatbot com inteligência artificial que pode manter a conversa até sobre variedades de pizza, pelo menos juros sobre empréstimos bancários.

Mas eu não quero projetar e programar tudo sozinho, mesmo usando as bibliotecas de software existentes (que, a propósito, você também ouvirá nas histórias, porque o código aberto é sagrado)! Talvez haja algumas soluções prontas ou modelos de solução para o bot de bate-papo como um todo, e não apenas para seus componentes individuais? No relatório de Vladislav Lyalin , desenvolvedor do laboratório de sistemas neurais e treinamento profundo do MIPT, você ouvirá um “sim” decisivo como resposta a esta pergunta. Vladislav apresentará o projeto de inteligência artificial conversacional do iPavlov e a biblioteca python DeepPavlov, que é, de fato, uma plataforma aberta para a construção de uma variedade de sistemas de diálogo: bots de bate-papo direcionados, bots de perguntas e respostas, bots de bate-papo com perguntas frequentes, etc.


imagem E, finalmente, a Data Science não é a única IA conversacional viva! Sobre a visão computacional também deve ser lembrada. É sobre isso - sobre a visão espacial e a determinação automática da localização dos objetos no mundo tridimensional - haverá uma história de Alexei Grishchenko , engenheiro da empresa de Novosibirsk, Motiv. Alexei e seus colegas venceram recentemente um concurso de visão computacional, no qual era necessário criar e treinar uma rede neural que conhecesse exatamente todo o processo de montagem de um turbocompressor KamAZ e fosse capaz de controlar os trabalhadores na linha de montagem para que não estragassem. Mas após a vitória, ninguém descansou sobre os louros, e a melhoria do sistema continua! Quer saber como? Venha para a performance de Alexey!


imagem E você também precisa se lembrar sobre as bases do básico - a própria tecnologia do aprendizado de máquina! Independentemente do que a rede neural resolva - ela analisa o texto ou seleciona objetos na imagem, essa rede neural precisa ser treinada. Quanto maior a quantidade de dados de treinamento, melhor e "mais inteligente" essa rede neural se tornará, mas aprender com big data se torna muito difícil no sentido tecnológico. Leonid Kuligin, desenvolvedor e especialista em aprendizado de máquina do Google Cloud em Munique, falará sobre como resolver o problema de big data no treinamento de redes neurais modernas , como o aprendizado distribuído funciona com a conhecida biblioteca de redes neurais TensorFlow, como o processamento de dados é organizado e quais ferramentas estão disponíveis para o perfil de treinamento .

A estratégia de preços restaura o princípio de percepção do consumidor, otimizando os orçamentos. A ação pontual monitora a gama de produtos de maneira uniforme. Em outras palavras, amigos, em primeiro lugar, desde 4 de março, o preço tem aumentado e, em segundo lugar, eles trouxeram a transmissão on - line .

A comunicação não tem preço, e até a IA falada vai concordar!

O registro é obrigatório. Participação também. Venha, vai ser demais!

Source: https://habr.com/ru/post/pt441072/


All Articles