ok.tech: dados explicados



Apresentações da UPD dos participantes do evento estão disponíveis aqui

Em 13 de junho, convidamos todos os que trabalham com dados ao escritório de Odnoklassniki em Moscou, no ok.tech: Data Explain. Juntamente com colegas do OK.ru, Mail.ru Group, ivi.ru, Yandex.Taxi e outras empresas de tecnologia, discutiremos a evolução de armazenamentos e bancos de dados, discutiremos as vantagens e desvantagens de diferentes abordagens ao armazenamento de dados, bem como como essas abordagens afetam conveniência de diferentes equipes de interação de dados.

O evento será realizado no formato de uma discussão aberta entre os palestrantes e o público; portanto, prepare suas perguntas e não hesite em perguntar. O evento será moderado por Alexey Chernobrovov.

Inscreva-se no evento.

Abaixo de um gato teses de performances e o horário.


A fronteira entre os bancos de dados Hadoop e MPP.


Fedor Lavrentiev, chefe de desenvolvimento de ferramentas de análise, Yandex.Taxi

O Hadoop invadiu o mundo do armazenamento como uma solução barata e facilmente escalável para o processamento de dados de estrutura fraca. Com o tempo, os dados no Hadoop ganharam mais estruturalidade e, por outro lado, houve uma tendência de paralelização dos bancos de dados relacionais clássicos. E agora eles estão enfrentando. No relatório, eu gostaria de falar sobre onde as fronteiras estão agora no mundo do MPP.

A evolução da DWH em Odnoklassniki.


Denis Gabaidulin, Developer na OK.ru

O Odnoklassniki DWH ajuda as empresas a tomar decisões baseadas em dados. Esta é uma tarefa fascinante, difícil e responsável. Processamos dezenas de bilhões de eventos diariamente e executamos mais de 1000 trabalhos regulares. Por onde começamos e de onde viemos, e para onde seguimos? Por que você escreveu seus análogos luigi, spark job server e criou seu próprio monitoramento?

Mudando para ClickHouse: o que nos esperava


Olga Makarova, gerente de produto da ivi.ru

O ClickHouse não diminui a velocidade se usado corretamente.
Vou contar algumas situações que nos custam muito tempo e nervosismo e como não entrar nelas.
Os antipadrões do uso de CH são o rake em que pisamos.

Onde usar o elasticsearch hoje.


Ilya Sereda, Engenheira de Dados Principal tutu.ru

Por muitos anos usando a busca elástica em nossa empresa, resolvemos vários problemas diferentes com ela. Vou lhe dizer quais soluções se mostraram boas e quais foram uma dor de cabeça para nós. Também vou lhe dizer o que esperar durante a operação e para resolver quais problemas abandonamos a pesquisa elástica em favor de outras soluções.

Horário


18:30 - 19:00 - Registro de participantes
19:00 - 19:05 - Introdução de Alexey Chernobrovov
19:05 - 19:20 - A fronteira entre os bancos de dados Hadoop e MPP, Fedor Lavrentiev, chefe do Yandex.Taxi de desenvolvimento de ferramentas de análise
19:20 - 19:35 - A evolução do DWH em Odnoklassniki, Denis Gabaidulin, OK.ru
19:35 - 19:50 - Mudando para ClickHouse: o que nos esperava, Olga Makarova, gerente de produto da ivi.ru
19:50 - 20:05 - Onde usar o elasticsearch hoje, Ilya Sereda, engenheiro de dados líder tutu.ru
20:05 - 20:30 - Perguntas aos palestrantes
20:30 - 20:45 - Intervalo
20:45 - 22:00 - Discussão

Inscreva-se no evento.

Source: https://habr.com/ru/post/pt452978/


All Articles