Melhores relatórios com o HighLoad ++ 2018

Amigos, concordamos com a empresa Ontiko que publicaremos os melhores relatórios de suas conferências em nosso canal do Youtube e os compartilharemos com você. Portanto, queremos não apenas espalhar conhecimento, mas também ajudar nossos leitores e espectadores a se desenvolver profissionalmente. Veja uma seleção dos 15 melhores relatórios que foram feitos no Highload ++ 2018.

Replicação do Tarantool: configuração e uso


Georgy Kirichenko, Grupo Mail.ru


A replicação do Tarantool é usada para fornecer alta disponibilidade, fazendo backup de servidores ou servidores de cluster para balanceamento de carga, e também pode ser usada para executar operações de atualização. As versões recentes do Tarantool possuem vários recursos adicionais que facilitam a configuração e o uso da replicação em um cluster.

O relatório examinou os princípios básicos do dispositivo e os recursos da replicação assíncrona no Tarantool. Nós nos debruçamos sobre a estrutura interna do vetor de estado - vclock. Eles discutem maneiras de garantir a consistência dos dados e se concentrar nos novos recursos. Os princípios básicos da configuração, sua aplicabilidade e os erros mais comuns são considerados e as formas de resolver os problemas com a configuração e operação são discutidas.

Aspectos técnicos do bloqueio da Internet na Rússia. Desafios e perspectivas


Philip Culin, Floresta Profunda


Detalhes técnicos de fechaduras. Como o mecanismo de bloqueio está agora organizado. Quem, o que, onde, quando e como. Por que é tão organizado? Por que o ILV está bloqueando redes inteiras. Qual é o problema do atual mecanismo de travamento do ponto de vista técnico. Em que direção devemos passar de um ponto de vista técnico dentro da estrutura de mudanças mínimas para a estrutura regulatória de hoje.

Prevendo as vendas da loja online usando o aumento de gradiente (lightGBM)


Alexander Alekseytsev, OZON.RU


Este relatório é sobre um sistema de reposição automática de armazém. O cérebro do sistema é o ML para prever vendas: definir uma tarefa e escolher uma função de perda, trabalhar com atributos, gerar um conjunto de dados, escolher um modelo, armadilhas do processo de aprendizado do lightGBM, avaliar resultados. Esqueleto do sistema - Spark / Hadoop: entrega / validação diária de dados, aumentando a confiabilidade do sistema. Realidades comerciais da aquisição de bens: seleção de fornecedores, estoques de seguros, luta com o nível de serviço dos fornecedores.

Alexander também falou sobre o uso de modelos lightGBM treinados para avaliar a elasticidade da demanda por mercadorias ao preço do planejamento de campanhas de marketing e o efeito delas. Diferentes tipos de funções da dependência da demanda de preços por diferentes tipos de mercadorias e muito mais recebidos como um efeito "secundário" da tarefa principal.

Como trabalhamos na estabilidade de nossa implementação Lua


Anton Soldatov, IPONWEB


O IPONWEB usa Lua para descrever a lógica de negócios há mais de 10 anos. Em 2015, eles escolheram o LuaJIT e, desde então, trabalham com sua própria implementação de linguagem. Esse componente da pilha tecnológica é fundamental para os negócios, portanto, sua estabilidade recebe atenção especial.

Anton contou como eles criaram uma base de teste para implementação do zero; classificamos vários casos em que os testes se mostraram impotentes antes da complexidade do sistema em teste e, como resultado, algo ocorreu nos servidores de batalha "repentinamente" e "irregularmente". A experiência adquirida na correção desses erros pode ser aplicada ao trabalho com LuaJIT. E, finalmente, Anton compartilhou as ferramentas e truques que suas empresas usam ao depurar.

Local da segurança no nível da linha em um projeto de alta carga


Alexander Tokarev, DataArt


Um relatório sobre onde e como melhor organizar a segurança em nível de linha para um projeto altamente carregado. Ele descreveu a escolha de como implementar a segurança em nível de linha em um projeto corporativo altamente carregado (4000 usuários, 10000 solicitações ao mesmo tempo, carga transacional e olap ao mesmo tempo). Ele analisou três tecnologias de implementação para segurança no nível de linha no DBMS do Oracle e por que foi escolhida a segurança no banco de dados, e não no servidor de aplicativos. Ele falou sobre a escolha feita, sobre os problemas e planos futuros.

Como criamos nosso próprio Netfilter com Intel DPDK e árvores de prefixo


Alexander Samoilov, Código de Segurança


O Linux Netfilter está no coração de uma enorme quantidade de ITU, aberta e comercial. Essa é uma solução comprovada, confiável e, mais recentemente, bastante produtiva. Porém, nas realidades modernas, quando dezenas de gigabits de tráfego geralmente passam pela UIT, e o número de regras de filtragem pode exceder mil, o Linux Netfilter é o gargalo.

Alexander falou sobre como eles reescreveram o subsistema de rede Linux, que acabou sendo rápido - dezenas de gigabits de filtragem sem estado e sem estado, rastreamento de sessão, NAT e roteamento, fácil de gerenciar - ensinou o subsistema a entender os comandos dos conhecidos utilitários iproute2 e nftables, independentemente do número regras de filtragem.

VShard - escala horizontal em Tarantool


Vladislav Shpileva, Tarantool


Até 2018, o único meio de dimensionamento horizontal do Tarantool DBMS era o Shard - um módulo que implementa o sharding, um caso especial de dimensionamento horizontal. O Shard implementa o sharding por função da chave primária, suporta a alteração da topologia de cluster e o reequilíbrio. Ao mesmo tempo, ele tem três inconvenientes significativos que impediram o uso do Shard em um dos projetos importantes.

No início do ano, o desenvolvimento do novo módulo VShard foi concluído - esta é uma implementação alternativa do sharding. Nele, o reequilíbrio é realizado em estágios, é possível definir uma função de fragmento arbitrária para garantir a localidade dos dados associados, o resultado do cálculo da função de fragmento é armazenado em cada registro e não recalculado. Vladislav falou sobre o dispositivo interno do VShard, sobre seus subsistemas e implementação com exemplos de uso e sobre os novos recursos do VShard 0.2.

Mais de 150 milhões de usuários do BBM migram do Oracle para o Postgres sem tempo ocioso


Alvaro Hernandez, OnGres (fala em inglês)


O BBM (Black Berry Messenger) é um dos maiores mensageiros instantâneos do mundo, com funções de comunicação de texto, voz e vídeo; sua base de assinantes é superior a 150 milhões de usuários. Ele trabalhou no DBMS Oracle local. Ajudamos a migrá-lo para o PostgreSQL em execução no GCP com replicação em tempo real, praticamente sem tempo de inatividade. Alvaro descreveu em detalhes o processo e as armadilhas, técnicas, tecnologias e práticas recomendadas para migrar o Oracle para o PostgreSQL sem tempo de inatividade. Hoje, muitas pessoas estão interessadas nessa migração, mas exige alta qualificação e envolvimento em um processo em que enfrenta muitas dificuldades.

Sistema de controle distribuído altamente carregado de uma moderna usina nuclear


Vadim Podolny, Instrumento Físico


A partir deste relatório, você aprenderá sobre a nova plataforma de um sistema de controle distribuído para usinas nucleares e como gerenciar as instalações de automação mais complexas do mundo. Controle em tempo real do trabalho de mais de 150 subsistemas especiais responsáveis ​​por vários processos tecnológicos de usinas nucleares. Mais de 100K de fontes de dados de sensores e até 500K de parâmetros calculados. 5 variedades de processos físicos.

Com alguns desvios, o sistema inteiro se transforma em uma enorme fonte DDoS de informações úteis para diagnóstico, o que interfere no controle normal do objeto. Você aprenderá como "resolvemos" esses problemas, aprenderá sobre a arquitetura de hardware e software de sistemas como backup e replicação, por que a redundância de dados e a diversidade tecnológica são necessárias. Como o gerenciamento de carga é fornecido, como funciona a QoS. E o que acontecerá se o sistema operacional normal for desligado, como, por exemplo, em Fukushima.

Plataforma de streaming on-line de 4K milhões


Alexander Tobol, Colegas de classe


Vídeo de serviço em Odnoklassniki - o segundo site no Runet para visualizações de vídeos: 600 milhões de visualizações diárias. A plataforma de streaming OK agora permite realizar transmissões profissionais em 4K, transmitir do seu telefone para FullHD e oferecer aos usuários mais de 3 TB / s de tráfego.

Alexander falou sobre:

  • Pipeline de streaming de vídeo 4K para milhões online;
  • Arquitetura do sistema de entrega de conteúdo
  • Ajuste de TCP para distribuição 4K;
  • como e por que você precisa abandonar o ffmpeg e sobre como cortar vídeo na GPU;
  • o que fazer se as capacidades acabarem e os usuários continuarem chegando;
  • problemas de streaming no TCP;
  • o futuro do streaming de vídeo.

Mudanças recentes na pilha de E / S do Linux do ponto de vista do DBA


Ilya Kosmodemyansky, Data Egret


Os problemas de desempenho de E / S estão na agenda diária dos administradores de banco de dados desde que existem. O Linux, provavelmente o sistema operacional de banco de dados mais popular, revisou a pilha de E / S nos últimos anos.

Ilya falou sobre o que está acontecendo, por que a pilha de E / S precisa de melhorias urgentes e o que isso pode levar para os bancos de dados. Como os novos drivers NVMe e blk-mq serão aprimorados. Como um memorando útil, Ilya propôs uma lista de verificação das configurações do PostgreSQL e Linux para maximizar o desempenho do subsistema de E / S nos novos kernels.

FAQ sobre arquitetura e trabalho VKontakte


Alexey Akulovich, VK


Alexey levantou muitos tópicos e perguntas que as pessoas têm "de fora".

Por exemplo:

  • A arquitetura geral da interação de nossos servidores.
  • Existe um PHP "regular" no VKontakte, onde e por quê. E que outras armas nucleares são usadas?
  • Como atualizar o código em dezenas de milhares de servidores em segundos.
  • Tolerância a falhas de clusters de memcache com servidores que quebram constantemente.
  • Por que o VKontakte possui seus próprios mecanismos (DB), quantos deles e como eles vivem com eles.
  • Como o binlog difere do instantâneo e como "retroceder DELETE".
  • Como você pode monitorar tudo isso.

DNS do Facebook


Oleg Obleukhov, Facebook


Oleg falou sobre como o Facebook equilibra a carga, e o que a infraestrutura de DNS tem a ver com ela, como os registros de recursos se enquadram na infraestrutura global do Facebook e como a empresa usa o DNS na organização de alimentos para cães.

Bancos de dados e KubernetesDevOps e operação


Dmitry Stolyarov, Flant


Dmitry compartilhou sua experiência e contou com exemplos específicos em quais casos faz sentido colocar bancos de dados (e, geralmente, aplicativos com estado) no Kubernetes, e nos quais isso é injustificado, ou até prejudicial e perigoso.



Esta seleção está no nosso canal do Technostream no Youtube . Nós o criamos para compartilhar uma variedade de materiais educacionais, incluindo as palestras de nossos projetos de tecnologia educacional. Já escrevemos no Habré sobre o Technostream, portanto, se você ainda não ouviu falar, leia-o . E volte sempre, algo interessante aparece constantemente lá.

Source: https://habr.com/ru/post/pt458474/


All Articles