A história de como, devido a uma opção no servidor Windows, nossos sites diminuíram a velocidade



Muitos já ouviram dizer que o Cloud4Y é um provedor corporativo de nuvem. Portanto, não falaremos sobre nós mesmos, mas compartilharemos uma pequena história sobre como tivemos problemas ao acessar alguns sites e o que causou isso.

Um belo dia, o departamento de marketing reclamou aos engenheiros que, ao trabalhar no terminal em navegadores, alguns sites carregavam por um longo tempo. Em particular, vk.com é vital para eles. Recebemos o sinal, começamos a entender qual era o problema.

Então, a situação: o provedor de Internet Megafon, o servidor OS Windows, o navegador Firefox. Se você abrir o VKontakte com o Windows 10 normal, o site será carregado de 10 a 100 ms. Se tentarmos abri-lo com o Windows Server 2012/16/19, o atraso será de 15 segundos ou mais.

Eles pegaram um pixel VK e, através dele, começaram a descobrir possíveis versões do que estava acontecendo.

Teste de hipótese # 1 - um problema com o servidor de terminal.
Não confirmado. Quando você testa a abertura da página por outro servidor na mesma rede, o problema persiste.

Teste de hipótese # 2 - um problema no gateway.
Não confirmado. Note-se que, com laptops locais, tudo se abre de maneira fácil e rápida. Mas, ao mesmo tempo, o problema permanece com os terminais (e servidores internos). Jogado com as configurações do ICMP na interface externa e interna - não ajudou.

Estranho, de alguma forma, acontece.

O site não fica lento a partir de um laptop local.
A partir da máquina de digitalização interna (terminal para digitalização) - não diminui a velocidade.
E o marketing diminui. Bagunça!

Vamos mais longe.

Teste de hipótese nº 3 - Problema no DNS.
Não confirmado. Lançou um pixel através do DNS público (8.8.8.8) - a mesma história. O problema é claramente visível quando, pela primeira vez, você puxa esse pixel no modo de navegação anônima, por exemplo.

Há suspeita de que o problema seja altamente dependente do navegador. No FF, um pixel sempre morre, no chrome na primeira entrada. Fazer marketing é estúpido constantemente em todos os navegadores.

Teste de hipótese # 4 - Algo com um modelo de SO.
Não confirmado. Implantamos um Windows Server 2016 limpo e lançamos o teste da rede .0. Tenho um problema. Transferido para a rede .200., O problema persiste. Esse é o portão da rede .0. nada a ver com isso. No entanto, os laptops dessa rede não têm esse problema. Esse é o portão de rede .200. nada a ver com isso também.

Ou seja, o problema não está no modelo do sistema operacional. A máquina virtual fica mais lenta com o carregamento de pixels. Mas se você criar uma VPN (uma placa de rede separada) e colocar tráfego nela, tudo funcionará muito rapidamente (como deveria ser). Vemos que existem duas opções que podem causar um problema: um gateway no escritório ou um operador de Internet no escritório.

Mas um megafone pode impedir especificamente o acesso a um pixel VKontakte? Não, algumas bobagens. Ainda tentamos remexer.

Teste de hipótese # 5 - O VMware Tools é o culpado.
Não confirmado. Nenhum efeito prejudicial é observado. Também tentamos alterar as configurações do cartão. TTL alterado - sem efeito. Bem, geralmente não está claro qual é a diferença entre o Windows 10 e o Windows Server. Mas há uma diferença. Como a história do esquilo.



Nós lidamos com o problema por algum tempo. Claro, google situações semelhantes, mas não encontrou nada. Então eles agiram sem pistas, elaborando todas as versões possíveis. Testamos a partir de um laptop com Windows 2016 para garantir que a virtualização e mais não sejam os responsáveis ​​pela desaceleração ao carregar um pixel. Foram alteradas todas as configurações possíveis para a placa de rede e a pilha de IP. Já tentei um monte de tudo. Mas o problema permaneceu, e o marketing bateu com um casco e exigiu consertar tudo.

Depois de algum tempo, ainda descobrimos onde o cachorro foi enterrado. Era tudo sobre a opção
netsh interface tcp setglobal ecncapability = desativado

Esta opção está desabilitada por padrão no Windows da área de trabalho e por padrão habilitada no servidor. Assim que o desligamos no servidor, tudo é aberto instantaneamente, como no desktop. Conseguimos confirmar esse problema do provedor que nos fornece a Internet no escritório (Megafon), via Internet móvel do Megafon (se você o compartilha do telefone e se conecta via Windows Server), através do Yota, tentamos em algumas áreas de Moscou e esse problema estava presente em toda parte. Ao trabalhar com outras operadoras, o acesso ao site foi instantâneo.

Aqui está uma escória, como um político proeminente colocou. Em princípio, o problema já foi resolvido, mas estamos muito interessados: surgiu apenas conosco ou é um desastre em larga escala que afeta empresas de outras cidades? Se esse caso não for isolado, o Megafone deve pensar em uma solução para esse problema. Afinal, a opção ECN (ecncapability) é ativada por padrão nos servidores e, para descobrir qual é o objetivo, você precisa gastar muito tempo.

Como verificar? Sim, assim como nós. Usando o navegador Firefox, tentamos abrir qualquer página do vk.com e novamente através de ctrl + f5. Se o problema estiver presente, haverá um atraso constante; se não houver problema, o site será aberto instantaneamente.

O que mais é útil para ler no blog do Cloud4Y

Energia solar salgada
Como o banco quebrou
→ A Grande Teoria dos Flocos de Neve
Internet por balões
Pentesters na vanguarda da segurança cibernética

Assine o nosso canal Telegram para não perder outro artigo! Escrevemos não mais do que duas vezes por semana e apenas a negócios.

Source: https://habr.com/ru/post/pt484790/


All Articles