O que esperar do novo Xeon E. Compare com o E3 e tire conclusões



Eu continuo testando processadores. Desta vez, minha atenção mudou completamente e completamente do Core para o servidor Xeon. Devo admitir que isso não é acidental. Primeiro, me perguntaram calorosamente sobre isso nos comentários do artigo anterior e, em segundo lugar, nosso parque foi reabastecido com o novo Xeon E - decidimos atualizar a linha de servidores dedicados de processador único e compramos o E-2134 e o E-2136 como uma alternativa ao E3-12XX.

Inicialmente, eu tinha planos napoleônicos. Como nossa “coleção” Xeon E3-12xyVz, onde “z” assume um valor de 2 a 6, abrange processadores de Ivy Bridge a Kaby Lake, eu estava interessado em compará-los entre si e com o novo Xeon E.

Mas, tendo estimado a quantidade de trabalho que tenho pela frente, decidi diminuir o grau de ambição e deixar apenas as duas famílias anteriores dos representantes do Xeon E3: Xeon E3-12xxV5 e Xeon E3-12xxV6. Juntamente com o novo Xeon E, todas as três famílias são realmente construídas na mesma arquitetura, em um processo tecnológico e, graças à Intel, em um soquete do processador FCLGA1151.

Além disso! Os processadores das duas famílias anteriores estavam disponíveis, interceptando a frequência base e a frequência no “boost”, o que, na minha opinião, é um grande sucesso :) Nos comentários ao artigo anterior, foi solicitado pelos leitores que comparassem famílias diferentes na mesma frequência para ver uma limpeza. crescimento de mudanças microarquiteturais. A ideia me pareceu interessante e talvez um dia voltarei ao Core para dar vida a ela. Enquanto isso, decidi me adaptar ao que está à mão e ver como o Xeon se comporta com as mesmas frequências.

Teste

Oito processadores de três famílias participam dos testes:
Skylake - Intel E3-1230v5, E3-1240v5, E3-1270v5,
Kaby Lake - E3-1230v6, E3-1240v6, E3-1270v6,
Lago do café - E-2134 e E-2136.



As características de desempenho das plataformas

Os servidores com processadores Intel E3-1230v5, E3-1240v5, E3-1270v5, E3-1230v6, E3-1240v6 e E3-1270v6 têm a mesma configuração básica:

  • Placa-mãe: Supermicro X11SSE-F (2.2 BIOS).
  • RAM: 16 GB Micron Technology (DDR4-2666) ECC - 2 peças.
  • SSD: Intel DC S4500 480 GB - 2 peças em RAID1.

Servidores com processadores Intel E-2134 e E-2136 também trabalham na mesma plataforma:

  • Placa-mãe: Supermicro X11SCE-F (BIOS 1.0a).
  • RAM: 16 GB Micron Technology (DDR4-2666) ECC - 2 peças.
  • SSD: Intel DC S4500 480 GB - 2 peças em RAID1.

Parte do software: CentOS Linux 7 x86_64 (7.6.1810)
Kernel: 3.10.0-957.5.1.el7.x86_64
Otimizações introduzidas em relação à instalação padrão: adicionadas opções de inicialização do kernel lift = noop selinux = 0.
O teste é realizado com todos os patches das vulnerabilidades Spectre, Meltdown e Foreshadow suportadas neste kernel.

Testes utilizados para pesquisa:

  1. Sysbench
  2. Geekbench
  3. Phoronix Test Suite

Uma descrição mais detalhada dos testes pode ser encontrada no artigo anterior . Ele pegou o mesmo kit e a Timed GCC Compilation, que ele adicionou a pedido dos leitores. Enquanto isso, brevemente sobre o que e o que mediu.

Teste Sysbench
O teste é multiencadeado, em todos os núcleos. Eu medi um indicador - eventos de velocidade da CPU por segundo, o que significa o número de operações executadas pelo processador por segundo - quanto maior o valor, mais eficiente o sistema.

Geekbench Test
Eu medi dois indicadores principais com base nos resultados de vários testes: Pontuação de núcleo único e Pontuação de núcleo múltiplo, - testes simples e multithread. As unidades de medida são "papagaios" abstratos. Quanto mais papagaios, melhor.

Phoronix Test Suite
Tirei apenas 10 de um conjunto grande - o mesmo da última vez - e, como eu disse acima, adicionei a Timed GCC Compilation. O resultado foram 8 testes multithread e 2 single thread (Himeno e LAME MP3 Encoding).

Nesses testes, quanto maior a pontuação, melhor

  1. Teste de senhas de John, o Estripador. Pegue o algoritmo de criptografia Blowfish.
  2. O Teste Himeno é um solucionador de pressão de Poisson linear usando o método de ponto de Jacobi.
  3. Compressão 7-Zip - teste 7-Zip usando p7zip com função de teste de desempenho integrado.
  4. O OpenSSL é um conjunto de ferramentas que implementam os protocolos SSL (Secure Sockets Layer) e TLS (Transport Layer Security). Mede o desempenho do OpenSSL RSA de 4096 bits.
  5. Apache Benchmark - mede quantas solicitações por segundo esse sistema pode suportar ao executar 1.000.000 de solicitações, enquanto 100 solicitações são executadas simultaneamente. Unidades - consultas por segundo.

E nesses, se menos, é melhor - em todos os testes, o tempo que leva para medir é medido.

  1. O C-Ray testa o desempenho da CPU em cálculos de ponto flutuante. Este é um teste multithread (16 threads por núcleo).
  2. Compactação BZIP2 paralela - mede o tempo de compactação do arquivo (pacote .tar do código-fonte do kernel Linux) usando a compactação BZIP2.
  3. O teste LAME MP3 Encoding é realizado em um único fluxo.
  4. O teste ffmpeg x264 é multiencadeado.
  5. Compilação temporizada do GCC. No meu primeiro artigo nos comentários, os leitores me pediram para adicionar um teste relacionado à compilação a partir da fonte. Este teste é para você :-) Ele mostra quanto tempo leva para construir o compilador GNU GCC (versão 8.2.0). Unidades são segundos.

Então, reuni em um banco de ensaio representantes de três famílias - Skylake, Kaby Lake e Coffee Lake. Todos os processadores, exceto o novo E-2136, têm quatro núcleos e oito threads em HT, além do mesmo tamanho total de cache. Todos os processadores possuem memória de canal duplo com suporte a ECC e frequências base próximas. Como no artigo anterior, chamo a atenção para o fato de que os processadores de três famílias diferentes são construídos na mesma arquitetura. Assim, “frequências, núcleos e fios devem governar a bola”.

Mas desta vez será ainda mais interessante: todas essas famílias têm diferentes frequências suportadas ao trabalhar com RAM - 2133, 2400 e 2666, respectivamente, além de um pacote de calor diferente. É interessante ver como isso afetará os resultados do teste e se isso afetará. Obviamente, suponho que quanto maior a frequência de trabalho com RAM, melhor o processador passará nos testes.

De particular interesse são os E3-1240v5 e E3-1230v6 com as mesmas frequências: a base de 3,50 GHz e 3,90 GHz em Turbobust. Suponho que eles devam mostrar resultados idênticos ou próximos, pois diferem apenas no pacote de calor e na frequência da memória.

Quanto às minhas previsões sobre o Xeon E, acho que os resultados dos testes single-threaded do E-2134 e E-2136 também devem ser os mesmos ou muito próximos no desempenho - embora a frequência base seja diferente, mas as frequências no "impulso" sejam as mesmas. E, é claro, os resultados de ambos os Xeon Es, tenho certeza, serão melhores que seus antecessores: 4,5 GHz em velocidade máxima e 6 núcleos no E-2136 definitivamente se mostrarão. E agora vamos ver como estou certo.

Resultados do teste



No teste Sysbench, o E3-1240v5 e o E3-1270v5 estão no mesmo nível. Com o E3-1230v6, o crescimento começa, terminando com uma decolagem acentuada do E-2136. O E-2136 é 36% melhor neste teste que o E3-1270v6 e 43% melhor que o E3-1230v5. O E-2134 está apenas 4% à frente do E3-1270v6 e 14% E3-1230v5. A diferença entre o E3-1240v5 e o E3-1230v6 é de 2,4% a favor do E3-1230v6.




No teste Geekbench de rosca única, observa-se crescimento dentro de cada família, com exceção da família Xeon E: o E-2134 ultrapassa o E-2136 em 4,5%.

No teste multithread, a tendência de crescimento persiste nas três famílias: o E-2136 está 14,6% à frente do E-2134. No teste de rosca única, E3-1240v5, E3-1270v5 e E3-1230v6 estão em pé de igualdade, e no teste de rosca múltipla E3-1230v6 supera E3-1240v5 em 2,5%

Links para os resultados dos testes do Geekbench:

Xeon E3-1230v5
Xeon E3-1240v5
Xeon E3-1270v5
Xeon E3-1230v6
Xeon E3-1240v6
Xeon E3-1270v6
Xeon E-2134
Xeon E-2136



Os resultados John The Ripper multiencadeados são muito semelhantes aos resultados do teste Sysbench: E3-1240v5, E3-1270v5 e E3-1230v6 oferecem quase o mesmo desempenho e o E-2136 é 33% mais rápido que o E-2134. O crescimento estável é claramente visível em termos de E3-1240v6, E3-1270v6 e a transição para a próxima geração - E-2134.



No teste de raios-C, o resultado mais alto é o E-2136, o mais baixo é o E3-1230v5, que é bastante lógico cronologicamente. Segundo lugar no novo E-2134. Mas E3-1240v5, E3-1270v5 e E3-1230v6 estão novamente no mesmo nível.



O teste Himeno de rosca única repete quase exatamente os resultados do teste Geekbench de rosca única: há crescimento dentro de cada família, com exceção do Xeon E: E-2134 ultrapassa o E-2136 em 2,4%. A diferença entre E3-1240v5, E3-1270v5 e E3-1230v6 no nível do erro.



No teste do 7zip, observamos uma bela “escada” e crescimento em todas as famílias. A diferença entre E3-1240v5, E3-1270v5 no nível de erro. O E3-1230v6 é quase 4% melhor neste teste que o E3-1240v5. O E-2134 está 21% à frente do E3-1230v5, 16% à frente do E3-1270v5 e 6,6% à frente do E3-1270v6. E o E-2136 é o melhor :-)



Uma tendência semelhante é observada no teste pbzip2, apenas E3-1230v6 é eliminado.



Eu gostaria de dizer que o teste de mp3 mostra uma “escada descendente” uniforme, mas a diferença entre os extremos nos gráficos do E3-1230v5 e do E-2136 é de apenas 9,5%, portanto, chamá-lo de “escada” não é muito correto. Além disso, o E3-1230v6 faz seus próprios ajustes, e o E3-1240v5 e o E3-1270v5 apenas adicionam gráficos de nivelamento.



No teste ffmpeg multithread, a “escada para baixo” já está sem rajadas e com uma área quase plana nas áreas de E3-1240v5, E3-1270v5 e E3-1230v6. O E-2136 neste teste é melhor que o E-2134 em 19%, E3-1230v5 em 32%, E3-1270v5 em 29% e E3-1270v6 em 22%.



O teste OpenSSL mostra uma “escada” com uma plataforma no E3-1240v5, E3-1270v5, E3-1230v6 e uma margem perceptível no E-2136. O E-2134 é 14% melhor que o E3-1230v5.
O E-2136 está 43% à frente do E3-1230v5, 36% à frente do E3-1270v6 e 33% à frente do E-2134.



No teste Apache, a diferença entre os processadores da família V5 é mínima. Na família V6, a “escada subiu”: o E3-1270v6 é 8,8% melhor que o E3-1230v6. A família Xeon E continua a tendência de crescimento e acrescenta "etapas": o E-2136 está 3% à frente do E-2134, 8% à frente do E3-1270v6 e 22% à frente do E3-1270v5. A diferença entre o primeiro representante da V5 e o novo E-2136 é de 24%. E3-1240v5 e E3-1270v5 no nível do erro. Um salto notável na transição da família V5 para V6: a diferença entre E3-1230v6 e E3-1240v5 é de 7%.



No teste do tempo de compilação do GCC, o E3-1230v5 está em último lugar, o penúltimo lugar é dividido entre E3-1240v5 e E3-1270v5. A vitória permanece para o E-2136 de seis núcleos.



Se no artigo anterior, onde eu testei o Core , escrevi que não estava surpreso com os resultados - eles eram previsíveis, desta vez não fiquei surpreso :-)

Mas primeiro, um pouco de fundo.

Devo dizer que tive que refazer todos os testes para o E3-1230v6. E tudo porque na primeira vez que cometi um erro - um representante da família V6 passou em um site de teste com RAM no modo de canal único. Como resultado, o índice aninhado no teste Geekbench - Memory Score, acabou sendo menor que o do E3-1240v5, o que influenciou bastante o resultado geral de todo o teste. O E3-1240v5 em termos de desempenho ultrapassou significativamente o E3-1230v6.

Uma imagem semelhante foi desenhada em todos os testes de thread único. Ele enrugou o cérebro por um longo tempo para dar pelo menos alguma explicação inteligível da situação (e até a encontrou!), Até esfregar os olhos e refazer todos os testes, mas com memória de dois canais. E agora para as conclusões.

Expectativas vs Realidade

A primeira coisa que eu esperava ver era o mesmo desempenho para E3-1240v5 e E3-1230v6. E eu vi. Em todos os testes, exceto mp3 e pbzip2, o E3-1230v6 é melhor ou igual ao E3-1240v5. Pessoalmente, não acho que isso seja um aumento líquido na microarquitetura. Muito provavelmente, esse resultado é obtido devido à maior velocidade de clock da RAM. Uma coisa que posso dizer com certeza: a memória em um canal afeta significativamente os resultados nos testes, portanto, tenha cuidado :)

Minha segunda hipótese dizia respeito a dois representantes da família V5 - E3-1240v5 e E3-1270v5. Honestamente, eu esperava encontrar pelo menos uma pequena diferença entre eles, mas como resultado dos testes, acabou não sendo nada da palavra. O efeito de 100 MHz adicionais deve ser observado ao microscópio na grande maioria dos testes.

Ao mesmo tempo, os mesmos 100 MHz são bastante visíveis a olho nu ao comparar o E3-1270v5 e o E3-1240v6. Suponho, novamente, que as frequências de memória sejam afetadas.

Voltamos ao novo Xeon E. Eu estava completamente despreparado pelo fato de que em testes de rosca única o E-2136 seria inferior ao E-2134. Embora a frequência base do modelo mais antigo seja mais baixa em 200 MHz, a frequência no impulso é a mesma. Repeti cada teste várias vezes com cada processador para obter o resultado esperado, mas não o consegui :) Eu realmente não gosto de tirar conclusões e conclusões, então adoraria conhecer as opiniões dos queridos leitores: o que pode ser associado a esse tipo incomum os resultados?

É aqui que as expectativas coincidem com a realidade; portanto, ao comparar a nova família Xeon E com seus antecessores, há previsões de que o novo E contornará o bom e velho E3, confirmado por testes. E se o E-2134 de quatro núcleos faz isso devido à frequência mais alta no impulso, o E-2136 quebra ainda mais devido aos seus honestos seis núcleos.

Em geral, a imagem é a seguinte. O novo Xeon E pode realmente ser visto como uma boa alternativa à família E3. Além disso, eles custam quase tanto quanto o V6 - maior desempenho pelo mesmo dinheiro. Se você estiver procurando por uma opção mais econômica, poderá escolher com segurança os três E3-1240v5 , E3-1270v5 e E3-1230v6 . De acordo com os resultados dos testes, eles se mostraram totalmente intercambiáveis.

Nos testes, usamos servidores baseados nos processadores Intel Xeon E3-1230v5, E3-1240v5, E3-1270v5, E3-1230v6, E3-1240v6, E3-1270v6, E-2134 e E-2136 com 1dedic.ru .

Até 1º de maio, os servidores com o novo Xeon E podem ser solicitados com um desconto de 25% por 1 mês usando o código promocional XEONE_HABR . O código promocional será gravado à meia-noite de 30 de abril de 2019.

Para qualquer servidor dedicado, um desconto de 10% no pagamento do ano.

Testado e escrito para você por Trashwind , o administrador do sistema do FirstDEDIC.

Source: https://habr.com/ru/post/pt447660/


All Articles