Nápoles a Roma: Novas CPUs AMD EPYC



Em 7 de agosto, a linha AMD EPYC ™ de segunda geração foi lançada em todo o mundo. Os novos processadores são baseados na microarquitetura Zen 2 e são construídos em um processo de 7 nm.

Funcionalidades



"Eles são recebidos por roupas, escoltados pela mente", diz a sabedoria popular. Então, vamos começar com as "roupas" da nova geração. A marcação dos processadores sofreu pequenas alterações: o quarto dígito que indica a geração mudou de 1 para 2 . A primeira figura, como antes, indica a série, e a segunda e a terceira - o modelo. A AMD não abandonou os processadores com o índice P, que não suportam sistemas com vários soquetes.

A segunda geração herdou o soquete SP3 da primeira geração sem alterações, o que permite o uso de novos processadores sem atualizar a placa-mãe, mas isso não será capaz de revelar completamente seu potencial. É possível obter desempenho total com o uso de novas placas-mãe com suporte a 3200 MHz para memória DDR4.

O “preenchimento” do processador foi transformado além do reconhecimento: o processo tecnológico mudou, uma nova microarquitetura Zen 2 foi aplicada e um novo controlador de memória de alta velocidade apareceu.

Desempenho


A transição para o processo de 7 nm levou à compactação do cristal e a um aumento no número de núcleos para 64 , duas vezes mais alto que na primeira geração. A frequência base dos processadores de segunda geração está na faixa de 2,00 a 2,90 GHz . Para comparação, a base da primeira geração não excedeu 2,30 GHz . Um aumento no número de núcleos e na frequência base do processador levou a um aumento na dissipação de calor de até 120 watts nas versões econômicas e de 225 watts nas versões superiores.

A melhoria de processos não é a única inovação. Uma nova microarquitetura chamada Zen 2 contribuiu para o aprimoramento das especificações do processador. As melhorias visam interagir com caches: a velocidade de troca de dados com L1 dobrou, a velocidade de transferência de dados entre caches aumentou, o tamanho do cache L3 aumentou.

As especificações detalhadas da linha são apresentadas na tabela.
ModeloTDP, WattNúmero de núcleosFrequência base, GHzFrequência máxima, GHzCache L3 de tamanho, MB
7742225642,253,40256
7702 / 7702P200642,003,35256
764222548.2,303,30256
755220048.2,203,30192
754222532.2,903,40128
7502 / 7502P18032.2,503,35128
745215532.2,353,35128
7402 / 7402P180242,803,35128
7352155242,303,20128
7302 / 7302P155163,003,30128
7282120162,803,2064
7272120122,903,2064
726215583,203,40128
725212083,103,2064
7232P12083,103,2032.
Roma possui uma melhoria no trabalho com dispositivos externos: pela primeira vez, tornou-se possível trabalhar com um controlador de interrupção x2APIC externo e também oferece suporte às pistas DDR4-3200 e 128-PCIe . A nova geração de processadores inclui suporte para a tecnologia IOMMU virtualizada , com a qual as máquinas virtuais obtêm acesso direto aos periféricos físicos.

Aumentar a capacidade e melhorar as condições da virtualização leva a um aumento no número de aplicativos em execução simultânea. Os aplicativos trabalham com dados confidenciais que precisam de proteção aprimorada.

Segurança


Na linha atualizada de processadores, os problemas de segurança não eram o último lugar. Dentro do sistema, um processador é instalado em um chip chamado AMD Secure Processor baseado no ARM® Cortex® A5 , que armazena chaves e criptografa o conteúdo da RAM usando o algoritmo AES-128 .

O AMD Secure Processor oferece dois tipos de criptografia de memória (esses métodos exigem suporte ao SO):

  • SME (criptografia de memória segura);

    O SME criptografa a memória com uma única chave e protege contra ataques físicos, como ataques de inicialização a frio. O uso desse tipo de criptografia não requer alterações nos aplicativos do usuário: o sistema operacional marca as páginas de memória que precisam ser criptografadas.
  • SEV (Virtualização Criptografada Segura).

    O SEV foi projetado para fornecer segurança ao trabalhar com máquinas virtuais (VMs). A memória usada pelo hypervisor e cada VM é criptografada com sua própria chave. Essa abordagem isola criptograficamente o hypervisor e a VM um do outro.

Servidores de teste


Agora que a teoria da novidade é conhecida, realizaremos testes práticos. O AMD EPYC ™ 7452 será o representante da segunda geração.O AMD EPYC ™ 7551 é escolhido como o oponente da primeira geração.O oponente do campo “azul” é o Intel® Xeon® Gold 5218 como parte de um sistema de dois soquetes. A escolha desses sistemas é justificada pela similaridade de suas características técnicas.
EPYC 7452EPYC 7551Xeon 5218
Número de núcleos32.32.16
Número de threads646432.
Frequência base, GHz2,352,002,30
Frequência máxima, GHz3,703,003,90
TDP, Watt155180125
Tipo de RAMDDR4-3200DDR4-2666DDR4-2666
Cache L1, KB204830721024
Cache L2, KB163841638416384
Cache L3, MB1286422
Nos testes, os processadores são colocados em pé de igualdade: a mesma memória, as mesmas unidades e sistemas operacionais idênticos com configurações idênticas.

Para obter desempenho máximo, todos os canais do controlador de memória do processador devem estar habilitados. Os processadores Intel® têm seis canais e os processadores AMD têm oito canais. Dada essa diferença, é difícil criar condições idênticas; portanto, foi encontrado um compromisso: os sistemas com processadores AMD têm 8 módulos de 16 GB cada e um sistema de soquete duplo com Intel® Xeon® possui 12 módulos de 8 GB cada. Todos os módulos de RAM operam com uma frequência de 2666 MHz .

O sistema operacional (SO) é hospedado em SSDs para reduzir o impacto do subsistema de disco nos testes. Todos os testes foram realizados no CentOS versão 7.
EPYC 7452EPYC 7551Xeon 5218
Processadores1 x AMD EPYC 74521 x AMD EPYC 75512 x Intel Xeon 5218
RAM8 x 16GB DDR4-26668 x 16GB DDR4-2666DDR4-2666 de 12 x 8 GB
Discos1 x Samsung SSD 850 EVO 250GB1 x Intel SSD S4510 480 GB1 x Intel SSD S4510 480 GB

Testes


O teste deve ser o mais objetivo possível, principalmente porque estamos falando sobre a comparação de processadores Intel® e AMD. Portanto, não usaremos otimizadores de compilação para criar testes que são fornecidos como códigos-fonte.

GeekBench 4


O GeekBench é um popular teste de desempenho de processador multiplataforma com seu próprio banco de dados online de resultados. O teste é entregue na forma de arquivos executáveis ​​prontos, e é por isso que a otimização para processadores específicos não é fornecida.

As métricas gerais dos grupos GeekBench são importantes para nós:

  • Pontuação Crypto;
  • Pontuação Inteira;
  • Pontuação em ponto flutuante;
  • Pontuação de memória.

Os grupos de testes indicados são iniciados em dois modos: em um único encadeamento e quando executados simultaneamente em todos os núcleos. Com base nos resultados, o GeekBench coloca as classificações finais: Pontuação de núcleo único e Pontuação de núcleo múltiplo .


A principal batalha está entre o AMD EPYC ™ 7452 e o Intel® Xeon® Gold 5218, enquanto a primeira geração do EPYC ™ é inferior à segunda em todos os testes.

Considere testes de thread único. Roma mostra excelentes resultados ao trabalhar com tarefas e memória criptográficas, mas perde ao executar cálculos inteiros. Como resultado, a segunda geração do EPYC ™ obtém 4893 pontos e se torna o vencedor na indicação de núcleo único . O segundo e o terceiro lugares são ocupados por Xeon e EPYC da primeira geração, com 4695 e 3981 pontos, respectivamente.


Em testes multithread, o equilíbrio de poder muda significativamente. O EPYC ™ 7452 faz um ótimo trabalho de computação, mas está perdendo espaço em tarefas criptográficas e trabalhando com memória , o que não impede que ele se torne um líder com 96009 pontos na indicação Multi-Core .

SPEC CPU 2017


O SPEC CPU 2017 é um conjunto de testes de desempenho reconhecidos pelos fabricantes de processadores. Os testes deste conjunto são distribuídos na forma de códigos-fonte, o que permite otimizá-los para equipamentos específicos em um sistema operacional específico.

A CPU SPEC consiste em quatro suítes de teste:

  • int_rate;
  • int_speed;
  • fp_rate;
  • fp_speed.

A primeira parte do nome do teste determina o tipo de cálculo no processador: números inteiros (int) ou acima de números de ponto flutuante (fp). A segunda parte determina o tipo de teste: single-core (taxa) ou multi-core (velocidade).

Realizamos todas as quatro suítes de teste. Os testes são compilados no terceiro nível de otimizações usando o conjunto de compiladores GNU 4.8.5 . Testes de vários núcleos executados em 64 threads e testes de núcleo único executados em 32 cópias.


Testes compilados com otimizações mostram resultados inconsistentes com o GeekBench. A segunda geração do AMD EPYC ™ é superior ao sistema de soquete duplo com processadores Intel® em todos os testes, exceto na velocidade de entrada, mas com uma margem significativamente menor do que no GeekBench.

Phoronix Test Suite


Phoronix Test Suite (PTS) - software que permite executar testes em um grande banco de dados de testes de desempenho do usuário. Essa solução permite executar automaticamente os testes desejados em vários servidores experimentais simultaneamente com a agregação de resultados no servidor mestre.

Desenvolvemos nosso próprio conjunto de 21 testes, incluindo:

  • Teste de largura de banda do cache (CacheBench);
  • testando a largura de banda da RAM (velocidade da RAM, fluxo, MBW);
  • solução de tarefas criptográficas (Botan, OpenSSL, John, o Estripador);
  • renderização de imagens usando traçado de raios (C-Ray, POV-Ray, Smallpt);
  • emulação do servidor NGINX sob carga;
  • conversão de áudio / vídeo.
EPYC 7452EPYC 75512 x Xeon 5218
RAMspeed SMP - Tipo: Adicionar - Referência: Inteiro32476,926531.4928942,2
RAMspeed SMP - Tipo: Copiar - Referência: Inteiro30325.7623419.8627165.75
RAMspeed SMP - Tipo: Escala - Referência: Inteiro30429,7622011.0828629.12
RAMspeed SMP - Tipo: Tríade - Referência: Inteiro31482,618208.5828299.14
RAMspeed SMP - Tipo: Médio - Referência: Inteiro31060.831745.7128432.31
RAMspeed SMP - Tipo: Adicionar - Referência: Ponto flutuante32434.2637939,528445.26
RAMspeed SMP - Tipo: Cópia - Referência: Ponto flutuante30386.9935209.9727119.9
RAMspeed SMP - Tipo: Escala - Referência: Ponto flutuante30.097,1130509.0526508.4
RAMspeed SMP - Tipo: Tríade - Referência: Ponto flutuante32473.0438458,628385.89
RAMspeed SMP - Tipo: Médio - Referência: Ponto flutuante31295,534393,327.637,44
Fluxo - Tipo: Copiar107.192,8110.996,94126.257,4
Stream - Tipo: Escala72.434,4287.300,88105633.7
Stream - Tipo: Tríade77729,7297735.96115100.86
Stream - Tipo: Adicionar77021.1697.204,36114907.6
MBW - Teste: cópia de memória - tamanho da matriz: 8192 MiB16888.5212.402,324845.29
MBW - Teste: cópia de memória, tamanho de bloco fixo - tamanho da matriz: 8192 MiB10752.127410.172982,56
CacheBench - Teste: Leitura2312.412079,623286,28
CacheBench - Teste: Gravação24357,420329.2127520.75
CacheBench - Teste: Leitura / Modificação / Gravação24920,321.598,9828966.95
GNU MPC - Referência de Precisão Múltipla714358108950
NAMD - ATPase Simulation - 327.506 átomos0,800790,941190,77091
Botan - Teste: KASUMI - Criptografar69,6961,7478,69
Botan - Teste: KASUMI - Descriptografar67,1658,5774,85
Botan - Teste: AES-256 - Criptografar4575.944.173,763687.71
Botan - Teste: AES-256 - Descriptografar4552.924152,073704,3
Botan - Teste: Twofish - Criptografar279,59247,38325,1
Botan - Teste: Twofish - Descriptografar281,87249,85333,97
Botan - Teste: Blowfish - Criptografar247,76217,14282,4
Botan - Teste: Blowfish - Descriptografar249,19217,89283,61
Botan - Teste: CAST-256 - Criptografar116.150101.470124.690
Botan - Teste: CAST-256 - Descriptografar116,68101,95125,75
John The Ripper - Teste: Blowfish498514056839555
Compressão 7-Zip - Teste de velocidade de compressão163202107009135458
C-Ray - Tempo total - 4K, 16 raios por pixel23,4126,6529,48
POV-Ray - Tempo de rastreamento18,6723,320,46
Smallpt - Renderizador de iluminação global; 128 amostras15,065,5258,97
dav1d - Entrada de vídeo: Summer Nature 4K17,6728,3720,98
Codificação de áudio FLAC - WAV para FLAC12,2214,1711,43
FFmpeg - H.264 HD para NTSC DV9,1410,8511,46
Hackbench - Contagem: 1 - Tipo: Tópico3.95,823,35
Hackbench - Contagem: 8 - Tipo: Tópico10,918.118,73
Hackbench - Contagem: 1 - Tipo: Processo3,785,433,15
Hackbench - Contagem: 8 - Tipo: Processo9,6613,318.14
Hackbench - Contagem: 32 - Tipo: Processo39,0232,2527,74
OpenSSL - Desempenho do RSA 4096 bits6825,94351.476809,23
ctx_clock - Hora da alternância de contexto211220160
NGINX Benchmark - veiculação de página estática na Web26991.7917497.0228274.97
Schbench - Tópicos de Mensagens: 2 - Trabalhadores por Tópico de Mensagens: 242.204101
Schbench - Tópicos de Mensagens: 8 - Trabalhadores por Tópico de Mensagens: 8462447047009
Schbench - Tópicos de mensagens: 32 - Trabalhadores por segmento de mensagens: 32156416157952167509
Radiance Benchmark - Teste: Serial807,01783,481102,24
Radiance Benchmark - Teste: SMP Parallel260,47238,69333,32
Pela primeira vez em testes, o AMD EPYC ™ 7551 vem em primeiro lugar. Os processadores AMD, independentemente da geração, são melhores no trabalho de thread único com transcodificação de memória, renderização e vídeo. Os processadores Intel®, por sua vez, se saem melhor com tarefas criptográficas e trabalho multithread com memória, como foi revelado anteriormente nos testes do GeekBench.

Conclusões


Apesar da variedade de testes, a escolha entre a primeira e a segunda geração do AMD EPYC ™ é óbvia: Roma é superior ao seu antecessor na grande maioria dos testes. No entanto, a primeira geração não perde terreno ao trabalhar com memória e renderização.

Comparação de processadores Intel® e AMD - uma verdadeira batalha dos titãs, exigindo consideração detalhada. As soluções de software instaladas apresentam melhor desempenho, em média, com a segunda geração do AMD EPYC ™. Em particular, Roma mostra excelentes resultados em tarefas de computação multithreaded e de criptografia single-threaded. Ao trabalhar com software compilado a partir de códigos-fonte, é dada preferência à nova geração de processadores EPYC ™, que são líderes em testes de ponto flutuante e apenas ligeiramente atrasados ​​em cálculos de números inteiros com vários segmentos.

O Intel® Xeon® Gold, por sua vez, mostra bons resultados em criptografia multithread, transcodificação de áudio e manipulação de memória. O sistema de soquete duplo com os processadores Intel® Xeon® teve bom desempenho ao processar solicitações de servidor da web.

Em resumo, deve-se notar que os testes realizados são sintéticos e os resultados em tarefas reais podem variar. Para obter resultados precisos em tarefas específicas, são necessários testes adicionais. Agora, apenas algumas palavras sobre o custo. O preço recomendado do AMD EPYC® 7452 é de US $ 2025, para o Intel® Xeon® Gold 5218 - US $ 1250, ou seja, US $ 2500 para a organização de um sistema de soquete duplo.
O novo AMD EPYC ™ 7452 estará disponível em breve em nosso laboratório Selectel.

Seja o primeiro a saber!

A segunda geração do EPYC ™ é apenas mais uma rodada no confronto entre a AMD e a Intel. Você pode ler mais sobre como a rivalidade entre as duas empresas começou em nosso blog .
UPD Novos processadores AMD EPYC ™ de segunda geração já disponíveis.

Crie seu próprio servidor baseado no AMD EPYC ™ Rome 7402P usando o configurador ou deixe uma solicitação de teste em nosso laboratório Selectel LAB.

As seguintes configurações estão disponíveis para teste:

  • 1 x AMD EPYC ™ 7402P / DDR4 de 128 GB / SSD 2 × 1920 GB + HDD 2 × 8 TB
  • 1 x AMD EPYC ™ 7552/512 GB DDR4 / SSD 2 × 1940 GB + HDD 2 × 8 TB

Source: https://habr.com/ru/post/pt463401/


All Articles