
Em 7 de agosto, a linha AMD EPYC ™ de segunda geração foi lançada em todo o mundo. Os novos processadores são baseados na microarquitetura
Zen 2 e são construídos em um processo de 7 nm.
Funcionalidades
"Eles são recebidos por roupas, escoltados pela mente", diz a sabedoria popular. Então, vamos começar com as "roupas" da nova geração. A marcação dos processadores sofreu pequenas alterações: o quarto dígito que indica a geração mudou de
1 para
2 . A primeira figura, como antes, indica a série, e a segunda e a terceira - o modelo. A AMD não abandonou os processadores com o índice P, que não suportam sistemas com vários soquetes.
A segunda geração herdou o soquete
SP3 da primeira geração sem alterações, o que permite o uso de novos processadores sem atualizar a placa-mãe, mas isso não será capaz de revelar completamente seu potencial. É possível obter desempenho total com o uso de novas placas-mãe com suporte a 3200 MHz para memória DDR4.
O “preenchimento” do processador foi transformado além do reconhecimento: o processo tecnológico mudou, uma nova microarquitetura
Zen 2 foi aplicada e um novo controlador de memória de alta velocidade apareceu.
Desempenho
A transição para o processo de
7 nm levou à compactação do cristal e a um aumento no número de núcleos para
64 , duas vezes mais alto que na primeira geração. A frequência base dos processadores de segunda geração está na faixa
de 2,00 a 2,90 GHz . Para comparação, a base da primeira geração não excedeu
2,30 GHz . Um aumento no número de núcleos e na frequência base do processador levou a um aumento na dissipação de calor de até
120 watts nas versões econômicas e de
225 watts nas versões superiores.
A melhoria de processos não é a única inovação. Uma nova microarquitetura chamada
Zen 2 contribuiu para o aprimoramento das especificações do processador. As melhorias visam interagir com caches: a velocidade de troca de dados com L1 dobrou, a velocidade de transferência de dados entre caches aumentou, o tamanho do cache L3 aumentou.
As especificações detalhadas da linha são apresentadas na tabela.
Roma possui uma melhoria no trabalho com dispositivos externos: pela primeira vez, tornou-se possível trabalhar com um
controlador de interrupção
x2APIC externo e também oferece suporte
às pistas DDR4-3200 e
128-PCIe . A nova geração de processadores inclui suporte para a tecnologia
IOMMU virtualizada , com a qual as máquinas virtuais obtêm acesso direto aos periféricos físicos.
Aumentar a capacidade e melhorar as condições da virtualização leva a um aumento no número de aplicativos em execução simultânea. Os aplicativos trabalham com dados confidenciais que precisam de proteção aprimorada.
Segurança
Na linha atualizada de processadores, os problemas de segurança não eram o último lugar. Dentro do sistema, um processador é instalado em um chip chamado
AMD Secure Processor baseado no
ARM® Cortex® A5 , que armazena chaves e criptografa o conteúdo da RAM usando o algoritmo
AES-128 .
O AMD Secure Processor oferece dois tipos de criptografia de memória (esses métodos exigem suporte ao SO):
- SME (criptografia de memória segura);
O SME criptografa a memória com uma única chave e protege contra ataques físicos, como ataques de inicialização a frio. O uso desse tipo de criptografia não requer alterações nos aplicativos do usuário: o sistema operacional marca as páginas de memória que precisam ser criptografadas.
- SEV (Virtualização Criptografada Segura).
O SEV foi projetado para fornecer segurança ao trabalhar com máquinas virtuais (VMs). A memória usada pelo hypervisor e cada VM é criptografada com sua própria chave. Essa abordagem isola criptograficamente o hypervisor e a VM um do outro.
Servidores de teste
Agora que a teoria da novidade é conhecida, realizaremos testes práticos. O AMD EPYC ™ 7452 será o representante da segunda geração.O AMD EPYC ™ 7551 é escolhido como o oponente da primeira geração.O oponente do campo “azul” é o Intel® Xeon® Gold 5218 como parte de um sistema de dois soquetes. A escolha desses sistemas é justificada pela similaridade de suas características técnicas.
Nos testes, os processadores são colocados em pé de igualdade: a mesma memória, as mesmas unidades e sistemas operacionais idênticos com configurações idênticas.
Para obter desempenho máximo, todos os canais do controlador de memória do processador devem estar habilitados. Os processadores Intel® têm seis canais e os processadores AMD têm oito canais. Dada essa diferença, é difícil criar condições idênticas; portanto, foi encontrado um compromisso: os sistemas com processadores AMD têm 8 módulos de 16 GB cada e um sistema de soquete duplo com Intel® Xeon® possui 12 módulos de 8 GB cada. Todos os módulos de RAM operam com uma frequência de
2666 MHz .
O sistema operacional (SO) é hospedado em SSDs para reduzir o impacto do subsistema de disco nos testes. Todos os testes foram realizados no CentOS versão 7.
Testes
O teste deve ser o mais objetivo possível, principalmente porque estamos falando sobre a comparação de processadores Intel® e AMD. Portanto, não usaremos otimizadores de compilação para criar testes que são fornecidos como códigos-fonte.
GeekBench 4
O GeekBench é um popular teste de desempenho de processador multiplataforma com seu próprio
banco de dados online de resultados. O teste é entregue na forma de arquivos executáveis prontos, e é por isso que a otimização para processadores específicos não é fornecida.
As métricas gerais dos grupos GeekBench são importantes para nós:
- Pontuação Crypto;
- Pontuação Inteira;
- Pontuação em ponto flutuante;
- Pontuação de memória.
Os grupos de testes indicados são iniciados em dois modos: em um único encadeamento e quando executados simultaneamente em todos os núcleos. Com base nos resultados, o GeekBench coloca as classificações finais:
Pontuação de núcleo único e Pontuação de núcleo múltiplo .
A principal batalha está entre o AMD EPYC ™ 7452 e o Intel® Xeon® Gold 5218, enquanto a primeira geração do EPYC ™ é inferior à segunda em todos os testes.
Considere testes de thread único.
Roma mostra excelentes resultados ao trabalhar com tarefas e memória criptográficas, mas perde ao executar cálculos inteiros. Como resultado, a segunda geração do EPYC ™ obtém 4893 pontos e se torna o vencedor na indicação de
núcleo único . O segundo e o terceiro lugares são ocupados por Xeon e EPYC da primeira geração, com 4695 e 3981 pontos, respectivamente.
Em testes multithread, o equilíbrio de poder muda significativamente.
O EPYC ™ 7452 faz um ótimo trabalho de computação, mas está perdendo espaço em tarefas criptográficas e trabalhando com memória , o que não impede que ele se torne um líder com 96009 pontos na indicação
Multi-Core .
SPEC CPU 2017
O SPEC CPU 2017 é um conjunto de testes de desempenho reconhecidos pelos fabricantes de processadores. Os testes deste conjunto são distribuídos na forma de códigos-fonte, o que permite otimizá-los para equipamentos específicos em um sistema operacional específico.
A CPU SPEC consiste em quatro suítes de teste:
- int_rate;
- int_speed;
- fp_rate;
- fp_speed.
A primeira parte do nome do teste determina o tipo de cálculo no processador: números inteiros (int) ou acima de números de ponto flutuante (fp). A segunda parte determina o tipo de teste: single-core (taxa) ou multi-core (velocidade).
Realizamos todas as quatro suítes de teste. Os testes são compilados no terceiro nível de otimizações usando o conjunto de compiladores
GNU 4.8.5 . Testes de vários núcleos executados em 64 threads e testes de núcleo único executados em 32 cópias.
Testes compilados com otimizações mostram resultados inconsistentes com o GeekBench. A segunda geração do AMD EPYC ™ é superior ao sistema de soquete duplo com processadores Intel® em todos os testes, exceto na velocidade de entrada, mas com uma margem significativamente menor do que no GeekBench.
Phoronix Test Suite
Phoronix Test Suite (PTS) - software que permite executar testes em um grande banco de dados de testes de desempenho do usuário. Essa solução permite executar automaticamente os testes desejados em vários servidores experimentais simultaneamente com a agregação de resultados no servidor mestre.
Desenvolvemos nosso próprio conjunto de 21 testes, incluindo:
- Teste de largura de banda do cache (CacheBench);
- testando a largura de banda da RAM (velocidade da RAM, fluxo, MBW);
- solução de tarefas criptográficas (Botan, OpenSSL, John, o Estripador);
- renderização de imagens usando traçado de raios (C-Ray, POV-Ray, Smallpt);
- emulação do servidor NGINX sob carga;
- conversão de áudio / vídeo.
| EPYC 7452 | EPYC 7551 | 2 x Xeon 5218 |
RAMspeed SMP - Tipo: Adicionar - Referência: Inteiro | 32476,9 | 26531.49 | 28942,2 |
RAMspeed SMP - Tipo: Copiar - Referência: Inteiro | 30325.76 | 23419.86 | 27165.75 |
RAMspeed SMP - Tipo: Escala - Referência: Inteiro | 30429,76 | 22011.08 | 28629.12 |
RAMspeed SMP - Tipo: Tríade - Referência: Inteiro | 31482,6 | 18208.58 | 28299.14 |
RAMspeed SMP - Tipo: Médio - Referência: Inteiro | 31060.8 | 31745.71 | 28432.31 |
RAMspeed SMP - Tipo: Adicionar - Referência: Ponto flutuante | 32434.26 | 37939,5 | 28445.26 |
RAMspeed SMP - Tipo: Cópia - Referência: Ponto flutuante | 30386.99 | 35209.97 | 27119.9 |
RAMspeed SMP - Tipo: Escala - Referência: Ponto flutuante | 30.097,11 | 30509.05 | 26508.4 |
RAMspeed SMP - Tipo: Tríade - Referência: Ponto flutuante | 32473.04 | 38458,6 | 28385.89 |
RAMspeed SMP - Tipo: Médio - Referência: Ponto flutuante | 31295,5 | 34393,3 | 27.637,44 |
Fluxo - Tipo: Copiar | 107.192,8 | 110.996,94 | 126.257,4 |
Stream - Tipo: Escala | 72.434,42 | 87.300,88 | 105633.7 |
Stream - Tipo: Tríade | 77729,72 | 97735.96 | 115100.86 |
Stream - Tipo: Adicionar | 77021.16 | 97.204,36 | 114907.6 |
MBW - Teste: cópia de memória - tamanho da matriz: 8192 MiB | 16888.52 | 12.402,32 | 4845.29 |
MBW - Teste: cópia de memória, tamanho de bloco fixo - tamanho da matriz: 8192 MiB | 10752.12 | 7410.17 | 2982,56 |
CacheBench - Teste: Leitura | 2312.41 | 2079,62 | 3286,28 |
CacheBench - Teste: Gravação | 24357,4 | 20329.21 | 27520.75 |
CacheBench - Teste: Leitura / Modificação / Gravação | 24920,3 | 21.598,98 | 28966.95 |
GNU MPC - Referência de Precisão Múltipla | 7143 | 5810 | 8950 |
NAMD - ATPase Simulation - 327.506 átomos | 0,80079 | 0,94119 | 0,77091 |
Botan - Teste: KASUMI - Criptografar | 69,69 | 61,74 | 78,69 |
Botan - Teste: KASUMI - Descriptografar | 67,16 | 58,57 | 74,85 |
Botan - Teste: AES-256 - Criptografar | 4575.94 | 4.173,76 | 3687.71 |
Botan - Teste: AES-256 - Descriptografar | 4552.92 | 4152,07 | 3704,3 |
Botan - Teste: Twofish - Criptografar | 279,59 | 247,38 | 325,1 |
Botan - Teste: Twofish - Descriptografar | 281,87 | 249,85 | 333,97 |
Botan - Teste: Blowfish - Criptografar | 247,76 | 217,14 | 282,4 |
Botan - Teste: Blowfish - Descriptografar | 249,19 | 217,89 | 283,61 |
Botan - Teste: CAST-256 - Criptografar | 116.150 | 101.470 | 124.690 |
Botan - Teste: CAST-256 - Descriptografar | 116,68 | 101,95 | 125,75 |
John The Ripper - Teste: Blowfish | 49851 | 40568 | 39555 |
Compressão 7-Zip - Teste de velocidade de compressão | 163202 | 107009 | 135458 |
C-Ray - Tempo total - 4K, 16 raios por pixel | 23,41 | 26,65 | 29,48 |
POV-Ray - Tempo de rastreamento | 18,67 | 23,3 | 20,46 |
Smallpt - Renderizador de iluminação global; 128 amostras | 15,06 | 5,52 | 58,97 |
dav1d - Entrada de vídeo: Summer Nature 4K | 17,67 | 28,37 | 20,98 |
Codificação de áudio FLAC - WAV para FLAC | 12,22 | 14,17 | 11,43 |
FFmpeg - H.264 HD para NTSC DV | 9,14 | 10,85 | 11,46 |
Hackbench - Contagem: 1 - Tipo: Tópico | 3.9 | 5,82 | 3,35 |
Hackbench - Contagem: 8 - Tipo: Tópico | 10,9 | 18.11 | 8,73 |
Hackbench - Contagem: 1 - Tipo: Processo | 3,78 | 5,43 | 3,15 |
Hackbench - Contagem: 8 - Tipo: Processo | 9,66 | 13,31 | 8.14 |
Hackbench - Contagem: 32 - Tipo: Processo | 39,02 | 32,25 | 27,74 |
OpenSSL - Desempenho do RSA 4096 bits | 6825,9 | 4351.47 | 6809,23 |
ctx_clock - Hora da alternância de contexto | 211 | 220 | 160 |
NGINX Benchmark - veiculação de página estática na Web | 26991.79 | 17497.02 | 28274.97 |
Schbench - Tópicos de Mensagens: 2 - Trabalhadores por Tópico de Mensagens: 2 | 42. | 204 | 101 |
Schbench - Tópicos de Mensagens: 8 - Trabalhadores por Tópico de Mensagens: 8 | 4624 | 4704 | 7009 |
Schbench - Tópicos de mensagens: 32 - Trabalhadores por segmento de mensagens: 32 | 156416 | 157952 | 167509 |
Radiance Benchmark - Teste: Serial | 807,01 | 783,48 | 1102,24 |
Radiance Benchmark - Teste: SMP Parallel | 260,47 | 238,69 | 333,32 |
Pela primeira vez em testes, o AMD EPYC ™ 7551 vem em primeiro lugar.
Os processadores AMD, independentemente da geração, são melhores no trabalho de thread único com transcodificação de memória, renderização e vídeo. Os processadores Intel®, por sua vez, se saem melhor com tarefas criptográficas e trabalho multithread com memória, como foi revelado anteriormente nos testes do GeekBench.
Conclusões
Apesar da variedade de testes, a escolha entre a primeira e a segunda geração do AMD EPYC ™ é óbvia:
Roma é superior ao seu antecessor na grande maioria dos testes. No entanto, a primeira geração não perde terreno ao trabalhar com memória e renderização.
Comparação de processadores Intel® e AMD - uma verdadeira batalha dos titãs, exigindo consideração detalhada. As soluções de software instaladas apresentam melhor desempenho, em média, com a segunda geração do AMD EPYC ™. Em particular, Roma mostra excelentes resultados em tarefas de computação multithreaded e de criptografia single-threaded. Ao trabalhar com software compilado a partir de códigos-fonte, é dada preferência à nova geração de processadores EPYC ™, que são líderes em testes de ponto flutuante e apenas ligeiramente atrasados em cálculos de números inteiros com vários segmentos.
O Intel® Xeon® Gold, por sua vez, mostra bons resultados em criptografia multithread, transcodificação de áudio e manipulação de memória. O sistema de soquete duplo com os processadores Intel® Xeon® teve bom desempenho ao processar solicitações de servidor da web.
Em resumo, deve-se notar que os testes realizados são sintéticos e os resultados em tarefas reais podem variar. Para obter resultados precisos em tarefas específicas, são necessários testes adicionais. Agora, apenas algumas palavras sobre o custo. O preço recomendado do AMD EPYC® 7452 é de US $ 2025, para o Intel® Xeon® Gold 5218 - US $ 1250, ou seja, US $ 2500 para a organização de um sistema de soquete duplo.
O novo AMD EPYC ™ 7452 estará disponível em breve em nosso laboratório Selectel.Seja o primeiro a saber!
A segunda geração do EPYC ™ é apenas mais uma rodada no confronto entre a AMD e a Intel. Você pode ler mais sobre como a rivalidade entre as duas empresas começou em nosso
blog .
UPD Novos processadores AMD EPYC ™ de segunda geração já disponíveis.
Crie seu próprio servidor baseado no AMD EPYC ™ Rome 7402P usando o configurador ou deixe uma solicitação de teste em nosso laboratório Selectel LAB.
As seguintes configurações estão disponíveis para teste:
- 1 x AMD EPYC ™ 7402P / DDR4 de 128 GB / SSD 2 × 1920 GB + HDD 2 × 8 TB
- 1 x AMD EPYC ™ 7552/512 GB DDR4 / SSD 2 × 1940 GB + HDD 2 × 8 TB