Monstros após as férias: AMD Threadripper 2990WX 32-Core e 2950X 16-Core (parte 5)

Parte 1Parte 2Parte 3Parte 4 → Parte 5

Comparações térmicas e XFR2: Lembre-se de remover o plástico do resfriador!



Cada máquina persegue objetivos com prioridades diferentes: desempenho, consumo, ruído, desempenho térmico ou custo. É muito difícil alcançar todos de uma vez, portanto, escolher dois ou três objetivos é uma boa idéia. Como perder em todas as cinco direções? Bem-vindo ao meu mundo. O mundo em que eu testei o AMD Ryzen Threadripper 2990WX de 32 núcleos, esquecendo de remover o plástico do meu refrigerador de líquidos.

Não remonte o sistema após um longo voo.

Quase todos os novos refrigeradores, unidades de ar, líquido e água, vêm completos com juntas, espuma, parafusos, ventiladores e um conjunto de instruções. Dependendo do fabricante e do tipo de embalagem, a parte inferior do cooler do processador será preparada de duas maneiras:

  1. Massa térmica pré-aplicada
  2. Pequena fita plástica autoadesiva para proteger o polimento durante o transporte

Conheça em nossa análise o enorme refrigerador de ar Wraith Ripper, fabricado pela Cooler Master, mas promovido pela AMD como o refrigerador de base para os novos processadores Threadripper 2. A graxa térmica é aplicada densamente em toda a sua base. Quando tentei tirar fotos, estraguei tudo.



Também incluído em nossa análise está o refrigerador líquido Enermax Liqtech TR4 com um tubo de pasta térmica. A parte inferior da unidade em contato com a CPU foi coberta com uma fita plástica autoadesiva protetora.


Exemplo do Twitter do TechTeamGB

Então, o momento da confissão. Nosso kit de pesquisa chegou um dia antes de mim. A ação ocorreu durante minha jornada com o Reino Unido em São Francisco no Flash Memory Summit e no Intel Datacenter Summit. Em minhas malas, trouxe uma placa-mãe X399 (ASUS ROG Zenith), três chips X399 (2990WX, 2950X, 1950X), uma placa-mãe X299 (ASRock X299 OC Formula), vários chips Skylake-X, uma fonte de alimentação Corsair AX860i, RX 460, um mouse , teclado, cabos - simplesmente componentes para montar dois sistemas e usar o monitor em um quarto de hotel para testes. Após um voo direto de 11 horas, duas horas no controle de passaporte e mais de uma hora em um táxi da Uber para o meu hotel, montei um sistema com 2990WX.

Não removi o plástico do refrigerador Enermax. Eu não percebi isso. Apliquei graxa térmica no processador e não suspeitei de nada, mesmo quando apertei os parafusos.

Ajustei o sistema para a frequência máxima de memória suportada, instalei o Windows, instalei atualizações de segurança, instalei testes e iniciei o sistema a noite toda enquanto dormia. Eu nem suspeitava que o plástico permanecesse preso. De manhã, a suíte de testes já terminou o trabalho. Depois de concluir alguns testes adicionais, como medir a latência da frequência base, fui substituir o processador pelo 2950X. Foi nessa época que realizei um rosto expressivo.



Quando vi a graxa térmica manchada no processador e no plástico, percebi que teria que reiniciar tudo. Depois de remover o plástico, inseri o processador, montei o sistema, desta vez com o melhor perfil térmico.

O desempenho térmico é importante.


O objetivo de qualquer sistema é mantê-lo na “janela de temperatura” correta para uma operação estável: a maioria dos processadores é projetada para funcionar corretamente em temperaturas de até 105 ° C, após o que são desligados para evitar danos térmicos. Quando um processador aciona elétrons em cadeias e faz todo o tipo de coisas necessárias, consome energia. Essa energia é perdida como calor, dissipada do chip em duas direções principais: soquete e mais frio.



Os processadores AMD Threadripper possuem um material de interface térmica entre matrizes de silício e uma solda de estanho-índio com dissipador de calor. É necessária uma ligação metal-metal direta para transferência direta de calor. Os modernos processadores Intel usam pasta térmica de silicone em vez dessa camada, o que transfere pior o calor, mas tem uma vantagem importante - é capaz de sobreviver a muito mais ciclos térmicos. À medida que os metais aquecem, eles se expandem: dois metais ligados entre si com diferentes coeficientes de expansão térmica, passando por muitos ciclos de aquecimento, quebram e perdem eficiência. A pasta térmica elimina esse problema. Além disso, a graxa térmica é mais barata. Portanto, escolher uma interface térmica é uma troca entre preço, durabilidade e desempenho.

Há um resfriador de processador acima do dissipador de calor, mas há outra interface térmica entre eles, seu usuário pode escolher. A opção mais barata é a graxa térmica de silicone comum a um preço de um centavo por galão, mas os entusiastas do desempenho podem escolher graxa térmica à base de prata ou outra mistura com boas características térmicas. Normalmente, a capacidade da pasta para distribuir sob pressão é uma qualidade positiva. Suportes de velocidades extremas podem usar uma camada de metal líquido, semelhante à variante de solda, que quase sempre liga o processador ao resfriador.

Então, o que acontece se você repentinamente aplicar alguns mícrons de plástico termicamente inútil entre o dissipador de calor e o cooler do processador?

Primeiro de tudo, a transferência de calor será terrível. Isso significa que a energia térmica permanece na pasta, fazendo com que o processador absorva o calor enquanto aumenta a temperatura. Na verdade, esse é o mesmo caso quando o cooler está sobrecarregado com um processador grande - a absorção de calor pelo processador se torna um problema real. Isso leva a um aumento acelerado da temperatura até que o gradiente de temperatura seja igual à liberação de energia térmica. O processador fica muito quente, o modo de emergência é ativado para uma situação térmica de emergência, reduzindo a tensão e a frequência a níveis extremamente baixos. O desempenho cai para o fundo.

O que o usuário vê no sistema? Imagine que seu processador funcione a 600 MHz ao renderizar, em vez da boa base 3125 MHz (consulte a página anterior). As temperaturas base são mais altas, as temperaturas de carga são mais altas, as temperaturas da caixa são mais altas. Mas você pode secar roupas molhadas para que o calor não desapareça. Um leve superaquecimento não prejudica o processador, mas uma grande quantidade pode torná-lo muito fraco.
AMD XFR2

Por fim, esse problema prejudica a AMD mais do que você poderia imaginar. A maneira como a AMD implementa seus modos turbo em novos processadores não é mais uma tabela de pesquisa com uma lista de "núcleos carregados -> turbofreqüência". Depende da potência, corrente e limites térmicos de um determinado chip. Se houver espaço para crescimento, a plataforma AMD adicionará frequência e tensão. Esse ajuste térmico é feito pelo que a AMD chama de XFR2, ou eXtended Frequency Range 2.

No Tech Day da AMD para Threadripper 2, fomos apresentados a gráficos mostrando o efeito do uso de coolers mais poderosos no desempenho: cerca de 10% de melhoria nos resultados dos testes com um aumento no potencial de dissipação de calor. Use o sistema em uma sala com baixa temperatura ambiente, e a AMD proporcionará um aumento de 16% na produtividade em comparação com o sistema de drenagem.



No entanto, o inverso também é verdadeiro. Tendo um pedaço de plástico em que uma boa transferência de calor deveria aumentar a frequência e a tensão, obtivemos uma diminuição significativa no desempenho.

Desempenho de plástico:


Portanto, apesar de ser usado em um quarto de hotel com ar-condicionado, esse plástico extra teve um efeito decisivo na maioria dos nossos testes. Aqui está o dano que ele causou:



















Em todos os testes multithread, quando a CPU está muito carregada, há uma diminuição significativa no desempenho. O liquidificador mostrou uma redução de 20% na taxa de transferência, o POV-Ray caiu 10%, para o 3DPM a perda foi de 19%. Os resultados do PCMark não são reduzidos significativamente, pois há muitos testes de thread único e, em alguns testes, até vimos um desvio na outra direção, por exemplo, no WinRAR, que depende da DRAM. Outros parâmetros de referência não listados incluem nosso teste de compilação, onde o sistema “plastificado” era apenas 1% mais lento, ou o Dolphin, que mostrou uma diferença de um segundo.

O que eu aprendi?


Não seja tolo. A montagem de uma bancada de testes com novos componentes, por estar muito cansada, pode levar a testes repetidos.

Conclusões: nem todos os núcleos nascem iguais


O design do processador geralmente é um processo de ajuste fino. Para obter desempenho, o arquiteto deve equilibrar os cálculos com largura de banda e sempre ter dados suficientes "alimentando a fera" - carregando os núcleos do processador. Se o "animal" for deixado inativo, ele consome energia sem fazer nenhum trabalho. Definir a combinação certa de recursos é uma tarefa difícil e, portanto, as principais empresas de processadores contratam milhares de engenheiros para que o sistema funcione corretamente. E quando o design principal está pronto, ele produz vários herdeiros.

Às vezes, produtos exóticos caem da pilha comum. A nova geração de processadores AMD Ryzen Threadripper é a mesma exótica. Parece que foram feitas substituições diretas para os componentes da geração anterior, semelhantes a eles, mas com melhor atraso e maior frequência. Esses componentes já são bem conhecidos e obtemos o aumento esperado da maneira usual. E, neste momento, silício adicional, incluído no 2990WX, sem acesso direto à memória, aciona uma chave inglesa em um mecanismo estabelecido.


2950X (esquerda) e 2990WX (direita)

Quando todos os núcleos estão diretamente vinculados à memória, como o 2950X, todos os núcleos são considerados iguais e o balanceamento de carga de trabalho é uma tarefa bastante simples. Com o lançamento de novos processadores, conseguimos a situação mostrada na figura à direita. Agora, apenas alguns núcleos estão diretamente ligados à memória, enquanto o restante não. Para que os dados sejam movidos de um dos núcleos "distantes" para a memória principal, é necessário um "salto" adicional, que adiciona latência. E quando todos os kernels solicitam acesso, há um congestionamento.

Para fazer uso total dos recursos dessa arquitetura, a carga de trabalho não deve consumir muita memória. Em tarefas como cálculo de movimento de partículas, rastreamento de raios, renderização e descompressão de cenas, o carregamento total de todos os 32 núcleos permite que o processador seja a estrela de nossos testes e estabeleça novos recordes.

No estilo Janus de duas faces, com outras cargas de trabalho que historicamente dependem do número de núcleos, como física, transcodificação e compactação, uma estrutura de dois módulos leva a uma perda significativa de desempenho. Como resultado, aqui, aparentemente, não há resultados médios - a carga de trabalho mostra excelentes resultados no novo processador ou está no final de nosso pacote de testes de alta qualidade.

Parte do problema é a distribuição de energia desses processadores muito grandes. Conforme mostrado na página 4, quanto mais chiplets estiverem no jogo, ou mais Mesh, mais energia será fornecida não aos núcleos, mas às redes internas, como uncore ou Infinity Fabric. Comparando um link IF em 2950X com seis em 2990WX, descobrimos que o IF agora consome 60-73% da potência total do chip em cargas leves e 25-40% em alta.

De fato, em plena carga, um chip como o 2990WX usa apenas 60% de seu orçamento de energia para a frequência do processador. No EPYC 7601, devido a canais de memória adicionais, os núcleos consumiram apenas 50% do orçamento de energia sob carga. Certifique-se de que após a AMD e a Intel concluírem a luta pelo número de núcleos, o próximo objetivo na lista deles será a interconexão.

Mas o efeito colateral do fato de o chip não usar toda a energia para alimentar os núcleos e também possuir uma arquitetura bimodal é que algumas cargas de trabalho não serão dimensionadas e, em alguns casos, há regressão.

Big Boss: hipopótamo AMD de 32 núcleos


Não há dúvida de que quando o AMD Ryzen Threadripper 2990WX tiver a oportunidade de trabalhar ao máximo, ele fará isso com prazer. Conseguimos fazer o overclock do sistema para 4 GHz em todos os núcleos simplesmente alterando as configurações do BIOS, embora a AMD também suporte o Windows Precision Boost Overdrive para extrair mais do chip. Ao mesmo tempo, o consumo de energia ao usar metade dos núcleos a uma frequência de 4,0 GHz aumenta para 260 watts, e uma CPU totalmente carregada decola de 450 a 500 watts e às vezes excede 600 watts. Os usuários precisarão garantir que sua placa-mãe e fonte de alimentação estejam prontas para executar essa tarefa.



É o momento em que finalmente digo se recomendamos a compra de novos produtos AMD. A capacidade de colocar 2950X em vez de 1950X em seus slots, também a um preço mais baixo, parece muito atraente para nós. No entanto, o 2950X já é um produto de nicho para alto desempenho - e o 2990WX pega o bastão e o leva para longe, criando o processador de nicho mais poderoso. Honestamente, nem em todos os casos sua produtividade é tão grande quanto se poderia esperar, e sua aplicação faz sentido para um conjunto estreito de cargas de trabalho, onde acaba sendo incomparável. E, embora supere quase todos os outros processadores em nosso teste de compilação, há um processador que o vence: 2950X.

Para a maioria dos usuários, o 2950X é suficiente. Para alguns poucos, o 2990WX será o melhor processador do mundo.

Obrigado por ficar conosco. Você gosta dos nossos artigos? Deseja ver materiais mais interessantes? Ajude-nos fazendo um pedido ou recomendando a seus amigos, um desconto de 30% para os usuários da Habr em um análogo exclusivo de servidores básicos que inventamos para você: Toda a verdade sobre o VPS (KVM) E5-2650 v4 (6 núcleos) 10GB DDR4 240GB SSD 1Gbps da US $ 20 ou como dividir o servidor? (as opções estão disponíveis com RAID1 e RAID10, até 24 núcleos e até 40GB DDR4).

3 meses de graça ao pagar por um novo Dell R630 por um período de seis meses - 2 x HDD Intel Deca-Core Xeon E5-2630 v4 / 128GB DDR4 / 4x1TB ou SSD 2x240GB / 1Gbps 10 TB - de US $ 99,33 por mês , apenas até o final de agosto, faça o pedido pode estar aqui .

Dell R730xd 2 vezes mais barato? Somente nós temos 2 TVs Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 a partir de US $ 249 na Holanda e nos EUA! Leia sobre Como criar um prédio de infraestrutura. classe usando servidores Dell R730xd E5-2650 v4 custando 9.000 euros por um centavo?

Source: https://habr.com/ru/post/pt422209/


All Articles