Parte 1 â
Parte 2 â
Parte 3 â
Parte 4 â
Parte 5Consumo de energia, TDP e Prime95 vs POV-Ray
Para a maioria de nĂłs, a potĂȘncia do processador Ă© de cerca de 15 watts em laptops e de 65 a 95 watts em sistemas de desktop. Os processadores de desktop de alto desempenho sempre foram mais vorazes e, portanto, um TDP de 130 W e 140 W Ă© um indicador normal para eles. Quando a AMD lançou um processador de 220 W na antiga plataforma Vishera, com um overclock do nĂșcleo da famĂlia Bulldozer em 5,0 GHz, surgiu a idĂ©ia de saber se a AMD era completamente louca: muitas placas-mĂŁe eram compatĂveis com o soquete AMD, mas para usar TDP 220 W e superior teve que lançar uma sĂ©rie de novas placas-mĂŁe. Hoje, o processador Intel mais poderoso do mercado possui um TDP oficial de 205 watts, mas a AMD foi alĂ©m, elevando a fasquia para 250 watts.

Dois novos processadores WX, o 2990WX e o 2970WX de 32 nĂșcleos, sĂŁo classificados em 250 watts. Nos dois processadores, todas as quatro matrizes de silicone estĂŁo ativas; existem seis linhas Infinity Fabric ativas. Esses processadores foram projetados para atingir um novo nĂvel de desempenho, enquanto a AMD demonstra slides com uma frequĂȘncia turbo em todos os nĂșcleos de 3,6 GHz. Os dois processadores que substituĂram a sĂ©rie X tĂȘm uma potĂȘncia de 180 watts, assim como os processadores da primeira geração Threadripper.
No entanto, nem todos os TDPs sĂŁo iguais. As maneiras pelas quais a Intel e a AMD medem o TDP mudaram ao longo dos anos e agora estĂŁo muito longe da realidade. Deixe-me explicar.
TDP Ă© uma piada
O valor TDP, ou potĂȘncia tĂ©rmica do projeto, nĂŁo Ă© um indicador de consumo de energia. Tecnicamente, este Ă© um indicador do desempenho do refrigerador, o que significa que, para lidar com seu trabalho, o refrigerador deve ter o mesmo nĂvel de TDP. O consumo real de energia deve ser um pouco maior - a transferĂȘncia de calor do processador para o soquete e do soquete para a placa-mĂŁe contribui para o resfriamento, mas nĂŁo Ă© levada em consideração no indicador TDP. FreqĂŒentemente, a taxa de dissipação de calor do TDP e o consumo de energia do processador sĂŁo percebidos como um, porque suas diferenças sĂŁo insignificantes.
Vamos começar o cålculo com os processadores AMD. O cålculo do AMD TDP é baseado em uma fórmula simples:
TDP = (temperatura de operação, em graus Celsius - temperatura inativa, em graus Celsius) / potĂȘncia tĂ©rmica do resfriadorAssim, quando a AMD determina o TDP do seu processador Ryzen 7 2700X com uma temperatura de carga de cerca de 62 ° C, uma temperatura ociosa de 42 ° C e um resfriador com uma potĂȘncia tĂ©rmica de 0,189 C por watt (Wraith Max), obtemos um valor de cerca de 105W.
A fĂłrmula da AMD tem dois problemas ao mesmo tempo: em primeiro lugar, a temperatura do processador carregado pode ser controlada usando um fluxo de ar mais frio ou externo e, em segundo lugar, o resultado Ă© fortemente influenciado pela energia tĂ©rmica do resfriador. Com um grande refrigerador de lĂquido que possui uma potĂȘncia tĂ©rmica mais alta, por exemplo, 0,400 C por watt, o TDP nominal de qualquer processador serĂĄ menor: no caso do Ryzen 7 2700X, seu TDP serĂĄ de apenas 50 watts. A classificação TDP e o consumo de energia nĂŁo sĂŁo iguais e sua proporção pode mudar em qualquer direção; apenas a AMD deve escolher um resfriador diferente para comparaçÔes.
A versĂŁo TDP da Intel Ă© um pouco mais complicada, mas isso faz sentido ... A Intel determina o TDP de seus processadores apenas para a frequĂȘncia base, ignorando as frequĂȘncias turbo. Como resultado, se a Intel lançar um processador com 95 W TDP, uma frequĂȘncia base de 3,2 GHz, um turbo de nĂșcleo Ășnico de 4,7 GHz e um turbo completo de 4,2 GHz, o consumo de energia garantido de 95 W serĂĄ a uma frequĂȘncia base de 3,2 GHz. Isso significa que em qualquer placa-mĂŁe que use um turbo (ou seja, geralmente em qualquer), o processador consumirĂĄ mais energia sob qualquer carga do que seu TDP oficial.
E isso Ă© muito chato. A iniciativa de marketing da Intel Ă© anunciar seus processadores turbo de nĂșcleo Ășnico e nĂŁo publicar valores mais baixos para o turbo "de nĂșcleo inteiro". Somos informados de que essas sĂŁo âinformaçÔes internas da empresaâ que se enquadram no contrato de nĂŁo divulgação. De qualquer forma, cada processador que possui uma frequĂȘncia turbo "total" acima da frequĂȘncia base consumirĂĄ acima do TDP especificado.
Um bom exemplo Ă© o Core i7-8700 e seu TDP de 65 W. Tem uma frequĂȘncia base de 3,2 GHz, um turbo de nĂșcleo Ășnico de 4,6 GHz e um turbo completo de 4,3 GHz. Se carregarmos mais fluxos e limitarmos o consumo de energia a 65 W, obteremos o seguinte:

Vale a pena levar os valores de TDP a sério? Trate-os com humor.
Consumo de energia
Existem vårias maneiras de medir o consumo de energia do processador. A maneira mais fåcil é usar um dispositivo de medição, que permitirå descobrir o consumo de energia de todo o sistema, incluindo perdas no sistema de alimentação da placa-mãe. Um método complicado envolve conectar as ferramentas necessårias à placa para medir corrente através de um conector de 12 volts, medir a tensão do processador usando as configuraçÔes de overclock em algumas placas-mãe. A terceira maneira é ler os registros de hardware usando o software apropriado.
Ler registros Ă© uma faca de dois gumes. Primeiro, vocĂȘ depende de dimensĂ”es internas, que geralmente tĂȘm uma margem de erro bastante ampla. Em segundo lugar, vocĂȘ depende do fabricante do processador para relatar dados reais sobre o seu processador. Isso nem sempre Ă© razoĂĄvel (!). No lado positivo: Ă© possĂvel obter mais informaçÔes do processador, por exemplo, anĂĄlise de energia para cada nĂșcleo, energia DRAM, energia IO / Interconnect, energia grĂĄfica integrada, e uma compreensĂŁo geral da distribuição de energia.
Registros de hardware - Ă© assim que o sistema se informa sobre o trabalho: quanta energia usa, como deve regular a tensĂŁo / frequĂȘncia, dependendo da corrente, potĂȘncia ou desempenho tĂ©rmico. Outro lado positivo Ă© a facilidade de uso desses dados nos scripts de teste.
O teste de energia Ă© frequentemente objeto de controvĂ©rsia. Geralmente, Ă© usado um vĂrus especializado que pode carregar simultaneamente cada ĂĄrea do processador na potĂȘncia mĂĄxima. O âvĂrus de energiaâ Ă© usado para verificar a estabilidade da aceleração, mas tem uma desvantagem: com carga diĂĄria, os resultados, em regra, nĂŁo refletem o consumo real de energia. Essa Ă© a linha tĂȘnue entre um teste real e um teste sintĂ©tico projetado para conduzir cada joule de energia atravĂ©s de um chip. Software, como o LINPACK, Ă© frequentemente usado como um teste de energia eficaz. As ferramentas internas da Intel e da AMD podem ajudar a carregar o chip ainda mais.
Prime95 Ă© uma ferramenta popular, Ă© perfeitamente otimizada para quase todos os nĂșcleos, controla a fonte de alimentação. Sua carga de trabalho Ă© semi-sintĂ©tica, com base no cĂĄlculo de nĂșmeros primos, mas o teste de estresse ignora os resultados e se concentra apenas no consumo de energia. Durante essa revisĂŁo, brincamos um pouco com o POV-Ray como teste de energia: ele fornece um consumo de energia ainda maior que o Prime95 e tambĂ©m usa uma carga de rastreamento de raio muito popular. Para escrever uma resenha para mim, Ă© por isso que decido qual ferramenta Ă© melhor usada para testes de consumo de energia. O Prime95 tem problemas ao trabalhar com um grande nĂșmero de nĂșcleos (Ă s vezes Ă© difĂcil obter um resultado de teste se o limite de 25 threads for excedido) e, para que o POV-Ray funcione, precisamos ajustar seus mĂ©todos de carregamento, porque ele visa mais verificar a carga do kernel, em vez de cĂłrregos. No entanto, esperamos obter resultados, dependendo do nĂșmero de threads. SerĂĄ indicado qual software foi usado em cada estĂĄgio do teste (pudemos preparar nossa versĂŁo do POV-Ray apenas no meio da revisĂŁo, portanto, a maioria dos dados foi recebida do Prime95).
Consumo total de energia
Como o primeiro conjunto de resultados, quero apresentar o consumo total de energia do processador, medido em vårias situaçÔes. Em modo inativo:

Em seguida, carregamos apenas um nĂșcleo com dois threads usando o Prime95. Nossa tĂ©cnica de teste faz com que ambos os threads funcionem no mesmo nĂșcleo, caso os nĂșcleos do processador sejam capazes de processar vĂĄrios threads. UsuĂĄrios focados em cargas de tarefa Ășnica verĂŁo o consumo de energia nessa faixa. Isso tambĂ©m se aplica aos sistemas em que o Windows estĂĄ constantemente em segundo plano.

O terceiro teste é um sistema carregado com quatro threads usando o Prime95. Essa é exatamente a faixa de carga que a maioria das pessoas usa todos os dias em seus sistemas: vårias guias do navegador, duas janelas, vårios pacotes de software em funcionamento estão abertos, um ou vårios jogos estão em execução.

Aumentando a carga do processador para doze threads (com o Prime95), passamos aos usuårios usando cargas de trabalho grandes e com vårias tarefas. São jogadores - streamers ou usuårios que começam a renderizar enquanto trabalham em paralelo com outras tarefas.

O grĂĄfico final mostra o consumo total de energia. Para este teste, executamos o nĂșmero mĂĄximo de threads (Prime95); no futuro, planejamos usar o POV-Ray para esse teste, pois ele se mostra muito melhor com um nĂșmero alto de threads. A Ășnica desvantagem desse teste Ă© que o 2990WX com overclock pode concluir o teste de POV-Ray em menos de 20 segundos.

Consumo de energia do nĂșcleo individual
Antes de criar o teste de consumo de energia POV-Ray, lancei os dois novos processadores Threadripper no teste Prime95 na opção All-thread, recebi o consumo de energia de cada nĂșcleo em cada carga.

Ao carregar o primeiro nĂșcleo, vemos que seu consumo de energia Ă© de ~ 23 watts. Isso Ă© muito comparado aos nĂșcleos do Zeppelin. Isso tambĂ©m se aplica quando dois nĂșcleos sĂŁo carregados. Ao carregar trĂȘs nĂșcleos, observamos uma diminuição no consumo para 18,8 watts por nĂșcleo. Dado que este chip possui quatro CCXs, surge a questĂŁo de saber se esse resultado estĂĄ relacionado ao fato de os fluxos serem carregados no mesmo CCX (o que, aparentemente, deve acontecer), e atingirmos o limite de potĂȘncia do CCX. Ao carregar quatro nĂșcleos, o consumo de cada nĂșcleo Ă© de 17,4 watts.
Aumentando o nĂșmero de nĂșcleos carregados para cinco, descobrimos que o quinto nĂșcleo trabalha em 18,2 watts e os quatro restantes - em 16,8 watts. O resultado indica que esse quinto nĂșcleo estĂĄ localizado no novo CCX. Na transição de oito nĂșcleos para nove, vemos a mesma coisa: o nono nĂșcleo consome 17,5 watts de energia, enquanto os oito restantes sĂŁo aproximadamente 14,3 watts. No final, a distribuição de energia cai para 7-9 watts por nĂșcleo, se usarmos todos os 16 nĂșcleos.
O consumo total de energia do processador Ă© de ~ 178 W, cerca de 180 W TDP com um consumo de ~ 135 W nos nĂșcleos e o restante no Uncore (hardware extra nĂșcleo - Infinity Fabric, IO, IMC).
Quanto aos resultados do teste 2990WX, a imagem resultante parece muito, muito estranha.

Na maior parte, os dados de consumo de energia para atĂ© 15 nĂșcleos sĂŁo praticamente os mesmos que o 2950X. No entanto, Ă medida que os fluxos aumentam, fica claro que a primeira camada da matriz Ă© claramente preferĂvel. Ao carregar fluxos adicionais e conectar uma segunda matriz, a potĂȘncia de seus nĂșcleos Ă© muito menor - atĂ© 2,4 W por nĂșcleo. A primeira camada de zeppelin em carga mĂĄxima consome cerca de 6,6 watts por nĂșcleo, mas o restante do nĂșcleo do processador Ă© de cerca de 2,4 watts. Algo acontece, como resultado da qual a primeira matriz ganha prioridade na nutrição em comparação com o restante. Vale ressaltar que o consumo de energia do chip Ă© de cerca de 180 watts, e nĂŁo 250 watts, como mostra seu TDP.
Nessa época, terminamos de escrever um script de teste de energia POV-Ray. Eu testei no 2990WX, apresento os resultados. E agora eles são muito mais altos do que o esperado:

Surpreendentemente, Ă medida que o nĂșmero de encadeamentos aumentou, a carga se distribuiu de maneira muito uniforme. Conseguimos atĂ© usar todos os TDP de 250 W com configuraçÔes de estoque e com um bom cooler. Depois de carregar os processos completamente, vimos o consumo de 193 watts por nĂșcleos e 55 watts pelo restante dos componentes. Sob nenhuma circunstĂąncia observamos "flacidez" de nĂșcleos ativos abaixo de 3 watts. Quando todos os nĂșcleos foram carregados, cada nĂșcleo consumiu seus 6 watts "confortĂĄveis". Atingimos uma potĂȘncia de processador de 240-250 W ao carregar cerca de 40 threads. Com um aumento adicional nos fluxos, o nĂșcleo adicionado causou uma redistribuição de poder.
Duas idĂ©ias vieram Ă mente. O primeiro foi fĂĄcil de verificar: talvez o BIOS tenha ficado preso em 180 W apĂłs a instalação do 2950X? Eu verifiquei duas vezes e antes de executar os testes com o 2990WX, testei o 1920X anteriormente testado. Uma redefinição completa do BIOS nĂŁo afetou os resultados. Posso argumentar que isso nĂŁo Ă© uma limitação de energia do BIOS. A segunda idĂ©ia Ă© verificar as frequĂȘncias. ApĂłs verificar apenas um ponto de referĂȘncia (40 fluxos carregados), encontramos uma pequena dispersĂŁo, mas apenas em potĂȘncia.
Durante o teste Prime95, a primeira matriz foi executada em 7 watts por nĂșcleo, com uma frequĂȘncia de 3575 MHz. O segundo cristal de silĂcio deu um resultado de 3 W por nĂșcleo a uma frequĂȘncia de 3525 MHz. Outros nĂșcleos (inativos) operavam a uma frequĂȘncia de 1775 MHz ou 2000 MHz, consumindo miliwatts.
Durante o teste de POV-Ray, cada nĂșcleo ativo consumiu cerca de 9,1 watts por nĂșcleo e teve uma frequĂȘncia de 3575 MHz. Todos os nĂșcleos ociosos estavam na frequĂȘncia de 2000 MHz (havia mais trĂȘs na frequĂȘncia de 1775 MHz), consumindo miliwatts por nĂșcleo.
AlĂ©m dos dados sobre o consumo principal, os chips pareciam geralmente os mesmos em frequĂȘncia. Os resultados do teste POV-Ray sĂŁo um pouco mais altos, o que significa maior consumo total de energia com o POV-Ray.
Por fim, tudo se resume ao fato de que o teste de potĂȘncia do Prime95 apĂłs exceder o limite de 20 nĂșcleos ou mais, ou em microcircuitos com vĂĄrios cristais, nĂŁo funciona conforme o esperado. No futuro, usaremos nosso teste POV-Ray, capaz de extrair mais dos modernos processadores multinĂșcleo.
Consumo bĂĄsico versus nĂŁo bĂĄsico
Voltando ao momento em que falamos sobre a frequĂȘncia do Infinity Fabric, podemos ver a taxa de consumo de energia como parte do teste POV-Ray para 2990WX.

Embora observemos alguns desvios em relação ao resultado anterior, os dados (alĂ©m do pico de consumo) geralmente correspondem ao nosso teste de potĂȘncia Uncore com o Prime95. O Infinity Fabric ainda mostra 55-60 watts de potĂȘncia. Como resultado, o consumo nĂŁo nuclear, como porcentagem da capacidade total, começa em 75% com dois threads, chega a 22% quando 40 threads sĂŁo lançados.
Overclock: 4,0 GHz para 500 W
Quem disse que um processador de 250 W não deve ter overclock? A AMD se orgulha de fabricar processadores, cada um dos quais é vendido com um multiplicador desbloqueado, e também usa material soldado como interface térmica.
Ă hora de se arrepender. NĂŁo tivemos tempo suficiente para fazer overclock. Este processador possui uma frequĂȘncia base de 3,0 GHz, turbo 4,2 GHz. Em uma sala com ar-condicionado, usando um resfriador Enermax Liqtech de 500 W, carregando todos os nĂșcleos sob o POV-Ray, cada nĂșcleo trabalhava a uma frequĂȘncia de 3150 MHz, o que estĂĄ muito longe da frequĂȘncia turbo. A primeira coisa que fiz foi definir um turbo de nĂșcleo completo em 4,2 GHz, como um nĂșcleo Ășnico. Isso deu um bom aumento.
No entanto, a prĂłxima etapa dos meus experimentos com overclock me surpreendeu. Defino o multiplicador da CPU como 40-x no BIOS para 4,0 GHz em todos os nĂșcleos, o tempo todo. NĂŁo regulei a tensĂŁo, saindo do modo automĂĄtico, para isso tive que abandonar a placa-mĂŁe ASUS. Ouça, o processador concluiu perfeitamente nosso conjunto de testes de 4,0 GHz. Fiquei chocado.
Tudo o que fiz para esse overclock foi mudar de "automåtico" para "40". Os testes POV-Ray que consomem mais energia foram bem-sucedidos. Cada teste do conjunto funcionou. Embora o desempenho térmico tenha sido alto (com carga måxima), o cooler lidou facilmente com isso.

Em plena carga no teste POV-Ray, o processador mostrou um consumo de 500 watts, o cooler foi projetado para 500 watts. Em algum momento, vimos um salto para 511 W, onde 440 W foram alocados para nĂșcleos (ou 13,8 W por nĂșcleo) e 63 W para nĂșcleos (IF, IO, IMC), o que corresponde a 12,5% do consumo total energia Se vocĂȘ deseja que o intercooler gaste menos energia, acelere a porcentagem!
Eles ajustaram a frequĂȘncia para 4,1 GHz e parecia funcionar tambĂ©m, atĂ© carregarmos o sistema completamente. Como mencionado acima, a 4,2 GHz nĂŁo foi possĂvel obter um resultado operacional, mesmo com um aumento de tensĂŁo. Para quem quer se aprofundar no overclock, o resfriamento lĂquido pode ser uma solução.
Desempenho em 4,0 GHz
Portanto, se a frequĂȘncia de todos os nĂșcleos for de 3125 MHz, o overclock para 4000 MHz deverĂĄ aumentar em 28% o desempenho, certo? Aqui estĂŁo os resultados de alguns testes importantes do nosso pacote.






A aceleração 2990WX deu resultados mistos. Funcionou muito bem em alguns testes, ainda estå atrås do 2950X em outros devido à sua arquitetura de módulo duplo.
O overclock deu resultados realmente bons nesses testes: o Blender mostra um aumento na taxa de transferĂȘncia em 19%, POV-Ray - em 19%, 3DPM - em 19%. Em outros testes, Ă© inferior a 2950X (Photoscan), ainda estĂĄ atrasado (carregamento do aplicativo, WinRAR).
O overclock nĂŁo solucionarĂĄ todos os problemas de desempenho do 2990WX, mas certamente beneficiarĂĄ o processador.
Obrigado por ficar conosco. VocĂȘ gosta dos nossos artigos? Deseja ver materiais mais interessantes? Ajude-nos fazendo um pedido ou recomendando a seus amigos, um
desconto de 30% para os usuĂĄrios da Habr em um anĂĄlogo exclusivo de servidores bĂĄsicos que inventamos para vocĂȘ: Toda a verdade sobre o VPS (KVM) E5-2650 v4 (6 nĂșcleos) 10GB DDR4 240GB SSD 1Gbps da US $ 20 ou como dividir o servidor? (as opçÔes estĂŁo disponĂveis com RAID1 e RAID10, atĂ© 24 nĂșcleos e atĂ© 40GB DDR4).
3 meses de graça ao pagar por um novo Dell R630 por um perĂodo de seis meses -
2 x HDD Intel Deca-Core Xeon E5-2630 v4 / 128GB DDR4 / 4x1TB ou SSD 2x240GB / 1Gbps 10 TB - de US $ 99,33 por mĂȘs , apenas atĂ© o final de agosto, faça o pedido pode estar
aqui .
Dell R730xd 2 vezes mais barato? Somente nĂłs temos
2 TVs Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 a partir de US $ 249 na Holanda e nos EUA! Leia sobre
Como criar um prédio de infraestrutura. classe usando servidores Dell R730xd E5-2650 v4 custando 9.000 euros por um centavo?