Luxo inacessível da Intel: Core i9-9990XE com 14 núcleos a uma frequência de 5,0 GHz (1 parte)Testes do sistema
A seção "Testes do sistema" se concentra nos testes em condições reais com as quais o consumidor se depara, com um leve viés na taxa de transferência. Nesta seção, veremos o tempo de carregamento do aplicativo, processamento de imagem, física simples, emulação, modelagem neural, cálculos otimizados e o desenvolvimento de modelos tridimensionais usando software facilmente acessível e personalizável. Embora alguns dos testes sejam mais fáceis de se sobrepor aos recursos de produtos grandes, como o PCMark (publicamos esses valores na seção de testes de escritório), ainda vale a pena considerar o objeto em teste de diferentes ângulos. Em todos os testes, explicaremos em detalhes o que está sendo testado e como exatamente estamos testando.
Download do aplicativo: GIMP 2.10.4
Um dos aspectos mais importantes da experiência do usuário e do fluxo de trabalho é a velocidade do sistema. Um bom teste aqui é verificar o tempo de carregamento do aplicativo. Atualmente, a maioria dos programas, quando armazenados em um SSD, é baixada quase instantaneamente, mas algumas ferramentas de escritório exigem o pré-carregamento de ativos antes que eles estejam prontos. A maioria dos sistemas operacionais também usa cache, portanto, quando um software é baixado com freqüência (navegador da web, ferramentas de escritório), ele pode ser inicializado muito mais rapidamente.
No conjunto de testes anterior, verificamos quanto tempo levaria para carregar um PDF grande no Adobe Acrobat. Infelizmente, este teste foi um pesadelo de programação e se recusou a atualizar para o Win10 RS3 sem lutar. Enquanto isso, descobrimos um aplicativo que pode automatizar esse teste e decidimos usar o GIMP, um aplicativo de edição de fotos popular e gratuito. Este é um editor de código aberto, a principal alternativa ao Adobe Photoshop. Nós o configuramos para carregar um modelo de design grande de 50 MB e executamos a carga 10 vezes com um intervalo de 10 segundos entre eles. Devido ao armazenamento em cache, os primeiros 3 a 5 resultados costumam ser mais lentos que os demais, e o tempo de armazenamento em cache pode ser inconsistente; portanto, usamos a média dos últimos cinco resultados para mostrar o processamento da CPU durante o carregamento em cache.

Baixar aplicativos é como um passeio no parque para o Core i9-9990XE.
FCAT: processamento de imagem
O software FCAT foi projetado para detectar micro-sticks, queda de quadros e executar testes gráficos quando duas placas de vídeo são combinadas para renderizar uma cena. Devido aos mecanismos de jogo e aos drivers gráficos, nem todas as combinações de GPU funcionaram perfeitamente, como resultado do software capturou cores para cada quadro renderizado e executou dinamicamente a gravação de dados RAW usando um dispositivo de captura de vídeo.

O software FCAT recebe o vídeo gravado, no nosso caso, são 90 segundos 1440p do jogo Rise of the Tomb Raider e converte os dados de cores em dados de tempo de quadro, para que o sistema possa exibir a taxa de quadros "observada" e se correlacionar com o consumo de energia dos aceleradores de vídeo. Este teste, devido à rapidez com que foi concluído, é de thread único. Iniciamos o processo e obtemos o tempo de conclusão como resultado.

O FCAT fornece resultados bastante iguais para todos os processadores e apenas alguns por cento compartilham todos os componentes da Intel.
Movimento de partículas 3D v2.1: movimento browniano
Nosso teste 3DPM é uma referência personalizada projetada para modelar seis algoritmos diferentes para mover partículas no espaço tridimensional. Os algoritmos foram desenvolvidos como parte da minha tese de doutorado e, finalmente, funcionam melhor na GPU e fornecem uma boa idéia de como os fluxos de comando são interpretados por várias microarquiteturas.
A parte principal dos algoritmos é a geração de números aleatórios - usamos a geração relativamente rápida, que completa a implementação de cadeias de dependências no código. A atualização principal em comparação com a primeira versão primitiva desse código é que o problema do Compartilhamento Falso nos caches foi resolvido, que era o principal gargalo. Também estamos considerando a aplicação das versões AVX2 e AVX512 deste teste para futuras revisões.
Para este teste, executamos um conjunto de partículas usando seis algoritmos diferentes, em 20 segundos, com pausas de 10 segundos e relatamos a velocidade total das partículas em milhões de operações (movimentos) por segundo.

Quando executamos o teste 3DPM no modo padrão, o 9990XE novamente mostra uma ligeira regressão em comparação com o 7940X, o que pode indicar que MHz adicional é necessário para a malha.

Usando as instruções AVX512, nosso 9990XE abre suas asas como o resto dos processadores Intel HEDT, mas só pode subir para o 7940X mais lento, apesar do número igual de núcleos. Aqui, o teste limita mais por núcleos do que por frequência, o que indica que existem várias paradas de pipeline nesse teste.
Dolphin 5.0: emulação de console
Um dos testes populares solicitados em nosso pacote é a emulação de console. A capacidade de selecionar um jogo de um sistema desatualizado e executá-lo é muito atraente e depende dos esforços do emulador: é necessário um sistema x86 muito mais poderoso para emular com precisão um console antigo que não seja o x86. Especialmente se o código desse console foi criado levando em consideração algumas falhas físicas e bugs de hardware.
Para nosso teste, usamos o popular software de emulação Dolphin e executamos um projeto de computação para determinar com que precisão nossos processadores podem emular o console. Neste teste, a emulação do Nintendo Wii durará cerca de 1050 segundos.
A versão mais recente do Dolphin pode ser
baixada
O Dolphin é um teste de thread único, então aqui vemos os processadores de maior frequência da Intel e AMD nas primeiras posições.
DigiCortex 1.20: Modelando o cérebro de uma lesma marinha
Esta referência foi originalmente projetada para modelar e visualizar a atividade dos neurônios e sinapses no cérebro. O software vem com vários modos predefinidos, e escolhemos uma pequena referência que simula um cérebro de 32 mil neurônios / 1,8 bilhão de sinapses, o que equivale ao cérebro de uma lesma do mar.

Nós relatamos os resultados do teste como uma oportunidade para emular dados em tempo real, para que quaisquer resultados acima da "unidade" sejam adequados para operação em tempo real. Dos dois modos, o modo “sem início sinapse”, que é difícil para a DRAM, e o modo “com início sinapse”, no qual o processador está carregado, selecionamos o último. Apesar da nossa escolha, o teste ainda é afetado pela velocidade da DRAM.
DigiCortex pode ser
baixado
O DigiCortex adora mais a frequência da memória e as velocidades internas do que a frequência pura do núcleo e, portanto, o 9990XE não funciona muito bem aqui.
y-Cruncher v0.7.6: Cálculos otimizados para microarquitetura
Uma vez ouvi falar do y-Cruncher como uma ferramenta para ajudá-lo a calcular várias constantes matemáticas. Mas depois que comecei a conversar com seu desenvolvedor, Alex Yee, pesquisador da NWU e agora desenvolvedor de otimização de software, percebi que ele otimizou o software de uma maneira incrível para obter melhor desempenho. Naturalmente, qualquer simulação que leve mais de 20 dias se beneficiará de um aumento de 1% na produtividade! Alex começou a trabalhar com o y-Cruncher como um projeto no ensino médio e agora o projeto está atualizado. Alex está trabalhando constantemente para tirar proveito dos mais recentes conjuntos de instruções, mesmo antes de eles ficarem disponíveis no nível do hardware.
Para o nosso teste, executamos o y-Cruncher v0.7.6 através de todas as variantes otimizadas possíveis de cálculos binários, de thread único e multi-thread, incluindo arquivos binários otimizados para o AVX-512. O teste é calcular 250 milhões de caracteres do número Pi e usamos versões single-thread e multi-threaded deste teste.
Os usuários podem baixar o y-cruncher
no site de Alex

O y-Cruncher é um teste acelerado usando o AVX-512, e o novo processador de alta frequência obtém o melhor resultado em um teste de thread único.
Agisoft Photoscan 1.3.3: Converter imagem 2D em modelo 3D
Um dos ISVs com quem trabalhamos há vários anos é a Agisoft. A campanha está desenvolvendo um software chamado PhotoScan, que converte uma série de imagens 2D em um modelo 3D. Essa é uma ferramenta importante no desenvolvimento e arquivamento de modelos e depende de vários algoritmos de thread único e multi-thread para mover de um lado do cálculo para o outro.

Em nosso teste, usamos a versão 1.3.3 do software com um grande conjunto de dados - fotos de 84 x 18 megapixels. Executamos o teste de acordo com um conjunto bastante rápido de algoritmos, mas ainda mais rigoroso que o nosso teste de 2017. Como resultado, relatamos o tempo total de conclusão do processo.
O site da Agisoft Photoscan pode ser encontrado
aqui.
A Agisoft é um teste de multiencadeamento e parece que o Core i9-9990XE tem a melhor combinação de núcleos e threads.
Testes de escritório
O conjunto de testes do Office foi projetado para se concentrar em benchmarks mais padrão do setor, focados nos fluxos de trabalho do escritório. Esses são testes mais sintéticos, mas também testamos o desempenho do compilador nesta seção. Para usuários que precisam avaliar o equipamento como um todo, esses são geralmente os critérios mais importantes a serem considerados.
3DMark Physics: física da computação em jogos
Juntamente com o PCMark, há um benchmark do 3DMark, Futuremark (UL) - um conjunto de testes de jogos. Cada teste de jogo consiste em uma ou duas cenas pesadas para a GPU, além de um teste físico, dependendo de quando o teste foi escrito e de qual plataforma ele se destina. Os principais assuntos em dificuldade crescente são Tempestade de Gelo, Cloud Gate, Sky Diver, Fire Strike e Time Spy.
Alguns dos subtestes oferecem outras opções, como Ice Storm Unlimited, projetado para plataformas móveis com renderização fora da tela, ou Fire Strike Ultra, projetado para sistemas 4K de alto desempenho com muitos recursos adicionais. Vale a pena notar que o Time Spy atualmente possui o modo AVX-512 (que podemos usar no futuro).



Em testes mais simples, como a Tempestade de Gelo, ter a frequência mais alta torna o 9990XE a melhor calculadora de física que temos.
GeekBench4: Teste Sintético
Uma ferramenta comum para testes de plataforma cruzada em dispositivos móveis, PCs e Macs, o GeekBench 4 é o teste sintético perfeito de um sistema usando uma variedade de algoritmos que exigem largura de banda máxima. Os testes incluem criptografia, compactação, transformação rápida de Fourier, operações de memória, física de n corpos, operações de matriz, manipulação de histograma e análise de HTML.
Estou incluindo este teste devido à popularidade da consulta, embora os resultados sejam muito sintéticos. Muitos usuários geralmente atribuem grande importância aos seus resultados devido ao fato de ter sido compilado em plataformas diferentes (embora com compiladores diferentes).
Registramos as classificações dos principais subtestes (criptografia, número inteiro, ponto flutuante, memória) em nosso banco de dados de resultados de testes, mas, para a revisão, publicamos apenas resultados gerais de thread único e multithread.


Testes na Web e testes herdados
Devido ao seu foco em sistemas low-end ou em sistemas com fator de forma pequeno, os testes da Web geralmente são difíceis de padronizar. Os navegadores modernos são atualizados com freqüência, impossibilitando a desativação dessas atualizações, por isso é difícil manter algum tipo de plataforma comum. O ritmo acelerado do desenvolvimento do navegador significa que as versões (e indicadores de desempenho) podem mudar de semana para semana. Apesar disso, os testes na Web costumam ser um indicador importante para os usuários: muitos dos trabalhos de escritório atuais estão relacionados a aplicativos da Web, especialmente aplicativos eletrônicos e de escritório, bem como a interfaces e ambientes de desenvolvimento. Nosso conjunto de testes na web inclui vários testes padrão do setor, além de vários testes populares, mas um tanto desatualizados.
Também incluímos nossos testes obsoletos, mas ainda populares, nesta seção.
WebXPRT 3: tarefas da Web do mundo moderno, incluindo IA
A empresa por trás do conjunto de testes XPRT, a Principled Technologies, lançou recentemente o mais recente teste da web e, em vez de adicionar um ano ao nome, simplesmente o chamou de "3". Esse teste mais recente (pelo menos por enquanto) é desenvolvido com base em predecessores: testes de interação do usuário, computação de escritório, gráficos, listas de classificação, HTML5, manipulação de imagens e, em alguns casos, até testes de IA.
Para nosso benchmark, executamos um teste padrão, que elaborará a lista de verificação sete vezes e fornecerá o resultado final. Realizamos esse teste quatro vezes e exibimos o valor médio.
Os usuários podem acessar o teste WebXPRT
em
WebXPRT 2015: testando HTML5 e Javascript na Web UX
A versão mais antiga do WebXPRT é a edição de 2015, que se concentra em um conjunto ligeiramente diferente de tecnologias e estruturas da Web, que, no entanto, são usadas hoje. Esse ainda é um teste relevante, especialmente para usuários que não interagem com os aplicativos da Web mais recentes do mercado, e existem muitos usuários. O desenvolvimento de frameworks web é muito rápido e altamente fluido. As estruturas são rapidamente desenvolvidas, incorporadas aos aplicativos, usadas e, em seguida, os desenvolvedores passam para a próxima. A adaptação do aplicativo à nova estrutura é uma tarefa difícil, especialmente com essa velocidade dos ciclos de desenvolvimento. Por esse motivo, muitos aplicativos ficam "presos no tempo" e permanecem relevantes para os usuários por muitos anos.
Como no caso do WebXPRT3, o principal benchmark cumpre o conjunto de controles sete vezes, exibindo o resultado final. Repetimos isso quatro vezes, exibimos a média e mostramos os resultados finais.

Velocímetro 2: Frameworks Javascript
Nosso mais novo teste da web é o Speedometer 2, que executa várias estruturas javascript para fazer apenas três coisas simples: criar uma lista, incluir cada item na lista e excluir a lista. Todas as estruturas implementam os mesmos sinais visuais, mas, obviamente, fazem isso de maneiras diferentes.
Nosso teste passa por toda a lista de estruturas e fornece a pontuação final sob o nome "rpm", um dos indicadores internos de referência. Exibimos esse indicador como resultado final.

Google Octane 2.0: Core Web Compute
Um teste popular na web há vários anos, mas agora não é mais atualizado, é o Octane, do Google. A versão 2.0 executa algumas dezenas de tarefas relacionadas aos cálculos, como expressões regulares, criptografia, traçado de raios, emulação e o cálculo das equações de Navier-Stokes.
O teste faz uma avaliação para cada um dos subtestes e retorna a média geométrica como resultado final. Realizamos uma referência completa quatro vezes e avaliamos os resultados finais.

Mozilla Kraken 1.1: Core Web Compute
Ainda mais antigo que o Octane, aqui está o Kraken, desta vez desenvolvido pela Mozilla. Este é um teste antigo que executa mecânica computacional relativamente uniforme, como processamento de áudio ou filtragem de imagem. Parece que o Kraken produz um resultado muito instável, dependendo da versão do navegador, pois esse teste é altamente otimizado.
O benchmark principal passa por cada um dos subtestes dez vezes e retorna o tempo médio de conclusão de cada ciclo em milissegundos. Executamos o benchmark completo quatro vezes e medimos o resultado médio.

3DPM v1: Variante de código ingênua do 3DPM v2.1.
O primeiro teste "herdado" no pacote é a primeira versão do nosso teste 3DPM. Esta é a versão nativa final do código, como se tivesse sido escrito por um cientista sem conhecimento de como o hardware, os compiladores ou a otimização do computador funcionam (como era no começo). O teste é uma grande quantidade de modelagem científica na natureza, onde obter uma resposta é mais importante que a velocidade da computação (obter o resultado em 4 dias é aceitável se o resultado estiver correto; um ano aprendendo a programar e obtendo o resultado em 5 minutos não é aceitável).
Nesta versão, a única otimização real estava nos sinalizadores do compilador (-O2, -fp: fast): compilação no modo release e ativação do OpenMP nos principais ciclos de computação. Os loops não foram dimensionados para funções e a desaceleração mais grave é o compartilhamento falso no cache. O código também possui longas cadeias de dependências baseadas na geração de números aleatórios, o que leva à degradação do desempenho em algumas microarquiteturas de computação.
O 3DPM v1 e o 3DPM v2 podem ser baixados aqui: 3DPMv2.1.rar (13,0 MB)


x264 HD 3.0: teste de transcodificação herdada
Esse teste de transcodificação é muito antigo; a Anandtech o utilizava nos dias dos processadores Pentium 4 e Athlon II. Nele, o vídeo 720p padronizado é codificado com dupla conversão e o benchmark mostra quadros por segundo de cada passagem. O teste é de thread único e, em algumas arquiteturas, encontramos restrições de IPC - instruções por relógio.


Consumo de energia, frequências e especificações térmicas
Dedicamos vários artigos a examinar por que os números TDP indicados na caixa são inúteis para a maioria dos usuários: O fraco TDP da Intel é que ele mostra o resfriamento necessário para executar o processador na frequência base. « » — , , (- ), .
Core i9-9990XE , , 14 4,0 , , 255 . ICC 5,0 «» . , 4,0 , 5,0 .
ICC , , - «Turbo», , . 1,2 , 1,29 , . : 266 , 24 ° C 20 ° C. , - , Intel . mesh , 900 .
, Cinebench R20, , 5,0 . , Speed Shift, Intel 5,0 . CB20, , 600 , , 5,0 334 — , - mesh, - . mesh 2,4 .
, 1U , . , , , . , 81C, 1.290 . 14- 5,0 .

: . ICC 1,75- -, 350–400 , , . , . 78 1 (30 ) . , - 1U, , - , . , , .
AVX-512. 3,8 , -12. , Intel, , AVX-512, , , , . 600 , — 82C.
- — , . , OEM- , , « MSRP, » — .
Intel Core i9-9990XE:
Intel Core i9-9990XE . CES , : 14- 5,0 OEM- . Intel , , , , , .

, ( ) , . , CaseKing , ( 1 ) -, 2999 ( — 2849 ), ( ) . Puget Systems, ICC, Intel, , . ICC 1U .

, . , 400 - 1,75 . : 78 , , . , 1U, , — . , tower, , 28- Xeon W-3175X, , .
, ICC . 32 DDR4, DDR4-3600 . SSD GPU, - . - Core i9-9990XE — . Intel Core , Xeon W-3175X, 28- , , Core i9-9990XE , . , — Core i9-9990XE . : mesh , - .
AMD, 5,0 , . AMD 32- Threadripper, : 14 5,0 32 ~ 3,4 , 2990WX «» , , AVX2 / AVX512, Core i9-9990XE .
, , . W-3175X $ 3000, i9-9990XE, ECC , . 2990WX — NUMA, . , i9-9990XE , 2990WX 30-40%.

8- Intel 5,0 , Core i9-9900KS. , 16 PCIe 3.0, $ 513 (30 ). , 5,0 (. . ), , , 9900KS , 9990XE, , , .
, Core i9-9990XE: Intel , , . , , , . , Intel ( - ). Intel , . , , , . , Core i9-9900KS , .
, Core i9-9990XE . , . Robot Wars () BattleBots (): - , , . -, , , , - .
:)
, . ? ? Ajude-nos fazendo um pedido ou recomendando a seus amigos o
VPS na nuvem para desenvolvedores a partir de US $ 4,99 , um
desconto de 30% para os usuários da Habr em um analógico exclusivo de servidores de nível básico que inventamos para você: Toda a verdade sobre o VPS (KVM) E5-2650 v4 (6) Núcleos) 10GB DDR4 240GB SSD 1Gbps de US $ 20 ou como compartilhar um servidor? ( RAID1 RAID10, 24 40GB DDR4).
Dell R730xd 2 vezes mais barato?Somente nós temos 2 x TVs Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV a partir de US $ 199 na Holanda! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - a partir de US $ 99! Leia sobre Como criar um prédio de infraestrutura. classe usando servidores Dell R730xd E5-2650 v4 custando 9.000 euros por um centavo?