O Intel Core i7-8086K (parte 2)

Parte 1 >> Parte 2 >> Parte 3 >> Parte 4

Testes do sistema da CPU


Nosso primeiro conjunto de testes são testes gerais do sistema. Este conjunto de testes visa emular em grande parte o que as pessoas costumam fazer com o computador, como abrir arquivos grandes ou processar pequenas pilhas de dados. Isso é um pouco diferente dos testes de escritório, que usam testes padrão da indústria. Alguns dos testes aqui são relativamente novos e incomuns.




Processamento FCAT: link


Uma das cargas mais interessantes que tem sido usada em nosso estande nos últimos trimestres é o FCAT, uma ferramenta que usamos para medir atrasos nos jogos devido a quedas ou perda de quadros. O processo FCAT requer a inclusão de uma sobreposição de cores no jogo, a gravação do processo do jogo e a análise subsequente do arquivo de vídeo usando o software apropriado. Esse software geralmente é de thread único, pois o vídeo está em um formato RAW primitivo, o que implica em um tamanho de arquivo grande e requer a movimentação de uma grande quantidade de dados. Para o nosso teste, realizamos um registro de 90 segundos do teste Rise of the Tomb Raider, que roda no GTX 980 Ti a 1440p, com aproximadamente 21 GB de tamanho, e medimos o tempo necessário para processar usando a ferramenta de análise visual.



O FCAT é um teste de thread único, mas mesmo neste teste o processador de 5,0 GHz não está no topo.

Referência do Dolphin: link


Muitos emuladores são conectados pelo desempenho do processador de processador único, e os relatórios gerais tendem a sugerir que o Haswell aumentará significativamente o desempenho do emulador. Esse benchmark lança o programa Wii, no qual o feixe rastreia uma cena tridimensional complexa dentro do emulador Dolphin Wii. Os resultados deste teste são um indicador muito confiável da velocidade da emulação do processador Dolphin, que é uma tarefa intensiva de núcleo único que usa a maioria dos aspectos do processador. Os resultados são apresentados em minutos, onde o próprio Wii mostrou um resultado de 17,53 minutos (1052 segundos).



Nesse teste, o sucesso de 5,0 GHz e o 8086K estabelecem um recorde para o Dolphin.

Teste de algoritmo de movimento 3D v2.1: link


Esta é a versão mais recente do nosso benchmark 3DPM. O objetivo do 3DPM é simular algoritmos científicos parcialmente otimizados retirados diretamente da minha dissertação de doutorado. A versão 2.1 difere da 2.0 na medida em que transfere as estruturas básicas de partículas por referência e não por valor e reduz o número de conversões duplas> flutuantes-> duplas executadas pelo compilador. Isso fornece uma aceleração de 25% em comparação com a versão 2.0, o que significa novos dados.



No 3DPM, o 8086K mostra-se a par do 8700K.

DigiCortex v1.20: link


Embora desatualizado por alguns anos, o software DigiCortex é um projeto caseiro para visualizar a atividade dos neurônios e sinapses no cérebro. O software vem com vários parâmetros de referência, e adotamos um pequeno parâmetro que executa uma simulação cerebral de 32 mil neurônios / 1,8 bilhão de sinapses. Os resultados do teste indicam a capacidade do sistema emular em tempo real, o que significa que qualquer resultado acima de um é adequado para emulação. O benchmark oferece um modo "sem emissão sináptica de neurônios", que mostra essencialmente a velocidade da DRAM e do barramento. Adotamos o modo "disparo", que adiciona carga de CPU a cada lançamento de neurônio.



Apesar da frequência de núcleo único mais alta, esse teste limitado à DRAM parece carregar outro núcleo e impedir que o 8086K atinja 5,0 GHz.

Agisoft Photoscan 1.3.3: link


O Photoscan permaneceu em nosso conjunto de testes da versão anterior dos testes, mas agora trabalhamos no Windows 10, então recursos como o Speed ​​Shift nos processadores mais recentes entram em cena. O conceito do Photoscan é a conversão de muitas imagens 2D em um modelo 3D - portanto, quanto mais detalhadas as imagens, e quanto mais, melhor o modelo. O algoritmo consiste em quatro estágios: vários single-threaded e vários multi-threaded, e também possui alguma dependência do cache e da memória. Para algumas cargas de trabalho multithread mais diversas, opções como Speed ​​Shift e XFR podem tirar proveito da espera ou do tempo de inatividade da CPU, proporcionando um aumento significativo no desempenho de novas microarquiteturas.



A Agisoft possui multithreading variável, mas o 8086K ainda está um pouco atrás do 8700K.

Testes de renderização da CPU


Os testes de renderização são os favoritos há muito reconhecidos das revisões e testes, porque o código usado pelos pacotes de renderização geralmente é otimizado para reduzir todo o desempenho. Às vezes, a renderização de programas também depende muito da memória - quando você tem muitos threads carregando toneladas de dados, a memória de baixa latência pode ser a chave para tudo. Aqui, apresentamos alguns pacotes de renderização comuns para o Windows 10, bem como alguns novos testes interessantes.

Corona 1.3: link


O Corona é um pacote autônomo projetado para oferecer suporte a software, como o 3ds Max e o Maya, com fotorrealismo usando traçado de raios. É simples - você direciona os raios, obtém os pixels. Ok, um pouco mais complicado, mas esse benchmark renderiza uma cena fixa seis vezes e produz resultados em termos de tempo e número de raios por segundo. As tabelas de benchmark oficiais mostram os resultados dos usuários em termos de tempo, mas acho que “feixes por segundo” é o melhor indicador (e, em geral, resultados em que “mais significa melhor” são mais fáceis de explicar). A Corona adora empilhar threads, portanto os resultados dependem fortemente do número de threads.



O Corona é um teste totalmente multithread e, portanto, é surpreendente ver o 8086K ficar atrás do 8700K. Provavelmente, isso se deve ao fato de o sistema de teste emprestado não atender perfeitamente ao nosso padrão de teste.

Blender 2.78: link


Um homem velho no mundo dos testes de renderização, o Blender ainda é uma ferramenta muito popular. Conseguimos lançar a carga de trabalho padrão na versão Blender de 5 de fevereiro e medir o tempo necessário para renderizar o primeiro quadro da cena. O Blender é uma das maiores ferramentas de código aberto, o que significa que a AMD e a Intel estão trabalhando ativamente para ajudar a melhorar a base de código, o que pode beneficiar e prejudicar sua própria microarquitetura.



O Blender também adora criar threads, e o 8086K, como antes, fica atrás do gêmeo.

LuxMark v3.1


Como um teste sintético, o LuxMark pode parecer pouco confiável como ferramenta de visualização, pois é usado principalmente para testar GPUs. No entanto, oferece os modos padrão OpenCL e C ++. Nesse caso, além de comparar cada versão da codificação de kernels e IPC, podemos ver que os códigos C ++ e OpenCL mostram desempenho diferente nos mesmos processadores.





POV-Ray 3.7.1b4


Outra referência regular na maioria dos kits é o POV-Ray. Outro traçador de raios com uma longa história. Como costuma acontecer, durante a preparação da AMD para o lançamento do Ryzen, a base de código começou a ser ativamente atualizada, os desenvolvedores fizeram alterações no código e lançaram novas atualizações. Nossa versão para os testes foi feita pouco antes do início de tais eventos, mas, com o tempo, vemos que o código POV-Ray é ajustado de acordo com os novos requisitos.



Resultados quase idênticos para o 8086K e 8700K no teste POV-Ray.

Cinebench R15: link


A versão mais recente do CineBench se tornou um daqueles programas que foram usados ​​em todos os lugares, em particular, como um indicador do desempenho de um único encadeamento. Alto IPC e alta frequência proporcionam desempenho de rosqueamento único, apesar de ter uma boa escala e muitos núcleos é a chave para o sucesso do rosqueamento múltiplo.





O 8086K recebe o título de novo campeão em testes de rosca única no CineBench R15 ST, mas está ligeiramente atrás dos 8700K em testes de rosca múltipla.

Testes de codificação da CPU


Um dos elementos interessantes dos processadores modernos é o desempenho da codificação. Isso inclui criptografia / descriptografia, bem como transcodificação de vídeo de um formato de vídeo para outro. No caso de criptografia / descriptografia, o desempenho ainda é relevante para criptografar dados confidenciais “on the fly” - o processo pelo qual os dispositivos modernos normalmente fornecem segurança de software. Recentemente, o uso da transcodificação de vídeo para ajustar a qualidade, tamanho e resolução do arquivo de vídeo está passando por um boom real. Isso é necessário para ajustar o vídeo ao dispositivo do consumidor ou para streamers de jogos que desejam baixar o fluxo de vídeo codificado da câmera em tempo real. À medida que avançamos para o vídeo 3D ao vivo, essa tarefa será ainda mais prioritária, e acontece que o desempenho de certos algoritmos é determinado pela função de entrada / saída do conteúdo.

7 zip 9,2


Um dos arquivadores de freeware para avaliar o desempenho do processador é o 7-Zip. Ele roda sob uma licença de código aberto, é uma ferramenta rápida e fácil de usar para usuários avançados. Executamos o modo de teste pela linha de comando, executamos quatro ciclos e obtemos o resultado.







Novamente, há um confronto com 8700K, mas o novo 8086 está um pouco atrasado.

WinRAR 5.40


Para o conjunto de testes de 2017, usaremos a versão mais recente do WinRAR em nosso teste de arquivamento. O WinRAR, em alguns aspectos, é mais amigável que o 7-Zip, então decidimos incluí-lo no pacote. Em vez de usar o modo de referência, como no caso do 7-Zip, aqui pegamos um conjunto de arquivos que representam uma pilha comum (33 arquivos de vídeo de 1,37 GB, 2834 arquivos menores em 370 pastas de 150 MB cada) de formatos compactáveis ​​e incompressíveis. Os resultados mostrados são o tempo necessário para codificar o arquivo. Devido ao armazenamento em cache DRAM, executamos o teste 10 vezes e obtemos o valor médio das últimas cinco partidas quando o benchmark está em um estado estável.



E este é outro teste em que o 8086K é inferior ao 8700K "ilimitado".

Codificação AES


Os algoritmos que usam criptografia AES foram amplamente distribuídos em todo o mundo como uma ferramenta de criptografia onipresente. No entanto, esse é outro teste de CPU, e as CPUs modernas têm uma extensão do sistema de instruções AES para aumentar o desempenho da criptografia. Costumamos considerar o dimensionamento em frequência e em núcleos usando esse benchmark. Usamos a versão mais recente do TrueCrypt e a executamos no modo de benchmark com 1 GB de dados na DRAM. Os resultados mostrados são os GB / s médios para criptografia e descriptografia.



Ao codificar AES, obtivemos literalmente os mesmos resultados.

HandBrake v1.0.2 H264 e HEVC


Como mencionado acima, a transcodificação de vídeo (codificação e decodificação) é um tópico importante em termos de desempenho, à medida que o ritmo de criação de novo conteúdo está aumentando. A primeira suposição é uma alteração no padrão de formatação de vídeo, que pode ocorrer com ou sem perda de qualidade. Também é possível reduzir a qualidade do vídeo por causa do tamanho do arquivo. Juntamente com o codec favorito do Google, o VP9, ​​existem outros dois usados ​​com frequência: o H264, o codec antigo, está quase em toda parte e otimizado para vídeo 1080p, e o HEVC (ou H265), que visa fornecer a mesma qualidade que o H264, mas em tamanho de arquivo menor (ou qualidade superior para o mesmo tamanho). O HEVC é importante porque é capaz de transmitir vídeo streaming com qualidade 4K, o que significa transmitir menos bits para o mesmo conteúdo de qualidade.

O freio de mão é a ferramenta de transcodificação preferida; portanto, nosso modo de teste abrange três áreas.

Baixa qualidade / resolução do H264: aqui, recodificamos um vídeo H264 de 640x266 de 2 horas e alteramos a codificação de Perfil principal para Perfil alto usando uma predefinição muito rápida.



Alta qualidade / resolução H264: um teste semelhante, mas desta vez pegamos um arquivo 4K duplo de dez minutos (3840x4320) exibido a 60 Hz e transcodificado de Principal para Alto usando uma predefinição muito rápida.



Teste HEVC: usando o mesmo vídeo em HQ, alteramos a resolução e o codec do vídeo original de 4K60 para H264 para 4K60 HEVC.



Testes de CPU Office


Os programas de escritório que usamos para benchmarking não são programas específicos, mas testes padrão da indústria, eles carregam peso em um ambiente profissional. O objetivo desses testes é usar um conjunto de programas e métodos que um usuário comum do escritório pode encontrar, como videoconferência, edição de documentos, modelagem de arquitetura e assim por diante.

Compilação de cromo (v56)


Nosso novo teste de compilação usa o Windows 10 Pro, VS Community 2015.3 com o Win10 SDK para compilar compilações noturnas do Chromium. Preparamos o teste para montagem no final de março de 2017 e, em nosso teste, estamos lançando uma nova compilação completa. A compilação é um exemplo típico de uma carga de trabalho com multithreading variável - alguns processos de compilação e ligação são lineares, enquanto outras partes são multithread.



Esse é outro caso em que acho que nosso banco de testes improvisado desempenhou um grande papel e gostaria de repeti-lo mais tarde no meu estande padrão. Desde compilação dá uma carga pesada, não só no processador.

GeekBench4


De acordo com a demanda popular, o GeekBench 4 agora faz parte do nosso pacote. O GB4 é um teste sintético usando algoritmos frequentemente encontrados em cargas de trabalho de alto desempenho, além de uma série de testes orientados à memória. A maior conquista do GB4 é a conclusão do resultado de todos os testes na forma de uma única figura, que, aparentemente, seus fãs gostam, embora esse resultado nem sempre seja fácil de usar para comparar o desempenho em condições reais.





Como no CineBench, o Core i7-8086K tem precedência sobre o teste sintético de thread único.

PCMark8: link


Apesar do PCMark ter nascido em 2008/2009, a Futuremark suporta o PCMark8. Na escala de tarefas complexas, o PCMark se concentra mais em uma baixa porcentagem de cargas de trabalho profissionais, o que o torna um bom indicador do que as pessoas consideram "trabalho de escritório". Executamos o benchmark a partir da linha de comando no modo "tradicional", isto é, C ++ sem OpenCL, para remover a placa gráfica da equação e focar exclusivamente no processador. O PCMark8 oferece cargas de trabalho domésticas, profissionais e criativas, com alguns testes de software sendo compartilhados, enquanto outros são exclusivos para cada suíte de testes.



Aqui, o 8086K finalmente ultrapassa seu irmão 8700K, embora não muito.

Testes herdados da CPU


Nossos testes desatualizados são benchmarks que estavam à frente de seu tempo. Alguns deles são padrões sintéticos no setor e temos dados chegando por 10 anos. Todos os dados aqui foram relançados no Windows 10 e planejamos retornar a várias gerações de componentes para descobrir como o desempenho evoluiu.

Movimento de partículas 3D v1


O 3DPM é um teste que escrevemos que usa os algoritmos básicos de movimento 3D usados ​​nas simulações de movimento brownianas e seus testes de velocidade. Os cálculos de ponto flutuante de alto desempenho, MHz e IPC aparecerão na versão single-thread, enquanto a versão multi-thread trabalha com threads e adora muitos núcleos. Esta é a versão original, escrita no estilo de um estudante típico que não é de informática, codificando um algoritmo para um problema teórico. Ele vem sem otimizações não óbvias que ainda não foram executadas pelo compilador, como o compartilhamento falso.





CineBench 11.5 e 10


O Cinebench é uma ferramenta bem conhecida de medição de desempenho relacionada ao software de animação MAXON Cinema 4D. O Cinebench foi otimizado por uma década e se concentra apenas na energia do processador. Isso significa que, se houver uma discrepância nas características da largura de banda, o Cinebench provavelmente mostrará essa discrepância. Talvez outro software não use todas as ferramentas disponíveis para carregar o processador; portanto, a relevância do teste para o mundo real pode ser puramente acadêmica, mas, devido ao grande banco de dados do Cinebench, é difícil ignorar um pequeno teste de cinco minutos. Neste teste, lançamos a versão moderna 15, bem como as antigas 11.5 e 10 devido aos nossos dados armazenados.









x264 HD 3.0


Da mesma forma, o pacote x264 HD 3.0 que usamos aqui também é armazenado para dados históricos de regressão. A versão mais recente é a 5.0.1 e codifica um vídeo 1080p em um arquivo x264 de alta qualidade. A versão 3.0 executa o mesmo teste em um arquivo 720p e, na maioria dos casos, o desempenho do software atinge o limite para processadores de última geração, mas ainda funciona bem para os níveis médio e júnior. Além disso, esta versão leva apenas alguns minutos, enquanto a última pode demorar mais de 90 minutos.





Obrigado por ficar conosco. Você gosta dos nossos artigos? Deseja ver materiais mais interessantes? Ajude-nos fazendo um pedido ou recomendando a seus amigos, um desconto de 30% para os usuários da Habr em um análogo exclusivo de servidores básicos que inventamos para você: Toda a verdade sobre o VPS (KVM) E5-2650 v4 (6 núcleos) 10GB DDR4 240GB SSD 1Gbps de US $ 20 ou como dividir o servidor? (as opções estão disponíveis com RAID1 e RAID10, até 24 núcleos e até 40GB DDR4).

Dell R730xd 2 vezes mais barato? Somente nós temos 2 TVs Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 a partir de US $ 249 na Holanda e nos EUA! Leia sobre Como criar um prédio de infraestrutura. classe usando servidores Dell R730xd E5-2650 v4 custando 9.000 euros por um centavo?

Source: https://habr.com/ru/post/pt417729/


All Articles