Lendário Intel Core i7-2600K: testando Sandy Bridge em 2019 (parte 2)

Parte 1 → Parte 2 → Parte 3

Equipamento de teste


De acordo com nossa política de teste de processador, tomamos uma placa-mãe premium com um soquete adequado e equipamos o sistema com memória suficiente que roda na freqüência máxima suportada pelo fabricante. O teste também é realizado quando possível com as configurações do JEDEC.



Note-se que alguns usuários contestam essa abordagem, mencionando que, às vezes, a frequência máxima suportada é bastante baixa ou a memória mais rápida está disponível a um preço semelhante ou que o uso de frequências suportadas pode reduzir o desempenho. Embora esses comentários façam sentido, no final, muito poucos consumidores usam perfis de memória (XMP ou outros), porque exigem interação com o BIOS, e a maioria dos usuários abandona as velocidades JEDEC suportadas - isso inclui usuários domésticos e provedores que podem querer reduza a margem de alguns centavos ou fique dentro dos limites estabelecidos pelo fabricante. Onde possível, expandiremos os testes para adicionar módulos de memória mais rápidos - nesta revisão ou posteriormente.



Muito obrigado ...

Devemos agradecer às empresas listadas abaixo pelo equipamento gentilmente fornecido para nossas bancadas de teste. Parte desse hardware não está incluído neste sistema de teste, mas é usado em outros testes.



Nossa nova suíte de testes para 2019 e 2020:


Temperado contra Spectre e Meltdown


Para acompanhar os horários, precisamos atualizar nosso software novamente. Nas atualizações, geralmente usamos o sistema operacional mais recente, as correções mais recentes, as versões mais recentes de software e os drivers gráficos, além de adicionar novos testes ou excluir os antigos. Como os leitores comuns sabem, nosso teste de processador consiste em um conjunto de testes automatizados e, dependendo de como o software mais recente funciona, o pacote precisa ser alterado: atualize ou exclua testes ou refaça completamente. A última vez que reescrevemos os testes do zero, levou a maior parte do mês, incluindo testes de regressão (testando processadores antigos).

Um dos elementos principais da atualização de teste para 2018 (e 2019) é o fato de nossos scripts e sistemas estarem preparados para proteger contra Spectre e Meltdown. Isso significa que nosso BIOS deve ser atualizado usando o microcódigo mais recente e todas as etapas são executadas no sistema operacional com atualizações de segurança. Nesse caso, usamos o Windows 10 x64 Enterprise 1709 com atualizações de segurança de abril que atenuam a ameaça Smeltdown (como chamamos as duas vulnerabilidades em uma palavra). Os usuários podem perguntar por que não estamos usando o Windows 10 x64 RS4, a atualização mais recente. Isso ocorre devido a alguns novos recursos que fornecem resultados mistos. Em vez de passar várias semanas explorando a possibilidade de desativá-los, continuaremos trabalhando com o RS3, que agora é amplamente usado.

Nosso conjunto anterior de benchmarks foi dividido em vários segmentos, dependendo do que o teste se relaciona e como é percebido. Nosso novo conjunto de testes segue regras semelhantes e executamos testes com base em:

  • Poder
  • Memória
  • Escritório
  • Sistema
  • Render
  • Codificação
  • Web
  • Legado
  • Jogos integrados
  • Jogos com CPU

Dependendo da direção da revisão, a ordem dessas diretrizes pode mudar e algumas delas podem permanecer fora do escopo da revisão. Todos os resultados dos testes serão armazenados em nosso banco de dados Bench, que agora possui uma nova seção “CPU 2019”.
Em cada seção, realizaremos esses testes:

Poder


Nossos testes de energia são para criar a carga máxima de trabalho para cada thread no sistema e verificar os registros de energia no chip para descobrir detalhes como o consumo de energia dos núcleos, a potência de todo o chip, DRAM, E / S e a potência de cada núcleo. O resultado depende de quanta informação o fabricante do chip fornece: às vezes há realmente muito, às vezes quase nada.

Atualmente, estamos usando o POV-Ray como o principal teste de energia, pois parece penetrar profundamente no sistema e é muito consistente. Para limitar o número de núcleos durante o teste, usamos uma máscara de afinidade controlada a partir da linha de comando.

Memória


Esses testes são realizados com o desligamento de todos os modos turbo do sistema, fazendo com que funcione na frequência base e implementam as verificações de latência de memória (o Intel Latency Checker funciona igualmente bem para ambas as plataformas) e o AIDA64 para verificar a largura de banda do cache.

Escritório


  • Compilação do Chromium: Compilação do Windows VC ++ do Chrome 56 (como em 2017)
  • PCMark10: Os dados gerais estarão nos resultados da análise e os resultados dos sub-testes podem ser vistos no Banco
  • 3DMark Physics: Entramos em todos os sub-testes de bancada, mas relatamos os mais importantes (novo)
  • GeekBench4: On Demand (Novo)
  • SYSmark 2018: BAPCo lançado recentemente, agora estamos trabalhando para adicioná-lo ao nosso conjunto de testes automáticos (novo, ainda não disponível)


Sistema


  • Download do aplicativo: GIMP 2.10.4 (Novo)
  • FCAT: processamento de gravação ROTR 1440p de 90 segundos (o mesmo que em 2017)
  • Movimento de partículas 3D: teste de distribuição de partículas (como em 2017) - e também temos versões para AVX2 e AVX512, que tentaremos adicionar posteriormente;
  • Dolphin 5.0: Console Simulator (como em 2017)
  • DigiCortex: simulador de cérebro de lesmas do mar (como em 2017)
  • y-Cruncher v0.7.6: Cálculo de Pi com conjunto de instruções otimizado de novas CPUs (novas)
  • Agisoft Photoscan 1.3.3: Ferramenta de conversão 2D para 3D (atualizada)

Render


  • Corona 1.3: desempenho de renderização no 3dsMax, Cinema4D (como em 2017)
  • Blender 2.79b: renderização bmw27 na CPU (atualizado para 2.79b)
  • LuxMark v3.1 C ++ e OpenCL: testando diferentes caminhos de código de renderização (como em 2017)
  • POV-Ray 3.7.1: Benchmark embutido (atualizado)
  • CineBench R15: É provável que um teste desatualizado do Cinema4D permaneça no Bench (o mesmo que em 2017)

Codificação


  • 7-zip 1805: benchmark interno (atualizado para v1805)
  • WinRAR 5.60b3: Teste de compactação de uma pasta que contém arquivos de vídeo e web (atualizado para 5.60b3)
  • Criptografia AES: desempenho do AES na memória. Teste um pouco desatualizado. (se hospedou em 2017)
  • Handbrake 1.1.0: o arquivo inicial do Logitech C920 1080p60 é transcodificado em três formatos para streaming / armazenamento:
  • 720p60, x264, 6000 kbps CBR, rápido, alto perfil
  • 1080p60, x264, 3500 kbps CBR, mais rápido, perfil principal
  • 1080p60, HEVC, 3500 kbps VBR, rápido, perfil principal de 2 passagens

Web


  • WebXPRT3: Teste mais recente do WebXPRT (atualizado)
  • WebXPRT15: semelhante a 3, mas um pouco desatualizado. (se hospedou em 2017)
  • Speedometer2: teste do Javascript Framework (novo)
  • Google Octane 2.0: teste da web descontinuado, mas popular (sobra a partir de 2017)
  • Mozilla Kraken 1.1: Teste da web descontinuado, mas popular (saiu de 2017)
  • Legado (o conjunto não mudou desde 2017)
  • 3DPM v1: versão antiga do 3DPM
  • x264 HD 3.0: referência de transcodificação antiga
  • Cinebench R11.5 e R10: Representantes de Várias Metodologias de Codificação

Gaming Integrado e CPU


Recentemente, automatizamos cerca de uma dúzia de jogos com quatro níveis diferentes de desempenho. A maioria dos jogos terá dados sobre o tempo de exibição, mas nem todos têm dificuldades com a automação. A idéia é obter uma boa visão geral de uma seleção de diferentes gêneros e mecanismos de teste. No momento, automatizamos os seguintes jogos:



Usaremos o conjunto de testes de jogos para CPU NVIDIA GTX 1080. Para testes puros de CPU, usamos o RX460, pois agora temos vários dispositivos para testes paralelos.

Nos anos anteriores, testamos várias GPUs em um pequeno número de jogos. Desta vez, graças à minha pesquisa no Twitter, que deu exatamente 50:50, fazemos o oposto: mais jogos, menos GPUs.

Escalar versus Escalar: Benefícios da automação


De tempos em tempos, temos o mesmo comentário: a automação não é a melhor maneira de testar. Existe uma alta barreira à entrada e isso limita a capacidade de realizar testes. Do nosso ponto de vista, apesar de você precisar dedicar tempo à programação adequada (e à preparação correta do teste), a automação permite as seguintes vantagens:

  • Garante quebras constantes entre os testes de resfriamento e não um tempo de recuperação aleatório baseado em "se eu olhar para a tela";
  • Permite testar vários sistemas simultaneamente. Atualmente, uso cinco sistemas em meu escritório (limitados pelo número de monitores 4K e espaço livre), o que significa que podemos verificar mais equipamentos ao mesmo tempo;
  • Podemos deixar os testes para executar à noite, o que ajuda muito a tempo;
  • Adicionar novos testes é muito fácil com a abordagem correta.

Nosso software de teste compara todos os resultados e envia todos os dados dos testes em execução para o repositório central, e eu posso analisar os dados à medida que eles chegam. Ele também atua como uma verificação manual, caso algum dado pareça anormal.
Temos uma limitação principal, que se aplica aos nossos testes de jogos. Realizamos vários testes em uma conta Steam, e alguns jogos (por exemplo, GTA) estão disponíveis apenas online. Como o Steam permite que uma conta execute o jogo em apenas um sistema, nosso script de jogo verifica a API do Steam para determinar se estamos “online” ou não, e executa testes offline se a conta tiver permissão para fazer login no sistema. Dependendo do número de jogos que exigem categoricamente o modo online, essa necessidade pode ser um gargalo.

Atualizações do pacote de referência


Como sempre, realizamos solicitações de benchmarking. Isso nos ajuda a entender as cargas de trabalho com as quais os usuários trabalham e planejar seus testes de acordo.

Nota do pacote de software: Tivemos solicitações de testes de software, como ANSYS ou outro software de nível profissional. A desvantagem de testar este software é licenciamento e dimensionamento. A maioria dessas empresas não se importa realmente com a realização dos testes e declara que isso não faz parte de seus planos. Outros, como a Agisoft, estão mais do que dispostos a ajudar. Se você é um colaborador do desenvolvimento desses pacotes de software, a melhor maneira de ver como os usamos é nos ajudar. Temos versões especiais do software para alguns testes e, se conseguirmos algo que funcione e seja importante para nosso público, será fácil adicioná-lo ao conjunto de testes.

Testes do sistema


A seção "Testes do sistema" concentra-se em testes em condições reais com as quais o consumidor se depara, com um leve viés na taxa de transferência. Nesta seção, veremos o tempo de carregamento do aplicativo, processamento de imagens, física simples, emulação, modelagem neural, cálculos otimizados e o desenvolvimento de modelos tridimensionais usando software facilmente acessível e personalizável. Embora alguns dos testes sejam mais fáceis de se sobrepor aos recursos de pacotes grandes, como o PCMark (publicamos esses valores na seção de testes do office), vale a pena considerar várias perspectivas. Em todos os testes, explicaremos em detalhes o que está sendo testado e como exatamente estamos testando.

Todos os resultados de nossos testes também podem ser encontrados em nossa página Bench.

Download do aplicativo: GIMP 2.10.4


Um dos aspectos mais importantes da experiência do usuário e do fluxo de trabalho é a velocidade do sistema. Um bom teste aqui é verificar o tempo de carregamento do aplicativo. Atualmente, a maioria dos programas, quando armazenados em um SSD, é baixada quase instantaneamente, mas algumas ferramentas de escritório exigem o pré-carregamento de ativos antes que eles estejam prontos. A maioria dos sistemas operacionais também usa cache, portanto, quando um software é baixado com freqüência (navegador da web, ferramentas de escritório), ele pode ser inicializado muito mais rapidamente.

No conjunto de testes anterior, verificamos quanto tempo levaria para carregar um PDF grande no Adobe Acrobat. Infelizmente, este teste foi um pesadelo de programação e se recusou a atualizar para o Win10 RS3 sem lutar. Enquanto isso, descobrimos um aplicativo que pode automatizar esse teste e decidimos usar o GIMP, um aplicativo de edição de fotos popular e gratuito. Este é um editor de código aberto e a principal alternativa ao Adobe Photoshop. Nós o configuramos para carregar um modelo de design grande de 50 MB e executamos a carga 10 vezes com um intervalo de 10 segundos entre eles. Devido ao armazenamento em cache, os primeiros 3 a 5 resultados costumam ser mais lentos que os demais, e o tempo de armazenamento em cache pode ser inconsistente; portanto, usamos a média dos últimos cinco resultados para mostrar o processamento da CPU durante o carregamento em cache.



Mesmo com overclock, 2600K não pode alcançar o desempenho de 7700K, enquanto 9700K com uma frequência de thread único mais alta ocupa um primeiro lugar digno.

FCAT: processamento de imagem


O software FCAT foi projetado para detectar micro-sticks, queda de quadros e executar testes gráficos quando duas placas de vídeo são combinadas para renderizar uma cena. Devido aos mecanismos de jogo e aos drivers gráficos, nem todas as combinações de GPU funcionaram perfeitamente, como resultado do software capturou cores para cada quadro renderizado e executou dinamicamente a gravação de dados RAW usando um dispositivo de captura de vídeo.



O software FCAT aceita o vídeo gravado, no nosso caso, são 90 segundos 1440p do jogo Rise of the Tomb Raider e converte os dados de cores em dados de tempo de quadro, para que o sistema possa exibir a taxa de quadros "observada" e se correlacionar com o consumo de energia dos aceleradores de vídeo. Este teste, devido à rapidez com que foi concluído, é de thread único. Iniciamos o processo e obtemos o tempo de conclusão como resultado.



O FCAT é outro teste de thread único, portanto, vemos as mesmas diferenças de desempenho: um 2600K com overclock não pode ser comparado com o 7700K padrão e 9700K quebram à frente.

Movimento de partículas 3D v2.1: movimento browniano


Nosso teste 3DPM é uma referência personalizada projetada para modelar seis algoritmos diferentes para mover partículas no espaço tridimensional. Os algoritmos foram desenvolvidos como parte da minha tese de doutorado e, finalmente, funcionam melhor na GPU e fornecem uma boa idéia de como os fluxos de comando são interpretados por diferentes microarquiteturas.

A parte principal dos algoritmos é a geração de números aleatórios - usamos a geração relativamente rápida, que completa a implementação de cadeias de dependências no código. A atualização principal em comparação com a primeira versão primitiva desse código é que o problema do Compartilhamento Falso nos caches foi resolvido, que era o principal gargalo. Também estamos considerando a aplicação das versões AVX2 e AVX512 deste teste para futuras revisões.

Para este teste, executamos um conjunto de partículas usando seis algoritmos diferentes, em 20 segundos, com pausas de 10 segundos e relatamos a velocidade total das partículas em milhões de operações (movimentos) por segundo.

O 3DPM v2.1 pode ser baixado do nosso servidor: 3DPMv2.1.rar (13,0 MB)





Como o 2600K não possui o AVX2, fica muito atrás do 7700K / 9700K quando o programa é otimizado para novas instruções.

Dolphin 5.0: emulação de console


Um dos testes populares solicitados em nosso pacote é a emulação de console. A capacidade de selecionar um jogo de um sistema desatualizado e executá-lo é muito atraente e depende dos esforços do emulador: é necessário um sistema x86 muito mais poderoso para emular com precisão um console antigo que não seja o x86. Especialmente se o código desse console foi criado levando em consideração algumas falhas físicas e bugs de hardware.

Para nosso teste, usamos o popular software de emulação Dolphin e executamos um projeto de computação para determinar com que precisão nossos processadores podem emular o console. Neste teste, a emulação do Nintendo Wii durará cerca de 1050 segundos.

A versão mais recente do Dolphin pode ser baixada aqui.



O Dolphin alcançou resultados significativos na era Haswell / Broadwell, o que levou a um aumento incrível no desempenho de 2600K para 7700K. Infelizmente, por vários motivos, um processador com overclock falhou neste teste.

DigiCortex 1.20: Modelando o cérebro de uma lesma marinha


Esta referência foi originalmente projetada para modelar e visualizar a atividade dos neurônios e sinapses no cérebro. O software vem com vários modos predefinidos e escolhemos uma pequena referência que simula um cérebro de 32 mil neurônios / 1,8 bilhão de sinapses, o que equivale ao cérebro de uma lesma do mar.



Nós relatamos os resultados do teste como uma oportunidade para emular dados em tempo real, para que quaisquer resultados acima da "unidade" sejam adequados para operação em tempo real. Dos dois modos, o modo “sem início sinapse”, que é difícil para a DRAM, e o modo “com início sinapse”, no qual o processador está carregado, selecionamos o último. Apesar da nossa escolha, o teste ainda é afetado pela velocidade da DRAM.

DigiCortex pode ser baixado aqui



Para testes relacionados à memória, executamos os sistemas nas frequências suportadas determinadas pela Intel, com exceção do sistema com overclock, que recebeu corretamente uma aceleração significativa de DDR3-1333 para DDR3-2400. Os resultados mostram um aumento no desempenho, mas mesmo o 7700K padrão é mais rápido. E a transição para 9700K mostra um ganho de desempenho devido a núcleos adicionais.

y-Cruncher v0.7.6: ,


- y-Cruncher , . , , Alex Yee, NWU , , , . , , 20+ , 1% ! y-Cruncher , . , , .

y-Cruncher v0.7.6 , , AVX-512 . , 250 Pi, .

y-cruncher



y-cruncher — , AVX, , Sandy Bridge .

Agisoft Photoscan 1.3.3: 2D- 3D-


ISV, , — Agisoft. PhotoScan, 2D- 3D-. , .



1.3.3 — 84 x 18 . , , 2017 . .

- Agisoft Photoscan



, 2600K . 7700K . 9700K, , .

Rendering Tests


. : 3D- , , , , , ( ). , , FPGA ASIC. - .

Bench.

Corona 1.3: Performance Render


, , 3ds Max Cinema 4D, Corona 1.3. GUI , « ».



, , . , , , .



7700K 2600K, , 2600K .

Blender 2.79b: 3D Creation Suite


, Blender — , , . Blender, , Blender , . — «bmw27» « CPU», .

Blender .



Blender: 2600K 7700K. 7700K, .

LuxMark v3.1: LuxRender


, : CPU, GPU, Accelerator . , API, , , . LuxMark, , LuxRender, API.

«Ball» C ++ OpenCL, CPU. , , « ».



POV-Ray 3.7.1:
Persistence of Vision — , - , AMD Zen, Intel AMD . , .

POV-Ray



POV-Ray , , AVX2 . POV-Ray , , 9700K .

Office Tests


Office , , . , . , , , .

Bench.

PCMark 10:


Futuremark, UL, , , . PCMark 10, PCMark 8 , OpenCL, , .

PCMark 14 , , -, , , , . Bench, .



, PCMark, , , , 9700K . 7700K 2600K 17%, 5% . , , 7700K 2600K: 5% . , .

Chromium Compile: Windows VC ++ Chrome 56


AnandTech — -, , . Linux «» , , — Windows Chrome, , Chrome 56 2017 , , . Google , Windows, 400 000 .

, Google, MSVC, ninja . , , DRAM, . , , — , , .



9700K SMT, , 2600K 7700K 2600K. , 7700K .

3DMark Physics:


PCMark 3DMark, Futuremark (UL) – . , , , , . , , Ice Storm, Cloud Gate, Sky Diver, Fire Strike Time Spy.



, Ice Storm Unlimited, , Fire Strike Ultra, 4K . , Time Spy AVX-512 ( ).





, Bench , : Ice Storm Unlimited, Cloud Gate, Sky Diver, Fire Strike Ultra Time Spy,

GeekBench4:


, Mac, GeekBench 4 — , . , , , , n-, , HTML.

, . - , ( ).

(Crypto, Integer, Floating Point, Memory) , .



Encoding Tests


, , . , , , , , , . , , .

Bench.

Handbrake 1.1.0:


Uma ferramenta popular de código aberto, o Handbrake é um software para converter vídeo de qualquer maneira possível, o que, em certo sentido, é a referência. O perigo aqui reside nos números de versão e na otimização. Por exemplo, versões recentes de software podem tirar proveito do AVX-512 e OpenCL para acelerar certos tipos de transcodificação e certos algoritmos. A versão que usamos é puro trabalho com a CPU, com opções de transcodificação padrão.

Dividimos o Handbrake em vários testes usando a gravação de uma webcam nativa Logitech C920 1080p60 (essencialmente uma gravação em fluxo). O registro será convertido em dois tipos de formatos de streaming e em um para arquivamento. Parâmetros de saída usados:

  • 720p60 a taxa de bits constante de 6000 kbps, configuração rápida, alto perfil
  • 1080p60 a 3500 kbps de taxa de bits constante, configuração mais rápida, perfil principal
  • 1080p60 HEVC a uma taxa de bits variável de 3500 kbps, configuração rápida, perfil principal



7-zip v1805: arquivador de código aberto popular


De todos os nossos testes de arquivamento / desarquivamento, o 7-zip é o mais popular e possui uma referência interna. Adicionamos a versão mais recente deste software ao nosso conjunto de testes e lançamos o benchmark na linha de comando. Os resultados do arquivamento e desarquivamento são exibidos como uma única pontuação total.

Esse teste mostra claramente que os processadores modernos com várias matrizes têm uma grande diferença no desempenho entre compactação e descompactação: eles apresentam bom desempenho em um e mal no outro. Além disso, estamos discutindo ativamente como o Windows Scheduler implementa cada thread. Quando obtivermos mais resultados, ficaremos felizes em compartilhar nossos pensamentos sobre isso.

Observe que, se você planeja publicar dados de compactação em qualquer lugar, inclua os resultados da descompactação. Caso contrário, você apresentará apenas metade do resultado.



WinRAR 5.60b3: Archiver


Quando preciso de uma ferramenta de compactação, geralmente escolho o WinRAR. Muitos usuários da minha geração o usaram mais de duas décadas atrás. A interface não mudou muito, embora a integração com os comandos do botão direito do mouse no Windows seja uma vantagem muito boa. Ele não possui um benchmark interno; portanto, começamos a compactar um diretório que contém mais de 30 arquivos de vídeo de 60 segundos e 2000 pequenos arquivos da Web com velocidade de compactação normal.

O WinRAR possui um multithreading variável e é exigente no armazenamento em cache; portanto, em nosso teste, o executamos 10 vezes e calculamos o valor médio para as últimas cinco execuções, o que apenas verifica o desempenho do processador.



O WinRAR finalmente permite que os 2600K com overclock quase igualem o estoque de 7700K. Este é um teste de multiencadeamento e não parece usar nenhuma das novas instruções oferecidas pelo 7700K. No entanto, um número maior de núcleos em 9700K, em oposição aos threads, traz um grande bônus, assim como a DRAM atualizada.

Criptografia AES: proteção de arquivos


Várias plataformas, especialmente dispositivos móveis, criptografam sistemas de arquivos por padrão para proteger o conteúdo. Para dispositivos Windows, a criptografia é frequentemente usada pelo BitLocker ou software de terceiros. No teste de criptografia AES, usamos o TrueCrypt descontinuado em um benchmark que verifica vários algoritmos de criptografia diretamente na memória.



Os dados desse teste são o desempenho combinado de criptografia / descriptografia AES, medido em gigabytes por segundo. O software usa comandos AES se o processador permitir, mas não usa o AVX-512.

Testes na Web e testes herdados


Devido ao seu foco em sistemas low-end ou em sistemas com fator de forma pequeno, os testes da Web geralmente são difíceis de padronizar. Os navegadores modernos são atualizados com freqüência, impossibilitando a desativação dessas atualizações, por isso é difícil manter algum tipo de plataforma comum. O ritmo acelerado do desenvolvimento do navegador significa que as versões (e indicadores de desempenho) podem mudar de semana para semana. Apesar disso, os testes da Web costumam ser um indicador importante para os usuários: muitos dos trabalhos modernos de escritório estão relacionados a aplicativos da Web, especialmente aplicativos eletrônicos e de escritório, bem como a interfaces e ambientes de desenvolvimento. Nosso conjunto de testes na web inclui vários testes padrão do setor, além de vários testes populares, mas um tanto desatualizados.

Também incluímos nossos testes obsoletos, mas ainda populares, nesta seção.

Todos os resultados de nossos testes também podem ser encontrados em nossa página Bench.

WebXPRT 3: tarefas da Web do mundo moderno, incluindo IA


A empresa por trás do conjunto de testes XPRT, a Principled Technologies, lançou recentemente o mais recente teste da web e, em vez de adicionar um ano ao nome, simplesmente o chamou de "3". Esse teste mais recente (pelo menos por enquanto) foi desenvolvido com base em predecessores: testes de interação do usuário, computação de escritório, gráficos, listas de classificação, HTML5, manipulação de imagens e, em alguns casos, até testes de IA.

Para nosso benchmark, executamos um teste padrão, que elaborará a lista de verificação sete vezes e fornecerá o resultado final. Realizamos esse teste quatro vezes e exibimos o valor médio.

Os usuários podem acessar o teste WebXPRT em



WebXPRT 2015: testando HTML5 e Javascript na Web UX


A versão mais antiga do WebXPRT é a edição de 2015, que se concentra em um conjunto ligeiramente diferente de tecnologias e estruturas da Web, que, no entanto, são usadas hoje. Esse ainda é um teste relevante, especialmente para usuários que não interagem com os aplicativos da Web mais recentes do mercado, e existem muitos usuários. O desenvolvimento de frameworks web é muito rápido e altamente fluido. As estruturas são rapidamente desenvolvidas, incorporadas aos aplicativos, usadas e, em seguida, os desenvolvedores passam para a próxima. A adaptação do aplicativo à nova estrutura é uma tarefa difícil, especialmente com essa velocidade dos ciclos de desenvolvimento. Por esse motivo, muitos aplicativos ficam "presos no tempo" e permanecem relevantes para os usuários por muitos anos.



Como no caso do WebXPRT3, o principal benchmark cumpre o conjunto de controles sete vezes, exibindo o resultado final. Repetimos isso quatro vezes, exibimos a média e mostramos os resultados finais.

Velocímetro 2: Frameworks Javascript


Nosso mais novo teste da web é o Speedometer 2, que executa várias estruturas javascript para fazer apenas três coisas simples: criar uma lista, incluir cada item na lista e excluir a lista. Todas as estruturas implementam os mesmos sinais visuais, mas, obviamente, fazem isso de maneiras diferentes.



Nosso teste passa por toda a lista de estruturas e fornece a pontuação final sob o nome "rpm", um dos indicadores internos de referência. Exibimos esse indicador como resultado final.

Google Octane 2.0: Core Web Compute


Um teste popular na web há vários anos, mas agora não é mais atualizado, é o Octane, do Google. A versão 2.0 executa algumas dezenas de tarefas relacionadas aos cálculos, como expressões regulares, criptografia, traçado de raios, emulação e o cálculo das equações de Navier-Stokes.



O teste faz uma avaliação para cada um dos subtestes e retorna a média geométrica como resultado final. Realizamos uma referência completa quatro vezes e avaliamos os resultados finais.

Mozilla Kraken 1.1: Core Web Compute


Ainda mais antigo que o Octane, aqui está o Kraken, desta vez desenvolvido pela Mozilla. Este é um teste antigo que executa mecânica computacional relativamente uniforme, como processamento de áudio ou filtragem de imagem. Parece que o Kraken produz um resultado muito instável, dependendo da versão do navegador, pois esse teste é altamente otimizado.



O benchmark principal passa por cada um dos subtestes dez vezes e retorna o tempo médio de conclusão de cada ciclo em milissegundos. Executamos o benchmark completo quatro vezes e medimos o resultado médio.

3DPM v1: Variante de código ingênua do 3DPM v2.1.


O primeiro teste "herdado" no pacote é a primeira versão do nosso teste 3DPM. Esta é a versão nativa final do código, como se tivesse sido escrito por um cientista sem conhecimento de como o hardware, os compiladores ou a otimização do computador funcionam (como era no começo). O teste é uma grande quantidade de modelagem científica em estado selvagem, onde obter uma resposta é mais importante do que a velocidade da computação (obter o resultado em 4 dias é aceitável se estiver correto; um ano aprendendo a programar e obter o resultado em 5 minutos não é aceitável).

Nesta versão, a única otimização real estava nos sinalizadores do compilador (-O2, -fp: fast): compilação no modo release e ativação do OpenMP nos principais ciclos de computação. Os loops não foram dimensionados para funções e a desaceleração mais grave é o compartilhamento falso no cache. O código também possui longas cadeias de dependências baseadas na geração de números aleatórios, o que leva à degradação do desempenho em algumas microarquiteturas de computação.

O 3DPM v1 e o 3DPM v2 podem ser baixados aqui: 3DPMv2.1.rar (13,0 MB)



x264 HD 3.0: teste de transcodificação herdada


Esse teste de transcodificação é muito antigo; a Anandtech o utilizava nos dias dos processadores Pentium 4 e Athlon II. Nele, o vídeo 720p padronizado é codificado com dupla conversão e o benchmark mostra quadros por segundo de cada passagem. O teste é de thread único e, em algumas arquiteturas, encontramos restrições de IPC - instruções por relógio.



Obrigado por ficar conosco. Você gosta dos nossos artigos? Deseja ver materiais mais interessantes? Ajude-nos fazendo um pedido ou recomendando a seus amigos, um desconto de 30% para os usuários da Habr em um análogo exclusivo de servidores básicos que inventamos para você: Toda a verdade sobre o VPS (KVM) E5-2650 v4 (6 núcleos) 10GB DDR4 240GB SSD 1Gbps de US $ 20 ou como dividir o servidor? (as opções estão disponíveis com RAID1 e RAID10, até 24 núcleos e até 40GB DDR4).

Dell R730xd 2 vezes mais barato? Somente temos 2 TVs Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV a partir de US $ 199 na Holanda! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - a partir de US $ 99! Leia sobre Como criar um prédio de infraestrutura. classe usando servidores Dell R730xd E5-2650 v4 custando 9.000 euros por um centavo?

Source: https://habr.com/ru/post/pt455622/


All Articles