Onde está o progresso na RAM e por que fazer overclock?

Olá GT! Todos nós amamos o novo hardware - é bom trabalhar em um computador rápido, e não olhar para todos os tipos de barras de progresso e outras ampulhetas. Se com processadores e placas de vídeo tudo estiver mais ou menos claro: aqui está uma nova geração, obtenha 10-20-30-50% de produtividade e, com a RAM, não é tão simples.



Onde está o progresso nos módulos de memória, por que o preço de um gigabyte quase não está caindo e como agradar o seu computador - em nosso programa educacional de ferro.

DDR4


O padrão de memória DDR4 tem várias vantagens sobre o DDR3: grandes frequências máximas (ou seja, largura de banda), menor tensão (e dissipação de calor) e, é claro, capacidade duplicada por módulo.

O Comitê de Padronização de Engenharia de Semicondutores da Electronic Industries Alliance (mais conhecida como JEDEC) está trabalhando para garantir que sua RAM Kingston corresponda à sua placa-mãe ASUS ou Gigabyte, e todos cumpram essas regras. Quanto à elétrica, física e conectores, tudo é difícil (é compreensível, é necessário garantir a compatibilidade física), mas no que diz respeito às frequências de operação, volumes e atrasos dos módulos, as regras permitem alguma volatilidade: se você deseja fazer melhor, faça o mais importante nas configurações padrão os usuários não tiveram problemas.

Foi assim que surgiram os módulos DDR3 com frequência superior a 1600 MHz e DDR4 com frequências acima de 3200 MHz: eles excedem as especificações básicas e podem funcionar tanto em parâmetros "padrão" compatíveis com todas as placas-mãe quanto com perfis extremos (XMP), testado na fábrica e conectado à memória do BIOS.



Progresso


Grandes melhorias nessa área estão sendo realizadas em várias direções ao mesmo tempo. Em primeiro lugar, os fabricantes de chips de memória direta (Hynix, Samsung, Micron e Toshiba) estão melhorando constantemente a arquitetura interna dos chips na mesma tecnologia de processo. De revisão em revisão, a topologia interna é aperfeiçoada, garantindo aquecimento uniforme e operação confiável.

Em segundo lugar, a memória está se movendo lentamente para uma nova tecnologia de processo. Infelizmente, é impossível fazer melhorias aqui tão rapidamente quanto os fabricantes de placas de vídeo ou processadores centrais (feitos nos últimos 10 anos): uma redução bruta no tamanho das peças de trabalho, ou seja, transistores, exigirá uma redução correspondente nas tensões operacionais, limitadas pelo padrão JEDEC e pelos controladores de memória incorporados na CPU .

Portanto, a única coisa que resta é não apenas “apertar” os padrões de produção, mas também aumentar simultaneamente a velocidade de cada microcircuito, o que exigirá um aumento correspondente na tensão. Como resultado, ambas as frequências aumentam e os volumes de um módulo.

Existem muitos exemplos desse desenvolvimento. Em 2009-2010, a escolha entre 2/4 gigabytes de DDR3 1066 MHz e DDR3 1333 MHz por módulo foi normal (ambas foram realizadas usando a tecnologia de processo de 90 nm). Atualmente, um padrão moribundo está pronto para oferecer 1600, 1866, 2000 e até 2133 MHz de frequências operacionais em módulos de 4, 8 e 16 GB, embora 32, 30 e até 28 nm estejam dentro.

Infelizmente, essa atualização custa muito dinheiro (principalmente para pesquisa, compra de equipamentos e depuração do processo de produção); portanto, você não precisará esperar uma redução radical no preço de 1 GB de RAM antes da DDR5: bem, veremos outra duplicação de características úteis com a mesma custo de produção.

O preço de melhorias, overclocking e a busca por equilíbrio


O volume e a velocidade crescentes do trabalho afetam diretamente outro parâmetro de atraso na RAM (eles também são tempos). A operação de microcircuitos em altas frequências ainda não deseja violar as leis da física, e determinados intervalos de tempo são necessários para várias operações (buscando informações sobre um microcircuito, lendo, escrevendo, atualizando uma célula). Reduzir o processo técnico está valendo a pena e os tempos crescem mais lentamente que as frequências de operação, mas aqui é necessário encontrar um equilíbrio entre a velocidade de leitura linear e a velocidade de resposta.



Por exemplo, a memória pode funcionar nos perfis de 2133 MHz e 2400 MHz com o mesmo conjunto de tempos (15-15-15-29) - nesse caso, o overclock é justificado: com uma frequência de atraso mais alta de vários ciclos de clock, ela só diminui e você não apenas aumentará a velocidade linear leitura, mas também velocidade de resposta. Mas se o próximo limite (2666 MHz) exigir um aumento nos atrasos de 1-2 ou mesmo 3 unidades, vale a pena considerar. Vamos fazer alguns cálculos simples.

Divida a frequência de operação pelo primeiro tempo (CAS). Quanto maior a proporção, melhor:
2133/15 = 142,2
2400/15 = 160
2666/16 = 166.625
2666/17 = 156.823

O valor resultante é o denominador na fração 1 segundo / X * 1 000 000. Ou seja, quanto maior o número, menor o atraso entre o recebimento de informações do controlador de memória e o envio de dados.

Como pode ser visto nos cálculos, o maior aumento é uma atualização de 2133 para 2400 MHz com os mesmos tempos. Aumentar o atraso em 1 relógio, necessário para uma operação estável a uma frequência de 2666 MHz, ainda oferece vantagens (mas não tão graves), e se a memória funcionar com uma frequência aumentada apenas com um aumento no tempo de 2 unidades, o desempenho diminuirá ligeiramente em relação a 2400 MHz.

O inverso também é verdadeiro: se os módulos absolutamente não querem aumentar as frequências (ou seja, você encontrou o limite para o seu conjunto de memória específico) - você pode tentar recuperar um pouco do desempenho "livre" reduzindo os atrasos.

Na verdade, existem mais alguns fatores, mas mesmo esses cálculos simples ajudarão a não prejudicar o overclock da memória: não faz sentido reduzir a velocidade máxima dos módulos se os resultados ficarem piores que a média.



A aplicação prática de overclocking de memória


Em termos de software, essas manipulações se beneficiam principalmente de tarefas que constantemente exploram a memória, não no modo de leitura em fluxo, mas na extração de dados aleatórios. Ou seja, jogos, photoshop e todos os tipos de tarefas de programação.



No entanto, sistemas de hardware com gráficos integrados no processador (e desprovidos de sua própria memória de vídeo) recebem um aumento significativo de desempenho ao reduzir atrasos e aumentar as frequências de operação: um controlador simples e baixa largura de banda muitas vezes se tornam um gargalo de GPUs integradas. Portanto, se os seus "Tanques" favoritos mal se arrastarem nos gráficos internos de um computador antigo - você sabe o que pode tentar fazer para melhorar a situação.

Mainstream


Curiosamente, os usuários médios se beneficiam mais com essas melhorias. Não, é claro que overclockers, profissionais e jogadores com uma carteira cheia obtêm seu desempenho de 0,5% usando módulos extremos com frequências ultrajantes, mas sua participação no mercado é pequena.

O que há sob o capô?


Os radiadores de alumínio branco são fáceis de remover. Passo zero: estamos aterrados na bateria ou em algum outro contato de metal com a terra e deixamos a estática drenar - não queremos causar um acidente ridículo para matar um módulo de memória?

Etapa 1: aquecemos o módulo de memória com um secador de cabelo ou com cargas ativas de leitura e gravação (no segundo caso, você precisa desligar rapidamente o PC, desligar a alimentação e remover a RAM enquanto ainda está quente).



Etapa 2: encontre o lado sem adesivo e, delicadamente, pegue o radiador com alguma coisa no centro e nas bordas. É possível usar uma placa de circuito impresso como base para a alavanca, mas com cuidado. Escolha cuidadosamente um ponto de apoio, tente evitar a pressão sobre elementos frágeis. É melhor agir de acordo com o princípio de "lenta mas seguramente".

Etapa 3: abra o radiador e desconecte as travas. Aqui estão eles, chips preciosos. Soldado de um lado. Fabricante - Micron, modelo de chip 6XA77 D9SRJ.



8 peças de 1 GB cada, o perfil da fábrica é 2400 MHz @ CL16.


É verdade que não vale a pena remover os distribuidores de calor em casa - você rasga o selo e sua garantia de 1 ano chora. Sim, e os radiadores nativos fazem um excelente trabalho com as funções atribuídas a eles.

Vamos tentar medir o efeito do overclock da RAM usando o exemplo do kit HyperX Fury HX426C16FW2K4 / 32. A decodificação do nome fornece as seguintes informações: HX4 - DDR4, 26 - frequência de fábrica 2666 MHz, atrasos em C16 - CL16. A seguir, vem o código de cores dos radiadores (no nosso caso, branco), e a descrição do kit K4 / 32 é um conjunto de 4 módulos com um volume total de 32 GB. Ou seja, já é visível que a RAM está ligeiramente com overclock durante a produção: em vez dos 2400 padrão, o perfil de 2666 MHz com os mesmos tempos é costurado.



Além do prazer estético de contemplar os quatro “Snow White” no caso do seu PC, este conjunto está pronto para oferecer um peso de 32 gigabytes de memória e é destinado a usuários de processadores convencionais que não se dão ao trabalho de fazer overclock na CPU. As modernas Intel sem a letra K no final perderam completamente todas as formas possíveis de obter desempenho livre e praticamente não recebem bônus da memória com uma frequência acima de 2400 MHz.



Tomamos dois computadores como bancos de teste. Um deles é baseado no Intel Core i7-6800K e na placa-mãe ASUS X99 (representa uma plataforma para entusiastas com um controlador de memória de quatro canais), o segundo com um Core i5-7600 interno (este vai explodir o hardware convencional com gráficos integrados e falta de overclock). No primeiro, verificaremos o potencial de overclock da memória e, no segundo, mediremos o desempenho real em jogos e software de trabalho.

Potencial de overclock


Com perfis JEDEC padrão e a memória XMP de fábrica, possui os seguintes modos operacionais:
DDR4-2666 CL15-17-17 @ 1.2V
DDR4-2400 CL14-16-16 @ 1.2V
DDR4-2133 CL12-14-14 @ 1.2V

É fácil perceber que as configurações de tempo de 2400 MHz tornam a memória menos responsiva que os perfis de 2133 e 2666 MHz.
2133/12 = 177,75
2400/14 = 171.428
2666/15 = 177,7 (3)

As tentativas de iniciar a memória com uma frequência de 2900 MHz com atrasos crescentes para 16-17-18, 17-18-18, 17-19-19 e mesmo com o aumento da tensão para 1,3 Volts não funcionaram. Sem cargas sérias, o computador funciona, mas o Photoshop, o arquivador ou o benchmark cospem erros ou despejam o sistema no BSOD. Parece que o potencial de frequência dos módulos é selecionado até o fim, e a única coisa que resta para nós é reduzir o atraso.



O melhor resultado obtido com um conjunto de testes de 4 módulos - 2666 MHz com os intervalos CL13-14-13. Isso aumentará significativamente a velocidade de acesso a dados aleatórios (2666/13 = 205,07) e deve mostrar uma boa melhoria nos resultados no benchmark do jogo. No modo de canal duplo, a memória acelera melhor: os especialistas da oclab conseguiram elevar um conjunto de dois módulos de 16 GB a uma frequência de 3000 MHz @ CL14-15-15-28 com um aumento de tensão de até 1,4 Volts - um excelente resultado.



Testes em grande escala


Para o i5 com gráficos integrados, escolhemos o GTA V. Como referência, o jogo não é jovem, usa a API DirectX 11, que há muito é conhecida e perfeitamente lambida nos drivers da Intel, gosta de consumir RAM e carrega o sistema de uma só vez em todas as frentes: GPU, CPU, Ram lendo do disco. Clássico Junto com isso, o GTA V usa o chamado "Renderização atrasada", devido à qual o tempo de cálculo do quadro depende menos da complexidade da cena, ou seja, o procedimento de teste será mais limpo e os resultados mais claros.

Para o FPS médio, adotamos os valores que se encaixam no curso normal do jogo: o vôo de um avião, andando na cidade, a destruição de adversários com um perfil de carga uniforme. Para essas cenas (descartando 1% dos melhores e piores resultados da matriz de dados) e obtenha o FPS médio do jogo.

Os rebaixamentos podem ser determinados a partir de cenas com explosões e efeitos complexos (uma cachoeira sob uma ponte, paisagens por do sol) de maneira semelhante.

Frisos congestionados e desagradáveis ​​durante uma mudança acentuada de ambiente (alternando de um caso de teste para outro) acontecem mesmo em uma monstruosa GTX 1080Ti, tentaremos notá-los, mas não os levaremos aos resultados: isso não ocorre no jogo e é mais provável que seja o batente do próprio benchmark.

Configuração do suporte de demonstração
CPU: Intel Core i5-7500 (4c4t a 3,8 GHz)
GPU: Intel HD530
RAM: 32 GB HyperX Fury White (2133 MHz CL12, 2666 MHz CL15 e 2666 MHz CL13)
MB: ASUS B250M
SSD: Kingston A400 240 GB

Para começar, vamos definir as frequências padrão do perfil XMP: 2666 MHz com intervalos 15-17-17. O benchmark interno do GTA V produz FPS idênticos e os mesmos rebaixamentos nas configurações mínimas e médias em resolução de 720p: na maioria das cenas, o contador flutua em torno de 30 a 32, e em cenas pesadas e ao mudar um local para outro, o FPS afunda.



O motivo é óbvio - as capacidades da GPU são suficientes, mas as unidades de rasterização simplesmente não têm tempo para coletar e desenhar um número maior de quadros por segundo. Nas configurações gráficas "altas", os resultados estão se deteriorando rapidamente: o jogo começa a se basear diretamente nos modestos recursos de computação dos gráficos integrados.

2133 MHz CL12


A GPU não possui memória própria e é forçada a puxar constantemente o sistema. A largura de banda do DDR4 no modo de dois canais a uma frequência de 2133 MHz será de 64 bits (8 bytes) × 2 133 000 000 MHz × 2 canais - cerca de 34 Gb / s, com pequenas (até 10%) perdas aéreas.

Para comparação, a largura de banda do subsistema de memória da placa NVIDIA GTX 1030 discreta mais modesta é de 48 Gb / s, enquanto a GTX 1050 Ti (que emite facilmente GTA V 60 FPS nas configurações máximas em FullHD) já é de 112 Gb / s.


No fundo, você pode ver a mesma cachoeira embaixo da ponte, drenando o FPS no benchmark do jogo.

Os resultados do benchmark caíram para 28 FPS, em média, e diminuíram quando a mudança de local e a explosão de seus rebaixamentos sem estresse se transformaram em microfreezes desagradáveis.

2666 MHz CL13


Os tempos diminuídos reduziram significativamente o tempo de espera por uma resposta da memória, e já temos resultados padrão com esta frequência: podemos comparar três pontos de referência e obter uma imagem clara. A largura de banda para 2666 MHz já é de 21,3 Gb / s × 2 canais ~ 40 Gb / s, comparável à NVIDIA mais nova.



O FPS máximo praticamente não aumentou (0,1 não é um indicador e está à beira do erro de medição) - aqui ainda descansamos nas capacidades modestas dos ROPs, mas todos os rebaixamentos se tornaram menos perceptíveis. Em cenas com cascata, devido à alta carga computacional, o resultado não mudou, em todo o resto - ou seja, em downloads, explosões e outras alegrias que desaceleraram o núcleo do vídeo, cresceu em média de 10 a 15%. Em vez de 25 a 27 quadros em episódios carregados com eventos, 28 a 29 confiantes. Em geral, o jogo começou a parecer muito mais confortável.

TL; DR e resultados


Você não pode avaliar a velocidade da RAM em apenas uma frequência. O DDR4 possui atrasos de clock bastante grandes e, como todas as outras coisas são iguais, vale a pena escolher uma memória que não apenas satisfaça as necessidades do seu hardware em frequência e volume operacionais, mas também preste atenção a esse parâmetro.



Os testes mostraram que os computadores baseados no Intel Core i-series com gráficos integrados recebem um aumento notável no desempenho ao usar memória de alta velocidade com baixa latência. O núcleo de vídeo não possui recursos próprios para armazenamento e processamento de dados e utiliza o sistema perfeitamente (até um certo limite) responde ao aumento da frequência e diminuição dos tempos, pois o tempo de renderização de um quadro com muitos objetos depende diretamente da velocidade de acesso à memória.

A coisa mais importante! A linha Fury está disponível em várias cores: branco, vermelho e preto - você pode escolher não apenas a memória rápida, mas também ajustar o restante dos componentes em grande estilo, como fazem os especialistas em HyperPC .



A lei de Kirchhoff e um pouco de magia da escola permitem dizer que a memória com radiadores pretos será um pouco mais fria no trabalho do que outras opções. Bem, para quem não acredita em física sagrada, há uma prova maravilhosa no canal educacional MEPhI.

Se tudo estiver claro com as soluções convencionais, então no segmento high-end, onde cada engenheiro de sistemas é uma pequena obra de arte, usar memória e unidades HyperX de linhas de produtos comuns é uma marca de qualidade. Ao criar cada projeto personalizado, muitos fatores devem ser levados em consideração: cargas térmicas, desejos de um cliente caprichoso, distribuição de ar, problemas acústicos (um computador poderoso e um computador silencioso e poderoso são tarefas que diferem na complexidade por uma ordem de magnitude). O HyperPC aprimora constantemente seus processos e permanece fiel a componentes confiáveis ​​- daí os excelentes resultados em seus conjuntos exclusivos. Porém, se você preferir computadores prontos para o cálculo automático, um kit semelhante ou módulos únicos HyperX Fury DDR4 podem ser adquiridos na rede Yulmart .

Isso é tudo, mas não dizemos adeus. Cool summer - tópicos quentes, assine o nosso blog e todas as coisas interessantes não passarão.



1 - Devido às peculiaridades da legislação russa, uma garantia vitalícia será válida por apenas 10 anos a partir da data da compra. No entanto, em termos de hardware de computador com o ritmo atual de desenvolvimento de tecnologia e 10 anos, o período não é curto e a legislação pode sofrer alterações.

Source: https://habr.com/ru/post/pt404701/


All Articles