¿Dónde está el progreso en RAM y por qué overclockearlo?

Hola GT A todos nos encanta el nuevo hardware: es bueno trabajar en una computadora rápida y no mirar todo tipo de barras de progreso y otros relojes de arena. Si con los procesadores y las tarjetas de video todo está más o menos claro: aquí hay una nueva generación, obtenga su 10-20-30-50% de productividad, entonces con RAM no es tan simple.



¿Dónde está el progreso en los módulos de memoria, por qué el precio de un gigabyte casi no baja y cómo complacer a su computadora? En nuestro programa educativo de hierro.

DDR4


El estándar de memoria DDR4 tiene varias ventajas sobre DDR3: frecuencias máximas grandes (es decir, ancho de banda), voltaje más bajo (y disipación de calor) y, por supuesto, capacidad duplicada por módulo.

El Comité de Normalización de Ingeniería de Semiconductores de la Alianza de Industrias Electrónicas (mejor conocido como JEDEC) está trabajando para garantizar que su RAM Kingston coincida con su placa base ASUS o Gigabyte, y todos cumplan con estas reglas. En cuanto a la electricidad, la física y los conectores, todo es difícil (es comprensible, es necesario garantizar la compatibilidad física), pero con respecto a las frecuencias operativas, los volúmenes de módulos y los retrasos, las reglas permiten cierta volatilidad: si desea hacerlo mejor, hágalo más importante en la configuración estándar Los usuarios no tuvieron problemas.

Así es como los módulos DDR3 con una frecuencia superior a 1600 MHz y DDR4 con frecuencias superiores a 3200 MHz resultaron en ese momento: superan las especificaciones básicas y pueden funcionar tanto en parámetros "estándar" compatibles con todas las placas base como con perfiles extremos (XMP), probado de fábrica y conectado a la memoria del BIOS.



Progreso


Las mejoras importantes en esta área se están llevando a cabo en varias direcciones a la vez. En primer lugar, los fabricantes de chips de memoria directa (Hynix, Samsung, Micron y Toshiba) mejoran constantemente la arquitectura interna de los chips dentro de la misma tecnología de proceso. De revisión en revisión, la topología interna se perfecciona, asegurando un calentamiento uniforme y un funcionamiento confiable.

En segundo lugar, la memoria se está moviendo lentamente hacia una nueva tecnología de proceso. Desafortunadamente, es imposible hacer mejoras aquí tan rápido como los fabricantes de tarjetas de video o procesadores centrales (realizados en los últimos 10 años): una reducción importante en el tamaño de las piezas de trabajo, es decir, los transistores, requerirá una reducción correspondiente en los voltajes operativos, que están limitados por el estándar JEDEC y los controladores de memoria integrados en la CPU .

Por lo tanto, lo único que queda no es solo "ajustar" los estándares de producción, sino también aumentar simultáneamente la velocidad de cada microcircuito, lo que requerirá un aumento correspondiente en el voltaje. Como resultado, ambas frecuencias aumentan y los volúmenes de un módulo.

Hay muchos ejemplos de tal desarrollo. En 2009-2010, la elección entre 2/4 gigabytes de DDR3 1066 MHz y DDR3 1333 MHz por módulo fue normal (ambos se realizaron utilizando la tecnología de proceso de 90 nm). Hoy, un estándar moribundo está listo para ofrecerle frecuencias de funcionamiento de 1600, 1866, 2000 e incluso 2133 MHz en módulos de 4, 8 y 16 GB, aunque 32, 30 e incluso 28 nm están dentro.

Desafortunadamente, dicha actualización cuesta mucho dinero (principalmente para investigación, compra de equipos y depuración del proceso de producción), por lo que no tendrá que esperar una reducción radical en el precio de 1 GB de RAM antes de DDR5: bueno, allí veremos otra duplicación de características útiles con el mismo Costo de producción.

El precio de las mejoras, el overclocking y la búsqueda del equilibrio.


El creciente volumen y la velocidad del trabajo afectan directamente a otro parámetro de RAM: los retrasos (también son tiempos). La operación de microcircuitos a altas frecuencias todavía no quiere violar las leyes de la física, y se requieren ciertos intervalos de tiempo para varias operaciones (búsqueda de información en un microcircuito, lectura, escritura, actualización de una celda). La reducción del proceso técnico está dando resultado, y los tiempos crecen más lentamente que las frecuencias de operación, pero aquí es necesario lograr un equilibrio entre la velocidad de lectura lineal y la velocidad de respuesta.



Por ejemplo, la memoria puede funcionar en perfiles de 2133 MHz y 2400 MHz con el mismo conjunto de temporizaciones (15-15-15-29); en este caso, el overclocking está justificado: con una frecuencia de retardo más alta de varios ciclos de reloj, solo disminuirá y no solo obtendrá un aumento en la velocidad lineal lectura, pero también velocidad de respuesta. Pero si el próximo umbral (2666 MHz) requiere un aumento en los retrasos de 1-2, o incluso 3 unidades, vale la pena considerarlo. Hagamos algunos cálculos simples.

Divida la frecuencia de operación por el primer tiempo (CAS). Cuanto mayor sea la relación, mejor:
2133/15 = 142,2
2400/15 = 160
2666/16 = 166.625
2666/17 = 156.823

El valor resultante es el denominador en la fracción 1 segundo / X * 1 000 000. Es decir, cuanto mayor sea el número, menor será el retraso entre la recepción de información del controlador de memoria y el envío de datos.

Como se puede ver en los cálculos, el mayor aumento es una actualización de 2133 a 2400 MHz con los mismos tiempos. Aumentar el retraso en 1 reloj, lo cual es necesario para un funcionamiento estable a una frecuencia de 2666 MHz, aún ofrece ventajas (pero no tan graves), y si su memoria funciona a una frecuencia aumentada solo con un aumento en el tiempo en 2 unidades, el rendimiento incluso disminuirá ligeramente en relación con 2400 MHz.

Lo contrario también es cierto: si los módulos no desean aumentar las frecuencias (es decir, ha encontrado el límite para su conjunto de memoria en particular), puede intentar recuperar un poco de rendimiento "libre" al reducir los retrasos.

En realidad, hay algunos factores más, pero incluso estos cálculos simples ayudarán a no estropear el overclocking de memoria: no tiene sentido exprimir la velocidad máxima de los módulos si los resultados son peores que el promedio.



La aplicación práctica del overclocking de memoria


En términos de software, tales manipulaciones se benefician principalmente de tareas que explotan constantemente la memoria no en modo de lectura de transmisión, sino que extraen datos aleatorios. Es decir, juegos, photoshop y todo tipo de tareas de programación.



Sin embargo, los sistemas de hardware con gráficos integrados en el procesador (y desprovistos de su propia memoria de video) reciben un aumento significativo del rendimiento tanto al reducir los retrasos como al aumentar las frecuencias operativas: un controlador simple y un ancho de banda bajo a menudo se convierten en un cuello de botella de GPU integradas. Entonces, si sus "Tanques" favoritos apenas se arrastran en los gráficos incorporados de una computadora vieja, usted sabe lo que puede hacer para mejorar la situación.

Corriente principal


Por extraño que parezca, los usuarios promedio se benefician más de tales mejoras. No, por supuesto, los overclockers, los profesionales y los jugadores con una billetera completa obtienen su 0.5% de rendimiento usando módulos extremos con frecuencias escandalosas, pero su participación en el mercado es pequeña.

¿Qué hay debajo del capó?


Los radiadores de aluminio blanco son fáciles de quitar. Paso cero: estamos conectados a tierra con la batería o algún otro contacto metálico con la tierra y dejamos que la estática se agote. ¿No queremos dar un accidente ridículo para matar un módulo de memoria?

Paso uno: calentamos el módulo de memoria con un secador de pelo o con cargas activas de lectura-escritura (en el segundo caso, debe apagar rápidamente la PC, apagar la alimentación y quitar la RAM mientras aún está caliente).



Paso dos: encuentre el lado sin una pegatina y levante suavemente el radiador con algo en el centro y alrededor de los bordes. Es posible utilizar una placa de circuito impreso como base para la palanca, pero con precaución. Elija cuidadosamente un punto de apoyo, trate de evitar la presión sobre elementos frágiles. Es mejor actuar según el principio de "lento pero seguro".

Paso tres: abra el radiador y desconecte las cerraduras. Aquí están, chips preciosos. Soldado por un lado. Fabricante - Micron, modelo de chip 6XA77 D9SRJ.



8 piezas de 1 GB cada una, el perfil de fábrica es 2400 MHz @ CL16.


Es cierto, no vale la pena quitar los distribuidores de calor en casa: romperá el sello y su garantía de 1 año llorará. Sí, y los radiadores nativos hacen un excelente trabajo de las funciones que se les asignan.

Intentemos medir el efecto del overclocking de la RAM usando el ejemplo del kit HyperX Fury HX426C16FW2K4 / 32. La decodificación del nombre nos da la siguiente información: HX4 - DDR4, 26 - frecuencia de fábrica 2666 MHz, retrasos C16 - CL16. Luego viene el código de color de los radiadores (en nuestro caso, blanco), y la descripción del kit K4 / 32 es un conjunto de 4 módulos con un volumen total de 32 GB. Es decir, ya es visible que la RAM está ligeramente overclockeada durante la producción: en lugar del estándar 2400, se cose el perfil de 2666 MHz con los mismos tiempos.



Además del placer estético de contemplar los cuatro "Blancanieves" en el caso de su PC, este conjunto está listo para ofrecer un peso de 32 gigabytes de memoria y está dirigido a usuarios de procesadores convencionales que realmente no se entregan al overclocking de la CPU. Los Intel modernos sin la letra K al final han perdido por completo todas las formas posibles de obtener un rendimiento gratuito, y prácticamente no reciben ningún bono de la memoria con una frecuencia superior a 2400 MHz.



Tomamos dos computadoras como bancos de prueba. Uno se basa en el Intel Core i7-6800K y la placa base ASUS X99 (representa una plataforma para entusiastas con un controlador de memoria de cuatro canales), el segundo con un Core i5-7600 en el interior (este se apagará el hardware principal con gráficos integrados y falta de overclocking). En el primero, comprobaremos el potencial de overclocking de la memoria, y en el segundo mediremos el rendimiento real en juegos y software de trabajo.

Potencial de overclocking


Con perfiles JEDEC estándar y la memoria XMP de fábrica tiene los siguientes modos de funcionamiento:
DDR4-2666 CL15-17-17 @ 1.2V
DDR4-2400 CL14-16-16 @ 1.2V
DDR4-2133 CL12-14-14 @ 1.2V

Es fácil notar que la configuración de tiempo para 2400 MHz hace que la memoria no sea tan receptiva como los perfiles de 2133 y 2666 MHz.
2133/12 = 177,75
2400/14 = 171,428
2666/15 = 177,7 (3)

Los intentos de iniciar la memoria a una frecuencia de 2900 MHz con retrasos crecientes a 16-17-18, 17-18-18, 17-19-19 e incluso con el aumento del voltaje a 1.3 voltios no funcionaron. Sin cargas serias, la computadora funciona, pero Photoshop, el archivador o el banco de pruebas escupen errores o vuelcan el sistema en BSOD. Parece que el potencial de frecuencia de los módulos se selecciona hasta el final, y lo único que nos queda es reducir el retraso.



El mejor resultado que se logró con un conjunto de prueba de 4 módulos: 2666 MHz con tiempos CL13-14-13. Esto aumentará significativamente la velocidad de acceso a datos aleatorios (2666/13 = 205.07) y debería mostrar una buena mejora en los resultados en el punto de referencia del juego. En el modo de doble canal, la memoria se acelera mejor: los especialistas de oclab lograron llevar un conjunto de dos módulos de 16 GB a una frecuencia de 3000 MHz @ CL14-15-15-28 con un aumento de voltaje de hasta 1.4 voltios, un excelente resultado.



Pruebas a gran escala


Para nuestro i5 con gráficos integrados, elegimos GTA V como punto de referencia. El juego no es joven, utiliza la API DirectX 11, que se conoce desde hace mucho tiempo y ha sido lamida perfectamente en los controladores Intel, le gusta consumir RAM y cargar el sistema de una vez en todos los frentes: GPU, CPU, Ram Lectura desde el disco. Clásico Junto con esto, GTA V usa el llamado "Representación retrasada", debido a que el tiempo de cálculo del cuadro depende menos de la complejidad de la escena, es decir, el procedimiento de prueba será más limpio y los resultados más claros.

Para el FPS promedio, tomamos los valores que se ajustan al curso normal del juego: el vuelo de un avión, viajar en la ciudad, la destrucción de los adversarios tienen un perfil de carga uniforme. Para tales escenas (descartando el 1% de los mejores y peores resultados de la matriz de datos) y obtenga el FPS promedio del juego.

Las reducciones se pueden determinar a partir de escenas con explosiones y efectos complejos (una cascada debajo de un puente, paisajes al atardecer) de manera similar.

Se producen atascos y frisos desagradables durante un cambio brusco del entorno (cambio de un caso de prueba a otro) incluso en un monstruoso GTX 1080Ti, intentaremos anotarlos, pero no los tomaremos en los resultados: no ocurre en el juego, y es más probable que sea el marco del punto de referencia mismo.

Configuración de soporte de demostración
CPU: Intel Core i5-7500 (4c4t @ 3.8 GHz)
GPU: Intel HD530
RAM: 32 GB HyperX Fury White (2133 MHz CL12, 2666 MHz CL15 y 2666 MHz CL13)
MB: ASUS B250M
SSD: Kingston A400 240 GB

Para comenzar, configuremos las frecuencias estándar del perfil XMP: 2666 MHz con tiempos 15-17-17. El punto de referencia incorporado de GTA V produce FPS idénticos y las mismas reducciones en configuraciones mínimas y medias en resolución de 720p: en la mayoría de las escenas, el contador fluctúa alrededor de 30–32, y en escenas pesadas y cuando cambia una ubicación a otra, FPS se hunde.



La razón es obvia: las capacidades de GPU son suficientes, pero las unidades de rasterización simplemente no tienen tiempo para recopilar y dibujar una mayor cantidad de fotogramas por segundo. Con configuraciones de gráficos "altas", los resultados se deterioran rápidamente: el juego comienza a descansar directamente en las capacidades informáticas modestas de los gráficos integrados.

2133 MHz CL12


La GPU no tiene su propia memoria y se ve obligada a extraer constantemente el sistema. El ancho de banda de DDR4 en modo de dos canales a una frecuencia de 2133 MHz será de 64 bits (8 bytes) × 2 133 000 000 MHz × 2 canales, aproximadamente 34 Gb / s, con pequeñas pérdidas (hasta 10%) de sobrecarga.

En comparación, el ancho de banda del subsistema de memoria de la tarjeta NVIDIA GTX 1030 discreta más modesta es de 48 Gb / s, mientras que la GTX 1050 Ti (que emite fácilmente GTA V 60 FPS con la configuración máxima en FullHD) ya es de 112 Gb / s.


En el fondo, puedes ver la misma cascada debajo del puente, drenando FPS en el punto de referencia del juego.

Los resultados de referencia se redujeron a 28 FPS en promedio, y se retrasaron al cambiar de lugar y las explosiones de sus reducciones sin estrés se convirtieron en microfreezes desagradables.

2666 MHz CL13


La disminución de los tiempos redujo significativamente el tiempo de espera para una respuesta de la memoria, y ya tenemos resultados estándar con esta frecuencia: podemos comparar tres puntos de referencia y obtener una imagen clara. El ancho de banda para 2666 MHz ya es de 21.3 Gb / s × 2 canales ~ 40 Gb / s, comparable al NVIDIA más joven.



El FPS máximo prácticamente no aumentó (0.1 no es un indicador y está al borde del error de medición); aquí todavía descansamos en las capacidades modestas de los ROP, pero todas las reducciones se hicieron menos notables. En escenas con una cascada, debido a la alta carga computacional, el resultado no cambió, en todo lo demás, es decir, en descargas, explosiones y otras alegrías que desaceleraron el núcleo del video, creció en un promedio de 10-15%. En lugar de 25 a 27 cuadros en episodios cargados de eventos, confía en 28 a 29. En general, el juego comenzó a sentirse mucho más cómodo.

TL; DR y resultados


No puede evaluar la velocidad de la RAM en una sola frecuencia. DDR4 tiene retrasos de reloj bastante grandes, y si todo lo demás es igual, vale la pena elegir una memoria que no solo satisfaga las necesidades de su hardware en frecuencia y volumen de operación, sino que también preste atención a este parámetro.



Las pruebas mostraron que las computadoras basadas en la serie Intel Core i con gráficos integrados reciben un notable aumento de rendimiento cuando se utiliza memoria de alta velocidad con baja latencia. El núcleo de video no tiene sus propios recursos para almacenar y procesar datos y utiliza los del sistema para responder perfectamente (hasta cierto límite) a frecuencias crecientes y tiempos decrecientes, ya que el tiempo de renderizar un cuadro con muchos objetos depende directamente de la velocidad de acceso a la memoria.

Lo mas importante! La línea Fury está disponible en varios colores: blanco, rojo y negro: puede elegir no solo la memoria rápida, sino también adaptarse al resto de los componentes con estilo, como hacen los expertos de HyperPC .



La ley de Kirchhoff y un poco de magia escolar hacen posible decir que la memoria con radiadores negros será algo más fría en el trabajo que otras opciones. Bueno, para aquellos que no creen en la física sagrada, hay una prueba maravillosa en el canal educativo MEPhI.

Si todo está claro con las soluciones convencionales, en el segmento de gama alta, donde cada ingeniero de sistemas es una pequeña obra de arte, usar memoria y unidades HyperX de líneas de productos normales es una marca de calidad. Al crear cada proyecto personalizado, se deben tener en cuenta muchos factores: cargas térmicas, los deseos de un cliente caprichoso, distribución de aire, problemas acústicos (una computadora poderosa y una computadora poderosa y silenciosa son tareas que difieren en complejidad en un orden de magnitud). HyperPC mejora constantemente sus procesos y se mantiene fiel a los componentes confiables, de ahí los excelentes resultados en sus ensamblajes únicos. Pero si prefiere computadoras listas para usar, autoevaluadas, entonces se puede comprar un kit similar o módulos DDR4 HyperX Fury individuales en la red Yulmart .

Eso es todo, pero no nos despedimos. Verano fresco: temas candentes, suscríbase a nuestro blog y todas las cosas interesantes no pasarán.



1 - Debido a las peculiaridades de la legislación rusa, una garantía de "vida" será válida por solo 10 años a partir de la fecha de compra. Sin embargo, en términos de hardware informático con el ritmo actual de desarrollo tecnológico y 10 años, el período no es corto y allí la legislación puede cambiar.

Source: https://habr.com/ru/post/es404701/


All Articles