Computación de alto rendimiento X86 para la era de la tecnología de presencia
Búsqueda, aprendizaje automático, análisis de datos, creación y entrega de contenido, realidad aumentada y virtual, juegos de computadora: la lista de tareas intensivas en recursos para sistemas informáticos se expande cada día. Cuando hablamos del lado tecnológico del problema, discutimos dos temas.
La primera es la necesidad cada vez mayor de aumentar el rendimiento informático. Independientemente de lo que ofrezca la industria de semiconductores, los usuarios finales se adaptan rápidamente a los nuevos productos y nuevamente piden más.El segundo es, por supuesto, los cambios del mercado. He trabajado en este campo durante más de 30 años, y en el último tiempo se han producido una gran cantidad de cambios. Veamos solo un ejemplo: el advenimiento de la World Wide Web y una interfaz gráfica de usuario convirtió a las PC de una herramienta de procesamiento de texto en un portal real de acceso a todo el mundo, que cambió radicalmente la vida de las personas. Como resultado, pudimos encontrar y compartir información con tanta facilidad que antes parecía inaccesible. Además, los dispositivos se volvieron portátiles y obtuvieron una conexión permanente a la red, al principio fueron computadoras portátiles y luego teléfonos inteligentes y tabletas. Pronto hubo una explosión real en la popularidad de las aplicaciones, y la gran cantidad de datos que debían almacenarse, procesarse y analizarse requería aún más rendimiento computacional.Hace cuatro años, AMD comenzó a renovar su arquitectura de núcleo x86 de alto rendimiento para satisfacer estas necesidades crecientes. Nuestra familia de procesadores anterior ha mostrado un éxito significativo en el campo de la eficiencia energética, pero estos chips no estaban listos para proporcionar el nivel necesario para soportar aplicaciones de rendimiento exigentes. En base a esta tarea, creamos un diseño de núcleo con nombre en código "Zen" literalmente desde cero.
Al diseñar Zen, queríamos desarrollar un núcleo nuevo y moderno en todos los sentidos. La arquitectura se ha optimizado para lograr un mayor rendimiento, rendimiento y eficiencia energética para que los procesadores puedan hacer frente a las aplicaciones más exigentes. Como resultado, Zen resultó ser una solución mucho más productiva, marcando el regreso de AMD al mercado de sistemas de alto rendimiento, mostrando la ejecución de 40% más de instrucciones por ciclo sin aumentar el consumo de energía 1. Este ambicioso objetivo fue logrado por nosotros a través de un énfasis centrado en el rendimiento y el consumo de energía. La microarquitectura recientemente desarrollada incluye cambios significativos en el campo del procesamiento de instrucciones, los esquemas de operación de los módulos ejecutivos y el subsistema de caché para acelerar la ejecución de tareas y su trabajo paralelo. Como mostramos en la Conferencia de Hot Chips de la Universidad de Stanford 2016, Zen presenta una predicción de rama mejorada, elige las instrucciones correctas y funciona con la memoria caché microoperativa para seguir mejor estas instrucciones. Además, la nueva arquitectura admite un 75% más de profundidad de planificación al aumentar el número de instrucciones, y también ejecuta más instrucciones en paralelo, gracias a un aumento en el ancho de instrucción en un 50% en comparación con la generación anterior de núcleos. Esta combinación proporciona un gran aumento en la potencia de procesamiento por ciclo.Pero si tiene un motor potente, necesita repostarlo. Condicionalmente llamamos a este proceso "alimentar a la bestia". Y en nuestro caso, el combustible son datos e instrucciones recibidas de la memoria. Rediseñamos la jerarquía de caché, proporcionando al chip un caché L3 de 8 MB, un caché L2 compartido para instrucciones y datos, así como volúmenes de caché separados con baja latencia para comandos y datos. Un solo núcleo ahora puede trabajar con el caché cinco veces más rápido que en la arquitectura anterior.
Zen Pre-fetcher de Kernel juega un papel fundamental en el ancho de banda y representa uno de los flujos de trabajo más sofisticados diseñados para procesadores. Pre-fetcher asume y determina qué instrucción se necesitará en la siguiente medida, en función de los datos sobre la tarea actual. Qué tan bien implemente su plan y qué tan rápido pueda corregir los errores no es solo una cuestión de ciencia, sino también de arte, y en el caso del Zen, hemos logrado resultados impresionantes en este aspecto.El aumento significativo en el ancho de banda en Zen en comparación con la generación anterior de procesadores se debe a la transición a la arquitectura de subprocesamiento múltiple en paralelo (SMT). Este enfoque permite que el núcleo rastree las tareas dentro del programa, y cuando la tarea está en pausa, esperando que se ejecute otro comando o se reciban datos, se toma otra tarea para el procesamiento, que no está en modo de espera. Por lo tanto, desde el punto de vista del software, obtenemos recursos de procesador adicionales cuando el modo SMT está activado.Finalmente, en mejorar la eficiencia energética. La CPU Zen ha sido diseñada para su uso en una variedad de dispositivos, desde computadoras portátiles enfriadas pasivamente hasta supercomputadoras, y todas ellas requieren una alta eficiencia energética. En un mundo donde un aumento del 10% en la productividad se considera significativo, nuestro objetivo de un aumento del 40% en la productividad sin un aumento adicional en la potencia parecía imposible a primera vista. Sin embargo, los ingenieros de AMD se centraron en la tarea y encontraron nuevas formas de reducir el consumo de energía y optimizar la microarquitectura, y también aplicaron un esquema de control de frecuencia de reloj más avanzado.El deseo de mejorar la eficiencia energética se incorporó al producto desde el principio: al crear un nuevo diseño, los ingenieros intentaron salvar cada microvatio y cada circuito se optimizó en términos de potencia. Como resultado, incluso si una pequeña parte del procesador no participa en el trabajo activo, se apaga por completo para evitar un consumo excesivo de energía, pero cuando acelera la frecuencia del reloj y aumenta la carga, el procesador demuestra un rendimiento muy alto por vatio. Además, Zen se fabrica utilizando la nueva tecnología de proceso FinFET de 14 nm. Los transistores FinFET son más pequeños, más económicos y más eficientes que sus homólogos de la generación anterior. Esta solución ganadora de nuestro socio industrial nos permitió lograr el máximo efecto en la implementación de la nueva microarquitectura de núcleos informáticos.Y las posibilidades de modificaciones a los transistores FinFET le permiten crear una amplia gama de soluciones: desde baja potencia con bajo consumo, hasta chips para grandes cargas con mayor frecuencia y rendimiento.Los resultados traerán todas estas innovaciones al final, quedará claro el próximo año, cuando los primeros productos con procesadores basados en núcleos Zen aparecerán en el mercado, pero hoy podemos decir que las pruebas de laboratorio nos impresionan. Recientemente presentamos el procesador de escritorio Summit Ridge de 8 núcleos / 16 hilos y el procesador de servidor Naples de 32 núcleos / 64 hilos. Ambos procesadores con núcleos Zen nos permiten ser muy optimistas sobre el futuro. También es importante comprender que Zen es solo un paso intermedio hacia el futuro de la informática de alto rendimiento AMD x86. Nuestro plan de desarrollo incluye generaciones posteriores de chips con mejoras adicionales, y nuestros equipos ya están trabajando en nuevos proyectos hoy,porque los cambios constantes y una tendencia al alza en la productividad continúan marcando el ritmo del desarrollo de la industria., - AMD
Zen x86 «Excavator» x86. Source: https://habr.com/ru/post/es399941/
All Articles