Nuevos procesadores ARM listos para aplicaciones de IA



British ARM Corporation ha mejorado la arquitectura informática heterogénea de ARM big.LITTLE , en la que se basan todos los microprocesadores ARM líderes basados ​​en Cortex-A7 (2011), y ayer presentó la nueva arquitectura heterogénea DynamIQ big.LITTLE . Se ha asignado un lugar en microchips para aceleradores de hardware especiales para aplicaciones de aprendizaje automático. Quizás en el futuro, el soporte de hardware para redes neuronales se convierta en una nueva tendencia entre los desarrolladores de microprocesadores y la calidad inherente de los nuevos teléfonos inteligentes.

La característica de arquitectura de ARM big.LITTLE es la presencia de dos tipos de núcleos de procesador: relativamente lentos, energéticamente eficientes (LITTLE) y relativamente potentes y glotones (big). Por lo general, un sistema activa solo uno de los dos tipos de núcleos: solo grande o solo pequeño. Está claro que las tareas en segundo plano en un teléfono inteligente u otro dispositivo son convenientes para resolver con núcleos pequeños que consumen muy poca energía. Si es necesario, el procesador activa potentes núcleos glotones, que en modo multihilo, trabajando juntos, demuestran un rendimiento particularmente alto. En principio, todos los núcleos tienen acceso a la memoria compartida, por lo que las tareas se pueden configurar para su ejecución en ambos tipos de núcleos al mismo tiempo. Es decir, grandes y pequeños se encenderán sobre la marcha.

Una arquitectura tan heterogénea y tareas de conmutación sobre la marcha de un tipo de núcleo a otro está concebida para crear cambios dinámicos en la potencia del procesador y el consumo de energía. El propio ARM declaró que en algunas tareas esa arquitectura ahorra hasta un 75% de energía.

DynamIQ big.LITTLE es un paso evolutivo hacia adelante. La nueva arquitectura le permite usar una variedad de combinaciones de núcleos grandes y pequeños que antes no eran posibles. Por ejemplo, 1 + 3, 2 + 4 o 1 + 7, o incluso 2 + 4 + 2 (núcleos de tres poderes diferentes). Un teléfono inteligente típico del futuro puede tener un sistema de ocho núcleos en un chip con dos núcleos potentes, cuatro núcleos medianos y dos de bajo rendimiento para el fondo.

Con soporte de hardware para aprendizaje automático e inteligencia artificial, los desarrolladores tendrán acceso a nuevas instrucciones especiales de procesador (por ejemplo, cálculos con precisión limitada). ARM promete que en los próximos tres a cinco años, los procesadores Cortex-A en la nueva arquitectura proporcionarán un aumento de hasta 50 veces en el rendimiento en aplicaciones de IA, en comparación con los sistemas actuales basados ​​en Cortex-A73 y un aumento adicional debido a los aceleradores integrados en el chip. El puerto de acceso dedicado de baja latencia entre la CPU y los aceleradores tiene un rendimiento 10 veces mayor.



Esto significa que las redes neuronales capacitadas funcionarán mucho mejor en los teléfonos inteligentes, incluidas las que calculan gráficos y video, aplicaciones de visión por computadora y otros sistemas que procesan grandes flujos de datos.

Cada grupo puede contener hasta ocho núcleos de diferentes características. Esto también se puede utilizar para acelerar las aplicaciones de inteligencia artificial en comparación con los sistemas actuales. Además, el subsistema de memoria rediseñado proporcionará un acceso más rápido a los datos y mejorará la eficiencia energética. Por cierto, no es necesario incluir núcleos LITTLE con bajo rendimiento en los grupos principales, que generalmente se usan en dispositivos móviles para ahorrar energía de la batería. Si necesita un rendimiento muy alto, independientemente del consumo de energía, nadie se molesta en hacer grupos de ocho núcleos grandes y combinarlos en sistemas informáticos especialmente potentes. ARM cree que esto ampliará el alcance de los procesadores ARM más allá de los teléfonos inteligentes.

Clústeres DynamIQ de escala casi ilimitada con memoria compartida: esta es una oferta para crear potentes sistemas informáticos para diversos fines.



La función de cambiar individualmente la frecuencia de reloj de procesadores individuales en un grupo de procesadores ARM múltiples proporcionará una flexibilidad adicional en el ajuste dinámico del consumo de energía / energía. Los desarrolladores de Cambridge creen que esto es especialmente importante en los cascos de realidad virtual, que durante largos períodos de tiempo se encuentran en un estado de bajo consumo de energía. Las transiciones del procesador a uno de los tres estados de energía (ON, OFF, SLEEP) se llevan a cabo mucho más rápido, automáticamente a nivel de hardware.

Al final, la arquitectura avanzada de DynamIQ le permite construir sistemas más confiables con duplicación de funciones, lo que aumenta el nivel de seguridad en sistemas independientes que necesitan responder a fallas. Por ejemplo, estos son sistemas de visión por computadora en vehículos no tripulados: Sistemas avanzados de asistencia al conductor (ADAS). Cuando un grupo de núcleos falla o el acelerador falla, el otro grupo automáticamente asume sus funciones.



La arquitectura del procesador ARM se usa bajo licencia en sus chips por muchos fabricantes, incluidos Samsung, Qualcomm, Nvidia, Intel y Apple (iPhone, iPad). Entre 2013 y 2017, se vendieron en el mundo más de 50 mil millones de microchips basados ​​en la arquitectura ARM, y los desarrolladores ingleses esperan que en los próximos cuatro años este número se duplique a más de 100 mil millones.

La mayoría de los dispositivos en procesadores ARM no necesitan enfriamiento activo. La compañía confía en que con el aumento de la potencia de estos sistemas y la transición a la arquitectura DynamIQ, todo seguirá igual.

Source: https://habr.com/ru/post/es402501/


All Articles