¿Por qué necesitamos un sistema de monitoreo en un chip?

La startup británica UltraSoC introdujo la tecnología en chip para rastrear el rendimiento del chip sin sacrificar el rendimiento. Te contamos cómo funciona la solución.


/ foto 83DegreesMedia CC BY

¿Por qué implementar sistemas de monitoreo en un chip?


Los dispositivos heterogéneos se construyen a partir de varios bloques. Pueden ser procesadores, coprocesadores o circuitos integrados ASIC. La especialización de los módulos informáticos mejora el rendimiento de todo el sistema, pero la "composición multicomponente" genera dificultades con la optimización: cada unidad de hardware requiere ajuste.

El problema se agrava si los chips son utilizados por un gran centro de datos. Monitorear la gran infraestructura no es una tarea fácil. Las soluciones de software especializadas a menudo dañan la eficiencia de los sistemas informáticos. Por ejemplo, la utilidad para medir el ancho de banda del canal iPerf reduce el rendimiento de la red en un 10-15%.

Para resolver este problema, UltraSoC implementó herramientas de monitoreo directamente en el chip. La compañía ha desarrollado una serie de módulos semiconductores lógicos, cada uno de los cuales es responsable de una de las tareas: monitoreo, depuración, seguridad. Los fabricantes de chips pueden usar estos módulos y colocarlos en el mismo circuito con procesadores, GPU e interfaces de red. Esto le permite recopilar datos de todos los componentes del chip "en su lugar" sin soluciones de software invasivas. Esta tecnología ya se ha adaptado para trabajar con arquitecturas estándar: desde ARM y RISC-V hasta MIPS y Xtensa.

Dispositivo del sistema


UltraSoC ofrece una treintena de módulos que pueden ensamblarse según las características de un sistema particular en un chip (SoC). Los módulos se dividen en tres clases:

  1. Bloques de análisis: controle y monitoree los componentes del chip;
  2. Bloques de mensajería: conecte los módulos UltraSoC entre sí;
  3. Comunicadores: interfaces para la comunicación con sistemas externos y componentes internos.

Por ejemplo, para microprocesadores basados ​​en la arquitectura RISC-V, todo el sistema puede verse así:



Los datos obtenidos sobre el estado de los componentes del chip se pueden mostrar a través de varias interfaces: USB, Ethernet, PCI-Express e incluso Wi-Fi. Después, esta información puede descargarse en cualquier sistema analítico para buscar anomalías en el funcionamiento de los componentes.

Potencial y desventajas de la solución.


Los desarrolladores de UltraSoC dicen que su sistema encontrará aplicaciones en centros de datos y ayudará a los proveedores de la nube a monitorear la infraestructura de la nube a gran escala. Dado que los parámetros del sistema en un chip se controlan utilizando hardware que (a diferencia del software) no afecta el rendimiento, los operadores del centro de datos podrán recibir datos actualizados del estado del servidor en tiempo real.

Debido al hecho de que la tecnología evalúa el trabajo de los componentes de bajo nivel directamente, ayudará a determinar rápidamente la causa de los llamados heisenbags : "errores flotantes" que son difíciles de detectar debido al hecho de que cambian regularmente las propiedades.

Pero antes de que la tecnología pueda ser ampliamente utilizada, el equipo de UltraSoC tendrá que convencer a los fabricantes para que integren la solución en sus chips. Su implementación complicará los procesos comerciales, conducirá a mayores costos de producción y a un aumento en el precio de los microcircuitos. Por lo tanto, muchas compañías pueden negarse, citando el hecho de que será más barato para los clientes usar software de monitoreo de terceros por su cuenta.

Pero varios fabricantes todavía quieren probar el producto. Por ejemplo, Esperanto tiene la intención de implementar la tecnología UltraSoC en miles de procesadores basados ​​en RISC-V y aceleradores AI / ML para rastrear su rendimiento.

Desarrollos alternativos


Otras organizaciones también están desarrollando sistemas en chip. En particular, sensores especiales para monitorear voltaje y temperatura (PVT - Proceso, Voltaje, Temperatura). Son tierra para trabajar en sistemas en un chip y ASIC. A principios del año pasado, Moortec contó con el apoyo del fabricante de chips TSMC e implementó su tecnología en chips de 12 nm. La compañía confía en que los procesadores con sistemas de monitoreo integrados encontrarán aplicaciones en centros de datos, dispositivos móviles, sistemas de IA, IoT, etc.

Otro proyecto, los sensores PVT "inteligentes", fue el resultado del trabajo conjunto de las empresas. La combinación de los sistemas de monitoreo y análisis digital UltraSoC y los sensores físicos Moortec le permite monitorear exhaustivamente el estado de SoC y optimizar la carga en tiempo real.

Lo que le espera a la tecnología en el futuro


Los desarrolladores de UltraSoC creen que la creciente popularidad de las soluciones de alta tecnología (AI, ML, IoT), así como la transición a sistemas heterogéneos, harán que las herramientas de monitoreo integradas sean indispensables.

La compañía planea hacer que la arquitectura de la solución sea más flexible y personalizable. Para hacer esto, UltraSoC comenzó a desarrollar UltraDevelop 2. Este es un entorno de desarrollo integrado (IDE), con el que puede configurar, depurar y optimizar los parámetros de los componentes del chip. Su lanzamiento está programado para el segundo trimestre de 2019.



Sobre qué escribimos en un blog corporativo:


Varias publicaciones de nuestro canal de Telegram:

Source: https://habr.com/ru/post/442788/


All Articles