El último procesador Eyeriss de 168 núcleos: una red neuronal en nuestro teléfono inteligente
¡Bienvenido a nuestros lectores en las páginas del blog iCover ! En la Conferencia Internacional de Circuitos de Estado Sólido (ISSCC-2016) celebrada a principios de febrero en San Francisco, un equipo de desarrolladores del MIT (Instituto de Tecnología de Massachusetts) demostró un prototipo funcional de un chip Eyeriss de nueva generación, que fue creado como una solución conceptual que le permite recrear las capacidades de los algoritmos de red neuronal en una amplia gama de dispositivos de baja potencia.
Una de las razones objetivas por las que las redes neuronales artificiales no se han desarrollado adecuadamente en nuestros teléfonos inteligentes o tabletas es la falta de una fuente de alimentación compacta de suficiente potencia. De hecho, los llamados sistemas de inteligencia artificial tipo cerebro, tipo cerebro, al menos en la forma en que están representados por las tecnologías modernas, dependen en su trabajo de potentes procesadores multinúcleo que consumen una increíble cantidad de energía en comparación con nuestro cerebro. En cualquier caso, hasta hace poco, no era posible imaginar tales soluciones a nivel de dispositivos de clase de usuario. Al mismo tiempo, la idea de "miniaturización" de la inteligencia artificial excita las mentes de los desarrolladores durante mucho tiempo y, como resultado, ya trae resultados bastante tangibles.Las redes neuronales han sido el foco de atención de los científicos desde los primeros días del estudio de la inteligencia artificial, pero en la década de 1970, fueron algo olvidadas. En la última década, las tecnologías relacionadas con el uso de las capacidades de las redes neuronales se están estudiando a nivel de programas de "aprendizaje profundo"."El aprendizaje profundo tiene muchos usos, como el reconocimiento de objetos, discurso o rostro", dijeron Vivienne Sze y Emanuel E. Landsman, profesor asociado del Instituto de Ingeniería Eléctrica e Informática de Massachusetts, cuyo grupo desarrolló Nuevo chip. “Ahora, las redes neuronales son bastante complejas y funcionan principalmente en chips potentes. Imagine que puede transferir esta funcionalidad a su teléfono móvil o dispositivo incorporado y luego procesar grandes cantidades de información sin usar una conexión Wi-Fi. El procesamiento de grandes cantidades de datos en su teléfono inteligente le permitirá evitar el retraso derivado del intercambio de datos con la red, lo que, a su vez, permitirá que muchas aplicaciones funcionen de manera mucho más eficiente. Y ademasla solución propuesta garantizará una nueva calidad de protección de la información confidencial ".Las redes neuronales, como regla, se implementan sobre la base de procesadores gráficos de múltiples núcleos (GPU). En una conferencia internacional en San Francisco, los investigadores del MIT presentaron un nuevo chip de 168 núcleos diseñado para implementar algoritmos de inteligencia artificial basados en redes neuronales. En comparación con una GPU móvil (no se indica, en comparación con cuál), el procesador ha demostrado una eficiencia 10 veces mayor, lo que le permite usar un dispositivo móvil personalizado para ejecutar localmente algoritmos de inteligencia artificial potentes sin la necesidad de enviar datos para el procesamiento en la nube. Los aspectos más destacados del desarrollo se reflejan en el comunicado de prensa del MIT del 3 de febrero de 2016.El nuevo chip, nombrado por los desarrolladores de Eyeriss, puede ser ampliamente utilizado en Internet de las cosas, dispositivos electrónicos portátiles, vehículos autónomos, equipos de fabricación e incluso en la agricultura, ayudando a resolver y coordinar las tareas actuales. Con algoritmos de inteligencia artificial a bordo, los dispositivos móviles podrán tomar decisiones a nivel local, proporcionando al usuario un resultado listo como guía de acción, en lugar de un conjunto de datos sin procesar de Internet. Y, por supuesto, una de las aplicaciones de las redes neuronales locales es su uso en la creación de robots autónomos para diversos fines.Divide y vencerás
Las redes neuronales, como regla, tienen una estructura multicapa y cada capa contiene una gran cantidad de nodos de procesamiento. En la etapa inicial de procesamiento, los datos llegan y se distribuyen entre los nodos de la capa inferior. Después de procesar los datos recibidos por cada uno de los nodos, el resultado se transmite para su procesamiento a los nodos de la siguiente capa. En la salida de la última capa, se forma el resultado de resolver el problema. En consecuencia, para resolver problemas a gran escala utilizando el algoritmo descrito, se requerirán recursos informáticos significativos.Los requisitos inicialmente presentados al chip por los propios desarrolladores los pusieron en un marco bastante estricto: por un lado, la solución debería ser energéticamente eficiente, por otro, debería funcionar con simples bloques de información. Finalmente, el chip debe tener la capacidad de simular varios tipos de redes neuronales, teniendo en cuenta los desafíos actuales. Todos estos requisitos se han implementado con éxito en el procesador Eyeriss.El chip desarrollado en el laboratorio del MIT es una red neuronal ya formada, localizada al nivel de un procesador de 168 núcleos, que en el futuro puede integrarse en dispositivos móviles.La clave para la eficiencia de Eyeriss es minimizar la frecuencia del intercambio de datos entre núcleos y bancos de memoria externos, una operación asociada con un alto consumo de energía y costos de tiempo. Si bien los núcleos de las GPU tradicionales están vinculados a un banco de memoria común, cada núcleo Eyeriss tiene su propia memoria. Además, los datos se someten a un procedimiento de compresión antes del mandril a los núcleos vecinos.Otra ventaja del algoritmo implementado es la capacidad de los núcleos para "comunicarse" entre sí directamente, sin pasar por el "intermediario" en forma de un bus de memoria del sistema. Esta es una característica crítica para simular la red neuronal convolucional (CNN). Todo el trabajo computacional necesario para el reconocimiento de patrones y de voz se realiza localmente en Eyeriss, sin la necesidad de acceder a los recursos de la red, lo que permite garantizar el funcionamiento efectivo del dispositivo incluso en ausencia de una red externa.Finalmente, otra ventaja de Eyeriss es el principio de distribución "inteligente" de tareas informáticas individuales entre núcleos en el marco de un único problema solucionable. En su memoria local, el núcleo debe almacenar no solo los datos procesados por los nodos, sino también los datos que describen los propios nodos. Para garantizar el máximo rendimiento del proceso de procesamiento de datos, así como para cargar a Eyeriss con la cantidad máxima de datos de la memoria principal, el algoritmo de distribución de datos de ambos tipos está optimizado por un chip en tiempo real especialmente diseñado para este propósito, teniendo en cuenta las características de la red neuronal actual.En la Conferencia Internacional de Circuitos de Estado Sólido en San Francisco, el equipo de desarrollo, utilizando las capacidades del chip Eyeriss a nivel de usuario, demostró la implementación del algoritmo de reconocimiento de patrones dentro de la red neuronal local. Una tarea similar, señalada en un comunicado de prensa, se implementó anteriormente, pero a nivel de proyectos gubernamentales de la más moderna de las redes neuronales creadas."Este trabajo es muy importante porque demuestra cuán eficientemente los procesadores integrados para el estudio en profundidad pueden proporcionar la potencia requerida y el rendimiento de optimización y llevar procesos informáticos complejos desde la nube a los dispositivos móviles", dice Mike Polly, vicepresidente senior del laboratorio de procesadores móviles Innovation Lab de Samsung. y agrega: “Además de una innovadora gama de soluciones de hardware, un estudio realizado por especialistas del MIT demuestra claramente cómo el núcleo integrado puede ser útil para el desarrollo gestor de aplicaciones que utilizan una arquitectura de red estándar y AlexNet Caffe ».La financiación del proyecto Eyeriss, comenzando con la creación de una unidad basada en el laboratorio del MIT, fue parcialmente financiada por el departamento de defensa de EE. UU. DARPA. No es sorprendente que el primero en responder al anuncio del procesador con material editorial impresionante fue el famoso analista militar Patrick Tucker. Según él, los nuevos procesadores Eyeriss instalados en dispositivos móviles de soldados estadounidenses podrán resolver los problemas informáticos más complejos asociados con el procesamiento de grandes cantidades de información sin conectarse a una red común.Entonces, en la actualidad, la Fuerza Aérea de los EE. UU. Recibe hasta 1,500 horas de video HD y hasta 1,500 fotos de ultra alta resolución de drones que se ciernen sobre Afganistán. Además, todo este flujo interminable de información debe ser analizado visualmente por los operadores a la antigua usanza, ya que el software de computadora existente no puede distinguir a un campesino que pasea un palo por un sendero de montaña de un terrorista con un lanzador de misiles guiados. Para resolver tales problemas, inicialmente se crearon métodos de aprendizaje automático basados en capacitación representativa.Los procesadores Eyeriss son ideales para la instalación en drones militares no tripulados, ya que permitirán el procesamiento inteligente de una variedad de imágenes y videos utilizando la tecnología de "entrenamiento profundo" directamente a bordo del avión. Al mismo tiempo, los datos útiles seleccionados podrían enviarse directamente a las unidades de combate que operan en la región especificada, sin pasar por el centro para el análisis de la información operativa.Resumen breveDurante los experimentos, el chip Eyeriss demostró un nivel de eficiencia energética diez veces mayor que el de los chips gráficos móviles modernos. Al mismo tiempo, con su ayuda resulta tecnológicamente posible garantizar el funcionamiento de algoritmos de inteligencia artificial en dispositivos con tamaños compactos, desde teléfonos inteligentes y tabletas, hasta dispositivos electrónicos portátiles. Los retrasos creados por las redes durante el intercambio de datos para un procesador de este tipo se minimizan, ya que la mayoría de los cálculos pueden realizarse localmente por el chip. Sobre la base de Eyeriss, será posible crear no solo todo tipo de "dispositivos inteligentes", sino también robots con cierto grado de independencia en la toma de decisiones.Los desarrolladores del MIT aún no han nombrado intervalos de tiempo específicos durante los cuales Eyeriss podrá transformarse en un producto comercial y en todo su poder para revelar sus capacidades a nivel del consumidor. La participación en el desarrollo de los principales expertos de NVIDIA y el gran interés de los investigadores responsables de Samsung están inspirando optimismo.Fuente
Estimados lectores, siempre estamos felices de conocerte y esperarte en las páginas de nuestro blog. Estamos listos para continuar compartiendo con usted las últimas noticias, materiales de revisión y otras publicaciones, e intentaremos hacer todo lo posible para que el tiempo que pasa con nosotros sea útil para usted. Y, por supuesto, no olvides suscribirte a nuestras columnas . Nuestros otros artículos y eventos.
Source: https://habr.com/ru/post/es390627/
All Articles