Intel construye el sistema neuromórfico más grande del mundo para posibilitar una IA más sostenible

Hala Point, el primer sistema neuromórfico de 1.150 millones de neuronas de la industria, construye un camino hacia una IA más eficiente y escalable.

Noticias

  • 17 de abril de 2024

  • Contacta al equipo PR de Intel

  • Siga las noticias de Intel en las redes sociales:

    Logotipo de Twitter
    Icono de YouTube

author-image

Por

Novedades: Intel anunció hoy que ha construido el sistema neuromórfico más grande del mundo. Con nombre en código Hala Point, este sistema a gran escala, implementado inicialmente en Sandia National Laboratories, utiliza el procesador Loihi 2 de Intel, tiene como objetivo apoyar la investigación para la futura inteligencia artificial (IA) inspirada en el cerebro y aborda los desafíos relacionados con la eficiencia y la sostenibilidad de la IA actual. Este hará avanzar el sistema de investigación a gran escala de primera generación de Intel, Pohoiki Springs, con mejoras arquitectónicas para lograr más de 10 veces más capacidad neuronal y hasta 12 veces más desempeño.

"El costo informático de los modelos de IA actuales está aumentando a tasas insostenibles. Fundamentalmente, la industria necesita enfoques nuevos capaces de escalar. Por esa razón, desarrollamos Hala Point, que combina la eficiencia del aprendizaje profundo con nuevas capacidades de aprendizaje y optimización inspiradas en el cerebro. Esperamos que la investigación con Hala Point avance en la eficiencia y adaptabilidad de la tecnología de IA a gran escala".

–Mike Davies, director de Neuromorphic Computing Lab en Intel Labs

Qué hace: Hala Point es el primer sistema neuromórfico a gran escala que demuestra eficiencias computacionales de vanguardia en cargas de trabajo de IA convencionales. La caracterización muestra que puede soportar hasta 20 cuatrillones de operaciones por segundo, o 20 petaops, con una eficiencia superior a 15 billones de operaciones de 8 bits por segundo por vatio (TOPS/W) cuando se ejecutan redes neuronales profundas convencionales. Esto rivaliza y supera los niveles alcanzados por las arquitecturas construidas sobre unidades de procesamiento gráfico (GPU) y unidades de procesamiento central (CPU). Las capacidades únicas de este sistema podrían permitir el aprendizaje continuo en tiempo real futuro para aplicaciones de IA como resolución de problemas científicos y de ingeniería, logística, gestión de infraestructura de ciudades inteligentes, modelos de lenguaje grandes (LLM) y agentes de inteligencia artificial.

Cómo se utilizará: Los investigadores de Sandia National Laboratories planean usar Hala Point para la investigación avanzada de computación a escala cerebral. La organización se centrará en resolver problemas informáticos científicos en física de dispositivos, arquitectura de computadoras, ciencias de la computación e informática.

"Trabajar con Hala Point mejora la capacidad del equipo de Sandia para resolver problemas de modelado computacional y científico. Realizar investigaciones con un sistema de este tamaño nos permitirá seguir el ritmo de la evolución de la IA en campos que van desde el comercial hasta la defensa y la ciencia básica", dijo Craig Vineyard, líder del equipo de Hala Point en Sandia National Laboratories.

Actualmente, Hala Point es un prototipo de investigación que avanzará en las capacidades de los futuros sistemas comerciales. Intel anticipa que tales lecciones conducirán a avances prácticos, como la capacidad de los LLM para aprender continuamente de los nuevos datos. Estos avances prometen reducir significativamente la carga de capacitación no sostenible de las implementaciones generalizadas de IA.

Por qué es importante:Las tendenciasrecientes en la ampliación de los modelos de aprendizaje profundo a billones de parámetros han expuesto enormes desafíos de sostenibilidad en la IA y han resaltado la necesidad de innovación en los niveles más bajos de la arquitectura de hardware. La computación neuromórfica es un enfoque fundamentalmente nuevo que se basa en conocimientos de neurociencia que integran memoria y computación con un paralelismo altamente granular para minimizar el movimiento de datos. En los resultados publicados de la International Conference on Acoustics, Speech, and Signal Processing (ICASSP) de este mes, Loihi 2 demostró aumentos de órdenes de magnitud en la eficiencia, velocidad y adaptabilidad de las cargas de trabajo emergentes de edge a pequeña escala1.

Avanzando sobre su predecesor, Pohoiki Springs, con numerosas mejoras, Hala Point ahora aporta rendimiento neuromórfico y ganancias de eficiencia a los modelos convencionales de aprendizaje profundo, especialmente aquellos que procesan cargas de trabajo en tiempo real como video, voz y comunicaciones inalámbricas. Por ejemplo, Ericsson Research está aplicando Loihi 2 para optimizar la eficiencia de la infraestructura de telecomunicaciones, como destacó en el Mobile World Congress de este año.

Acerca de Hala Point: Loihi 2 procesadores neuromórficos, que forman la base de Hala Point, aplican principios de computación inspirados en el cerebro, como redes neuronales de picos (SNN) asíncronas basadas en eventos, memoria y computación integradas, y conexiones dispersas y continuamente cambiantes para lograr ganancias de órdenes de magnitud en el consumo de energía y el rendimiento. Las neuronas se comunican directamente entre sí en lugar de comunicarse a través de la memoria, lo que reduce el consumo general de energía.

Hala Point incluye 11152 Loihi 2 procesadores producidos en el nodo de proceso Intel 4 en un chasis de centro de datos de seis unidades de bastidor del tamaño de un horno de microondas. El sistema admite hasta 1.150 millones de neuronas y 128.000 millones de sinapsis distribuidas en 140.544 núcleos de procesamiento neuromórfico, consumiendo un máximo de 2.600 vatios de potencia. También incluye más de 2.300 procesadores x86 integrados para cálculos auxiliares.

Hala Point integra canales de procesamiento, memoria y comunicación en un tejido masivamente paralelizado, lo que proporciona un total de 16 petabytes por segundo (PB/s) de ancho de banda de memoria, 3,5 PB/s de ancho de banda de comunicación entre núcleos y 5 terabytes por segundo (TB/s) de ancho de banda de comunicación entre chips. El sistema puede procesar más de 380 billones de sinapsis de 8 bits y más de 240 billones de operaciones neuronales por segundo.

Aplicado a modelos de redes neuronales bioinspiradas, el sistema puede ejecutar su capacidad total de 1.150 millones de neuronas 20 veces más rápido que un cerebro humano y velocidades hasta 200 veces más rápidas a una capacidad menor. Si bien Hala Point no está destinado al modelado de la neurociencia, su capacidad neuronal es aproximadamente equivalente a la de un cerebro de búho o la corteza de un mono capuchino.

Los sistemas basados en Loihi pueden realizar inferencia de IA y resolver problemas de optimización utilizando 100 veces menos energía a velocidades hasta 50 veces más rápidas que las arquitecturas convencionales de CPU y GPU1. Al explotar la conectividad dispersa de hasta 10:1 y la actividad impulsada por eventos, los primeros resultados en Hala Point muestran que el sistema puede lograr eficiencias profundas en las redes neuronales de hasta 15 TOPS/W2 sin necesidad de recopilar datos de entrada en lotes, una optimización común para las GPU que retrasa significativamente el procesamiento de los datos que llegan en tiempo real, como el video de las cámaras. Mientras aún están en investigación, los futuros LLM neuromórficos capaces de aprendizaje continuo podrían resultar en gigavatios-hora de ahorro de energía al eliminar la necesidad de volver a entrenar periódicamente con conjuntos de datos cada vez mayores.

Lo que sigue: La entrega de Hala Point a Sandia National Labs marca el primer despliegue de una nueva familia de sistemas de investigación neuromórfica a gran escala que Intel planea compartir con sus colaboradores de investigación. Un mayor desarrollo permitirá que las aplicaciones de computación neuromórfica superen las restricciones de potencia y latencia que limitan el despliegue en tiempo real de las capacidades de IA en el mundo real.

Junto con un ecosistema de más de 200 miembros de Intel Neuromorphic Research Community (INRC), entre ellos grupos académicos líderes, laboratorios gubernamentales, instituciones de investigación y empresas de todo el mundo, Intel está trabajando para ampliar los límites de la IA inspirada en el cerebro y hacer progresar esta tecnología desde prototipos de investigación hasta productos comerciales líderes en la industria en los próximos años.

Más contexto: Intel Labs

Detalle:

1 Consulte "Efficient Video and Audio Processing with Loihi 2", Conferencia internacional sobre acústica, voz y procesamiento de señales, abril de 2024, y "Advancing Neuromorphic Computing with Loihi: Survey of Results and Outlook", Actas del IEEE, 2021.

2 Caracterización realizada con una red de perceptrón multicapa (MLP) con 14.784 capas, 2048 neuronas por capa, pesos de 8 bits estimulados con ruido aleatorio. La implementación Hala Point de la red MLP se reduce a una dispersión de 10: 1 con modelos de neuronas sigma-delta que proporcionan tasas de activación del 10 por ciento. Resultados a partir de las pruebas en abril de 2024. Los resultados pueden variar.