Sala de prensa de Intel

Habana Labs de Intel lanza procesadores de IA de segunda generación para capacitación e inferencia

El procesador Habana Gaudi2 demuestra un rendimiento dos veces mayor que la GPU A100 de Nvidia.

Una foto muestra la tarjeta Habana Gaudi2 Mezzanine. El 10 de mayo de 2022, Habana Labs, el equipo de centros de datos de Intel centrado en las tecnologías de procesadores de aprendizaje profundo de IA, lanzó sus procesadores de aprendizaje profundo de segunda generación para entrenamiento e inferencia: Habana Gaudi2 y Habana Greco. (Crédito: Intel Corporation)

Qué hay nuevo: Hoy en Intel Vision, Intel anunció que Habana Labs, su equipo de centros de datos centrado en tecnologías de procesadores de aprendizaje profundo de IA, lanzó sus procesadores de aprendizaje profundo de segunda generación para entrenamiento e inferencia: Habana® Gaudi2®y Habana® Greco™. Estos nuevos procesadores abordan una brecha en la industria al proporcionar a los clientes opciones de computación de aprendizaje profundo de alto rendimiento y alta eficiencia tanto para cargas de trabajo de capacitación como para implementaciones de inferencia en el centro de datos, al tiempo que reducen la barrera de entrada de IA para empresas de todos los tamaños.

"El lanzamiento de los nuevos procesadores de aprendizaje profundo de Habana es un excelente ejemplo de la ejecución de Intel en su estrategia de IA para ofrecer a los clientes una amplia gama de opciones de soluciones, desde la nube hasta el borde, abordando el creciente número y la naturaleza compleja de las cargas de trabajo de IA. Gaudi2 puede ayudar a los clientes de Intel a entrenar cargas de trabajo de aprendizaje profundo cada vez más grandes y complejas con velocidad y eficiencia, y estamos anticipando las eficiencias de inferencia que traerá Greco".

–Sandra Rivera, vicepresidenta ejecutiva de Intel y gerente general del Grupo de Centros de Datos e IA

Por qué es importante: Los nuevos procesadores Gaudi2 y Greco están diseñados específicamente para aplicaciones de aprendizaje profundo de IA, implementados en tecnología de 7 nanómetros y fabricados en la arquitectura de alta eficiencia de Habana. En Intel Vision, Habana Labs reveló el rendimiento de entrenamiento de Gaudi2 para el modelo de visión por computadora ResNet-50 y el modelo de procesamiento de lenguaje natural BERT ofrece el doble de rendimiento de entrenamiento que la GPU Nvidia A100-80GB.

Gaudi2 ofrece ~ 2x vs. A100 en modelos populares de Visión y PNL (Crédito: Intel Corporation)

"En comparación con la GPU A100, implementada en el mismo nodo de proceso y aproximadamente el mismo tamaño de matriz, Gaudi2 ofrece un claro rendimiento de capacitación de liderazgo como se demuestra con la comparación de manzanas a manzanas en cargas de trabajo clave", dijo Eitan Medina, director de operaciones de Habana Labs. "Esta arquitectura de aceleración de aprendizaje profundo es fundamentalmente más eficiente y está respaldada por una hoja de ruta sólida".

Acerca de Gaudí2

Los procesadores de aprendizaje profundo Gaudi2 ofrecen:

  • Eficiencia de la capacitación de aprendizaje profundo: El procesador Habana Gaudi2 aumenta significativamente el rendimiento de la capacitación, basándose en la misma arquitectura Gaudi de primera generación de alta eficiencia que ofrece hasta un 40 % más de rendimiento en cuanto al precio en la nube de AWS con instancias DL1 de Amazon EC2 y en las instalaciones con Supermicro Gaudi Training Server. Con un salto en el proceso de 16 nm Gaudi a 7 nm, Gaudi2 ofrece una mejora significativa a sus capacidades de computación, memoria y redes. Gaudi2 también introduce un motor de procesamiento de medios integrado para medios comprimidos y descarga del subsistema host. Gaudi2 triplica la capacidad de memoria en el paquete de 32 GB a 96 GB de HBM2E con un ancho de banda de 2,45 TB/seg, e integra 24 NIC RoCE RDMA de 100 GbE, en chip, para escalar y escalar horizontalmente utilizando Ethernet estándar.
  • Beneficios para el cliente: Gaudi2 ofrece a los clientes una alternativa de capacitación de aprendizaje profundo de mayor rendimiento a la aceleración basada en GPU existente, lo que significa que pueden entrenar más y gastar menos, lo que ayuda a reducir el costo total de propiedad en la nube y el centro de datos. Diseñado para abordar muchos tipos de modelos y aplicaciones del mercado final, los clientes pueden beneficiarse del tiempo de entrenamiento más rápido de Gaudi2, lo que puede resultar en un tiempo de obtención de información más rápido y un mejor tiempo de comercialización. Gaudi2 está diseñado para mejorar significativamente el modelado de la visión de las aplicaciones utilizadas en vehículos autónomos, imágenes médicas y detección de defectos en la fabricación, así como aplicaciones de procesamiento de lenguaje natural.
  • Capacidad de red, flexibilidad y eficiencia: Habana ha hecho que sea rentable y fácil para los clientes escalar la capacidad de entrenamiento al amplificar el ancho de banda de entrenamiento en la segunda generación de Gaudí. Con la integración del estándar de la industria RoCE en chip, los clientes pueden escalar y configurar fácilmente los sistemas Gaudi2 para adaptarse a sus requisitos de clúster de aprendizaje profundo. Con la implementación del sistema en la conectividad Ethernet estándar de la industria ampliamente utilizada, Gaudi2 permite a los clientes elegir entre una amplia gama de equipos de conmutación Ethernet y redes relacionadas, lo que permite ahorrar costos. Evitar las tecnologías de interconexión patentadas en el centro de datos (como las que ofrece la competencia) es importante para los responsables de la toma de decisiones de TI que desean evitar el "bloqueo" de un solo proveedor. La integración en chip de los puertos del controlador de interfaz de red (NIC) también reduce los costos de los componentes.
  • Compilación y migración simplificadas del modelo: La suite de software Habana® SynapseAI® está optimizada para el desarrollo de modelos de aprendizaje profundo y para facilitar la migración de los modelos existentes basados en GPU al hardware de la plataforma Gaudi. El software SynapseAI admite el entrenamiento de modelos en Gaudi2 y su inferencia en cualquier objetivo, incluidos los procesadores Intel® Xeon®, Habana Greco o el propio Gaudi2. Los desarrolladores reciben apoyo con documentación y herramientas, contenido instructivo y un foro de soporte de la comunidad en el Sitio para desarrolladores de Habana con modelos de referencia y hoja de ruta modelo en Habana GitHub. Comenzar con la migración de modelos es tan fácil como agregar dos líneas de código; para los usuarios expertos que desean programar sus propios núcleos, Habana ofrece el conjunto completo de herramientas.
  • Acerca de la disponibilidad de las soluciones de formación de Gaudi2: Los procesadores Gaudi2 ya están disponibles para los clientes de Habana. Habana se ha asociado con Supermicro para llevar el servidor de entrenamiento Supermicro Gaudi2 al mercado este año. Habana también se asoció con DDN® para ofrecer soluciones clave de la mano mano a nivel de bastidor con el servidor Supermicro con capacidad de almacenamiento de IA aumentada con el emparejamiento de la solución de almacenamiento DDN AI400X2.

Lo que dicen los clientes y socios:

Mobileye: "Como líder mundial en sistemas de asistencia automotriz y de conducción, la capacitación de modelos de aprendizaje profundo de vanguardia para tareas como la detección y segmentación de objetos que permiten a los vehículos detectar y comprender su entorno es una misión crítica para el negocio y la visión de Mobileye", dijo Gaby Hayon, vicepresidenta ejecutiva de I + D de Mobileye. "Como el entrenamiento de estos modelos requiere mucho tiempo y es costoso, varios equipos de Mobileye han optado por utilizar máquinas de entrenamiento aceleradas por Gaudí, ya sea en instancias DL1 de Amazon EC2 o en las instalaciones. Esos equipos ven constantemente ahorros de costos significativos en relación con las instancias existentes basadas en GPU en todos los tipos de modelos, lo que les permite lograr un tiempo de comercialización mucho mejor para los modelos existentes o entrenar modelos mucho más grandes y complejos destinados a explotar las ventajas de la arquitectura Gaudi. Estamos entusiasmados de ver el salto en el rendimiento de Gaudi2, ya que nuestra industria depende de la capacidad de superar los límites con aceleradores de entrenamiento de aprendizaje profundo de alto rendimiento a gran escala".

Leidos: "La rápida I + D requerida para controlar COVID demuestra una necesidad urgente que nuestros clientes médicos y de ciencias de la salud tienen de una capacitación rápida y eficiente en aprendizaje profundo de conjuntos de datos de imágenes médicas, cuando las horas e incluso los minutos cuentan, para desbloquear las causas y curas de enfermedades", Chetan Paul, vicepresidente de Innovación Tecnológica, Soluciones de Salud y Seguridad Gubernamentales en Leidos. "Esperamos que Gaudi2, basándose en la velocidad y la rentabilidad de Gaudi de primera generación, proporcione a los clientes una capacitación de modelos dramáticamente acelerada, al tiempo que preserva la eficiencia de DL que experimentamos con Gaudi de primera generación".

Supermicro: "Estamos entusiasmados de llevar al mercado nuestro servidor de aprendizaje profundo de IA de próxima generación con el procesador Gaudi2 de 7 nm de alto rendimiento que permitirá a nuestros clientes lograr ventajas de tiempo de entrenamiento más rápidas al tiempo que preserva la eficiencia y amplía la escalabilidad de Gaudi de primera generación", dijo Charles Liang, CEO de Supermicro.

DDN:"Felicitamos a Habana por el lanzamiento de su nuevo acelerador Gaudi2 de alto rendimiento y 7 nm. Esperamos colaborar en la solución de IA llave en mano que consiste en nuestro dispositivo de almacenamiento DDN AI400X2 combinado con supermicro Gaudi2 Training Servers para ayudar a las empresas con cargas de trabajo de aprendizaje profundo grandes y complejas a desbloquear un valor comercial significativo con un almacenamiento simple pero potente ", dijo Paul Bloch, presidente y cofundador de DataDirect Networks.

Más contexto: Habana Labs lanza el procesador de capacitación de aprendizaje profundo Gaudi2 (hoja informativa) | Habana Gaudí2 (Libro Blanco) | Intel Vision 2022 (Kit de prensa) | | intel Vision 2022 Keynote (Livestream) Intel Vision 2022: Día 1 Keynote (Blog en vivo) | Intel anuncia nuevas tecnologías de nube a borde para resolver los desafíos de hoy y mañana (Noticias)

La letra pequeña:

Para cargas de trabajo y configuraciones, visite la sección Visión en www.intel.com/PerformanceIndex. Los resultados pueden variar.