Rendimiento de GROMACS en instancias Intel en AWS

Por qué Intel para HPC en la nube

  • Asociaciones tecnológicas con los principales proveedores de ingredientes para garantizar la optimización de las CPU de Intel®.

  • Profundas colaboraciones en las comunidades ISV y HPC, centradas en la optimización de los principales códigos HPC.

  • Escalabilidad y flexibilidad para las más cambiantes cargas de trabajo en el entorno de la nube.

author-image

Por

Instancias Intel para cargas de trabajo HPC

Las pruebas a continuación se realizaron en instancias AWS basadas en varias generaciones de procesadores Intel® Xeon® en una configuración hyper-threaded. Este procesador personalizado puede alcanzar una velocidad de reloj turbo en todos los núcleos de hasta 3,5 GHz y dispone de Tecnología Intel® Turbo Boost 2.0, Intel® Advanced Vector Extensions 512 (Intel® AVX-512) e Intel® Deep Learning Boost. Estas nuevas ofertas proporcionan una mejor propuesta de valor para cargas de trabajo de uso general y de uso intensivo de memoria, en comparación con la generación anterior (por ejemplo, una mayor escalabilidad y una clase de CPU actualizada), incluyendo un mayor rendimiento.

¿Qué es GROMACS?

La aplicación GROMACS es una aplicación de cálculo (FLOPS). Las cargas de trabajo en esta aplicación son sensibles a la latencia en cualquier comunicación (de zócalo a zócalo, CPU-GPU y multinodo). Aprovecha las ventajas de AVX-512 (Y), del cálculo (Y) (a excepción de ionchannel, que está vinculado a MPI entre 8-16 nodos), se beneficia del Turbo (Y), se beneficia de HT/SMT (Y).

Las cargas de trabajo consideradas para nuestro análisis de rendimiento están disponibles al público:

  • lignocelulosa (3 millones de átomos, tipo RF); la lignocelulosa es útil como ejemplo de demostración de la escalabilidad.
  • water_rf (1,5 millones de átomos, tipo RF)

Consulte a continuación las cargas de trabajo y las configuraciones. Puede que los resultados varíen.

Configuración de C6i.32xlarge: procesador escalable Intel® Xeon® de 3.ª generación a 2,9 GHz, 256 GB de capacidad de memoria, ancho de banda de red de 50 Gbps, CentOS Linux 7 versión de kernel 3.10.0-1160.45.1.el7.x86_64, GROMACS versión 2021.3, icc 2021.4.0 20210910, Intel® MPI Library para SO Linux, versión 2021.4 compilación 20210831 (id: 758087adf), probado por Intel a 09/11/2021

Configuración de C5n.18xlarge: procesador escalable Intel® Xeon® a 2,9 GHz, 192 GB de capacidad de memoria, ancho de banda de red de 100 Gbps, CentOS Linux 7 versión de kernel 3.10.0-1160.45.1.el7.x86_64, GROMACS versión 2021.3, icc 2021.4.0 20210910, Intel® MPI Library para SO Linux, Versión 2021.4 compilación 20210831 (id: 758087adf), probado por Intel a 09/11/2021

Configuración de M6i.32xlarge: procesador escalable Intel® Xeon® de 3.ª generación a 2,9 GHz, capacidad de memoria de 512 GB, ancho de banda de red de 50 Gbps, CentOS Linux 7 versión del kernel 3.10.0-1160.45.1.el7.x86_64, GROMACS versión 2021.3, icc 2021.4.0 20210910, Intel® MPI Library para SO Linux, Versión 2021.4 compilación 20210831 (id: 758087adf), probado por Intel a 09/11/2021

Consulte a continuación las cargas de trabajo y las configuraciones. Puede que los resultados varíen.

Configuración de C6i.32xlarge: procesador escalable Intel® Xeon® de 3.ª generación a 2,9 GHz, 256 GB de capacidad de memoria, ancho de banda de red de 50 Gbps, CentOS Linux 7 versión de kernel 3.10.0-1160.45.1.el7.x86_64, GROMACS versión 2021.3, icc 2021.4.0 20210910, Intel® MPI Library para SO Linux, versión 2021.4 compilación 20210831 (id: 758087adf), probado por Intel a 09/11/2021

Configuración de C5n.18xlarge: procesador escalable Intel® Xeon® a 2,9 GHz, 192 GB de capacidad de memoria, ancho de banda de red de 100 Gbps, CentOS Linux 7 versión de kernel 3.10.0-1160.45.1.el7.x86_64, GROMACS versión 2021.3, icc 2021.4.0 20210910, Intel® MPI Library para SO Linux, Versión 2021.4 compilación 20210831 (id: 758087adf), probado por Intel a 09/11/2021

Configuración de M6i.32xlarge: procesador escalable Intel® Xeon® de 3.ª generación a 2,9 GHz, capacidad de memoria de 512 GB, ancho de banda de red de 50 Gbps, CentOS Linux 7 versión del kernel 3.10.0-1160.45.1.el7.x86_64, GROMACS versión 2021.3, icc 2021.4.0 20210910, Intel® MPI Library para SO Linux, Versión 2021.4 compilación 20210831 (id: 758087adf), probado por Intel a 09/11/2021

Cómo aprovechar las ventajas de Intel

Los procesadores escalables Intel® Xeon de 3.ª generación proporcionan significativas ganancias de rendimiento para la carga de trabajo de GROMACS cuando se acelera con las tecnologías Intel AVX-512 e Intel Deep Learning Boost. Esta aceleración proporciona beneficios significativos con un menor número de nodos (más del doble). Se vuelve más limitado a medida que escalamos a un mayor número de nodos debido al menor ancho de banda de la red en C6i.32xlarge y M6i.32xlarge. Los clientes que ejecuten esta carga de trabajo de GROMACS pueden obtener importantes ganancias de rendimiento al implementar en tipos de instancia Intel® Xeon® escalables de 3.ª generación en AWS (M6i, C6i) frente a la ejecución en procesadores escalables Intel® Xeon® de generación anterior en AWS.
Recursos: www.intel.es/HPC