Solucione sus mayores retos más rápido

Arquitectura integrada para un rendimiento potente

Presentamos el procesador Intel® Xeon Phi™

El procesador Intel® Xeon Phi™ es un procesador de host ejecutable que proporciona un paralelismo y vectorización enormes para soportar las aplicaciones de informática de alto rendimiento más exigentes. La arquitectura integrada y energéticamente eficiente proporciona más capacidad informática por unidad de energía consumida frente a plataformas comparables para ofrecerle un coste total de propiedad mejorado1. La integración de la memoria y de las redes derriba el muro de la memoria y reduce los coses para ayudarle a solucionar sus mayores retos más rápido.

Fabricado con la tecnología de proceso de 14 nm de Intel, el procesador Intel® Xeon Phi™ proporciona hasta 72 núcleos fuera de uso, instrucciones Intel® Advanced Vector Extensions 512 y hasta 16 GB de memoria de alto ancho de banda en el encapsulado junto con la capacidad para 384 GB de memoria de plataforma DDR4. El resultado de esta vanguardista arquitectura es más de 3 teraFLOPS (operaciones de coma flotante por segundo) de doble precisión a unos simples 215 W por procesador.

Cuando el rendimiento potente se encuentra con el valor incomparable

La arquitectura integrada del procesador Intel® Xeon Phi™ mejora el rendimiento y disminuye los costes reduciendo los cuellos de botella y la complejidad del sistema. El procesador Intel® Xeon Phi™ proporciona hasta 490 GB/s de ancho de banda de memoria constante sin necesidad de tarjetas de memoria independientes adicionales y E/S de 100 GB/s sin el coste y el consumo añadidos necesarios para dos adaptadores de red.

Soportado por una guía integral de Intel, el procesador Intel® Xeon Phi™ es una solución lista para el futuro que maximiza su retorno de la inversión utilizando estándares abiertos para código flexible, portátil y reutilizable.

¿Procesadores Intel® Xeon® o el procesador Intel® Xeon Phi™?

Con los procesadores Intel® Xeon®, las cargas de trabajo con componentes en paralelo y en serie alcanzarán un rendimiento líder. No obstante, para aplicaciones que exigen un elevado paralelismo y vectorización, el procesador Intel® Xeon Phi™ es la herramienta adecuada. Las aplicaciones que más mejorarán harán un uso extensivo de los 72 núcleos con prestaciones de vector ultra-ancho (Intel® AVX-512). Ejemplos de sectores de la industria con aplicaciones altamente paralelas son: la animación, el energético, las finanzas, las ciencias biológicas, la fabricación, la medicina, el sector público, el tiempo atmosférico y muchas otras.

Para obtener una lista de aplicaciones optimizadas, visite la escaparate de aplicaciones.

Integrado en una solución completa

El procesador Intel® Xeon Phi™ es un elemento fundacional del Marco de trabajo de sistema escalable Intel® (Intel® SSF), que combina cálculo, memoria/almacenamiento, red, software para reducir los cuellos de botella y la complejidad del sistema. Intel® SSF es una solución holística para desarrollar sistemas de HPC de alto rendimiento, equilibrados, eficientes y fiables.

Vídeos relacionados

Información sobre productos y rendimiento

1

Basado en comparación con un sistema con E5-2697 v4 de 2 zócalos ejecutnado DGEMM. Xeon Phi™ 7250 se midió como 2070/215 (GFLOP/Vatio) Vs. 1054/290 (GFLOP/Vatio) en el E5-2697 v4. Fuente: mediciones o estimaciones de Intel realizadas en marzo de 2016. 

Detalles de configuración:

Parámetros de configuración de Intel® Xeon® E5-2697 v4:

1 nodo, 2 procesadores Intel® Xeon® E5-2697 v4 en Grantley-EP (Wellsburg) con 128 GB de memoria total en Red Hat Enterprise Linux* 7.1 kernel 3.10.0-229 utilizando stream_omp v5.4 con compilador de Intel 16.0.3.174 con el siguiente comando: icc stream_omp.c -O3 -openmp -o stream_omp -static -freestanding -o stream_omp_v5.4_IC16.0.3.174_80M.

Parámetros de configuración del procesador Intel® Xeon Phi™:

Plataforma utilizada Intel para pruebas: Intel Adams Pass Product Concept Board (ADP PC), 96 GB DDR4 (6 x 16 GB a 2133 MHz)

BIOS: CRB BIOS 08.R00.RC085

Ajustes de BIOS:

  • Configuración predeterminada de carga (Turbo activada)
  • Establecer modo de clúster en Quad
  • Establecer velocidad de memoria DDR en 2133 o en auto
  • El modo de memoria MCDRAM varía entre plana y caché

Procesadores utilizados para esta edición:

  • Procesador KNL B0 tQS (Bin3) 7210 QDF# QKTA:  
    • 32 paneles / 64 núcleos, 16 GB de MCDRAM,
    • 1,5 GHz (turbo en un único núcleo), 1,4 GHz (turbo en todos los núcleos), 1,1 GHz (AVX-P1), 1,3 GHz, (non-AVX-P1)
    • malla de 1,6 GHz, 6,4 GT/s OPIO
  • Procesador KNL B0 tQS (Bin2) 7230 QDF# QKTB:  
    • 32 paneles / 64 núcleos, 16 GB de MCDRAM,
    • 1,5 GHz (turbo en un único núcleo), 1,4 GHz (turbo en todos los núcleos), 1,1 GHz (AVX-P1), 1,3 GHz, (non-AVX-P1)
    • malla de 1,7 GHz, 7,2 GT/s OPIO
  • Procesador KNL B0 tQS (Bin1) 7250
    • 34 paneles / 68 núcleos, 16 GB de MCDRAM,
    • 1,6 GHz (turbo en un único núcleo), 1,5 GHz (turbo en todos los núcleos), ratio P predeterminado
    • malla de 1,7 GHz, 7,2 GT/s OPIO

SO: RHEL* 7

Opciones de Kernel: noreplace-paravirt idle=halt mce=on

Variable(s) del entorno: Ver cómo se ejecutaba cada carga de trabajo individual para las variables del entorno específicas

Paquete de software autoejecutable KNL MPSP 1.2.2

MICPERF 1.3.0 primera versión

ComposerXE 2016 o paquete redistribuíble equivalente instalado

Paquete HPL basado en MKL 11.3.2.009

Versión de Intel MPI 5.1.2-150

Tamaños de las matrices:

DGEMM: 20000 x 20000 o 26000 x 26000

SGEMM: 30000 x 30000

Tamaño del problema LINPACK: 100000