Inside Intel: The Race for Faster Machine Learning

author-image

Por

The goal is not just the fastest but the most productive machine-learning platform for researchers.

Pradeep Dubey, an Intel Fellow at the Intel Labs division

Información sobre productos y rendimiento

1

Configuration information - Hardware: Intel® Xeon® Processor E5-2699 v3, 2 eighteen-core CPUs (45MB LLC, 2.3GHz), Intel® TurboBoost Technology off, Intel® Hyperthreading technology off, 64GB of RAM; Operating System: RHEL 6.5 GA x86_64; testing source, internal Intel measurements.

2

Up to 2.3x faster training per system claim based on AlexNet* topology workload (batch size = 256) using a large image database running 4-nodes Intel® Xeon Phi™ processor 7250 (16 GB, 1.4 GHz, 68 Cores) in Intel® Server System LADMP2312KXXX41, 96GB DDR4-2400 MHz, quad cluster mode, MCDRAM flat memory mode, Red Hat Enterprise Linux* 6.7 (Santiago), 1.0 TB SATA drive WD1003FZEX-00MK2A0 System Disk, running Intel® Optimized DNN Framework, Intel® Optimized Caffe (source: https://github.com/intelcaffe) training 1.33 billion images/day in 10.5 hours compared to 1-node host with four NVIDIA “Maxwell” GPUs training 1.33 billion images/day in 25 hours (source: http://www.slideshare.net/NVIDIA/gtc-2016-opening-keynote slide 32).

3

Los resultados de análisis se obtuvieron antes de la aplicación de los parches de software y actualizaciones de firmware más recientes, pensados para solucionar los ataques "Spectre" y "Meltdown". Puede que, al implementar estas actualizaciones, los resultados mostrados no sean aplicables a su dispositivo o sistema.

El software y las cargas de trabajo utilizadas en las pruebas de rendimiento han sido optimizados para el rendimiento solamente en microprocesadores Intel®. Las pruebas de rendimiento, como SYSmark* y MobileMark*, se han medido utilizando sistemas, componentes, software, operaciones y funciones informáticas específicas.  Cualquier cambio realizado en cualquiera de estos factores puede hacer que los resultados varíen. Es conveniente consultar otras fuentes de información y pruebas de rendimiento que le ayudarán a evaluar a fondo sus posibles compras, incluyendo el rendimiento de un producto concreto en combinación con otros. Para obtener más información, visite http://www.intel.es/content/www/es/es/benchmarks/benchmark.html].

https://www.intel.es/content/www/es/es/benchmarks/server/xeon-phi/xeon-phi-competitive-performance.html
Información sobre la configuración: un procesador Intel® Xeon® E5-2697 v4 de 2 zócalos (45 MB de caché, 2,3 GHz, 18 núcleos), 128 GB de memoria frente a una GPU NVIDIA* Tesla K80, NVIDIA CUDA* 7.5.17 (controlador 352.39), ECC activada, modo de persistencia activado.