Analice 1,51 más datos por segundo para cargas de trabajo de Apache Spark™ con instancias de VM de Google Cloud™ N2

Apache Spark

  • Analice más datos por segundo con un rendimiento 1,51 veces superior.

  • Optimice el análisis de datos y el aprendizaje automático en la nube.

  • Acelere las cargas de trabajo con la memoria persistente Intel Optane.

BUILT IN - ARTICLE INTRO SECOND COMPONENT

Obtenga información de los datos más rápido con instancias de VM de Google Cloud N2 con procesadores escalables Intel® Xeon® de 2ª generación

El análisis de datos, el aprendizaje automático y las cargas de trabajo de inteligencia artificial clasifican y dan sentido a enormes cantidades de datos de empresa. Como estas cargas de trabajo exigen muchos recursos informáticos, alojarlos en la nube requiere hardware que pueda soportar los desafíos singulares inherentes a la extracción rápida de información de los datos. Si su organización ejecuta clústeres Apache Spark —que proporciona una plataforma de análisis unificada para procesar macrodatos— el tipo de instancia de VM que escoja afecta directamente a la velocidad a la que puede transformar datos en acciones. Para cargas de trabajo exigentes de Apache Spark, las instancias de VM de Google Cloud N2 habilitadas por los procesadores escalables Intel Xeon de 2ª generación pueden dinamizar cargas de trabajo de aprendizaje automático para análisis de datos para garantizar que su organización pueda hacer progresar nuevas iniciativas rápidamente.

En una comparación del rendimiento de aprendizaje automático de clústeres en medios k, las instancias más recientes de VM de Google Cloud N2 habilitadas por los procesadores escalables Intel Xeon de 2ª generación superaron en productividad las instancias de VM N1 más antiguas con procesadores Intel Xeon E5 v4, analizando hasta 1,51 veces más datos por segundo para las cargas de trabajo de análisis de datos avanzadas de Apache Spark.

Analice más datos por segundo con un rendimiento 1,51 veces superior

Las instancias en la nube admiten cada vez más cargas de trabajo de computación intensiva, como el análisis de datos, el aprendizaje automático y la inteligencia artificial (IA), lo cual supone un impulso para las organizaciones que anhelan la agilidad y la flexibilidad que la informática en la nube aporta al resto de su negocio.

Las pruebas que comparan el rendimiento de clústeres de medios K usando el paquete de análisis de rendimiento de HiBench muestran que las instancias de VM de Google Cloud N2 con procesadores escalables Intel Xeon de 2ª generación pueden aumentar las cargas de trabajo de Apache Spark de aprendizaje automático hasta en 1,51 veces más datos por segundo de las instancias de VM N1 con procesadores Intel Xeon E5 v4.

Esto significa que elegir instancias de VM de Google Cloud N2 frente a instancias de VM N1 puede mejorar radicalmente la velocidad a la que su organización puede procesar datos.

Figura 1. Comparación relativa de rendimiento de las instancias de Google Cloud N1 y N2 VM bhn (32 vCPU/128 GB de RAM) para cargas de trabajo de clústeres de medios K del paquete de análisis de rendimiento de HiBench.

Las nuevas tecnologías presentes en los procesadores escalables Intel Xeon de 2ª generación optimizan el análisis de datos

Seleccionar instancias de VM de Google Cloud N2 significa que puede acceder a tecnologías clave integradas en los procesadores escalables Intel® Xeon® de 2ª generación que operan para optimizar el análisis de datos avanzado de computación intensiva y las cargas de trabajo de aprendizaje automático. Intel Advanced Vector Extensions 512 (Intel AVX-512) procesa más datos con una sola instrucción, manejando tareas informáticas más rápidamente y acelerando estas cargas de trabajo avanzadas. Las instancias de VM de Google Cloud N2 que incorporan procesadores escalables Intel Xeon de 2ª generación ofrecen Intel Deep Learning Boost (Intel DL Boost), que optimiza los bucles de red neuronal para mejorar las operaciones de IA con hasta 3,4 veces más datos, convirtiéndolo en una herramienta extraordinaria para optimizar el análisis de datos avanzado y las cargas de trabajo de aprendizaje automático. Para aumentar la flexibilidad, las instancias de VM de Google Cloud N2 habilitadas por los procesadores escalables Intel Xeon de 2ª generación también utilizan matrices de puertas programables de Intel (FGPA), que pueden reconfigurarse para diferentes modelos de aprendizaje automático en los que los algoritmos cambian frecuentemente para acelerar las operaciones de IA.

Acelere las cargas de trabajo con la memoria persistente Intel Optane

Las instancias de VM de Google Cloud N2 habilitadas por los procesadores escalables Intel Xeon de 2ª generación también aportan la opción de acelerar aún más las cargas de trabajo de análisis de datos con memoria persistente Intel Optane (PMem). Intel Optane PMem es una combinación de tecnología de memoria y de almacenamiento que permite que las instancias de VM de Google Cloud N2 acerquen más datos al procesador para brindar latencias más bajas para el análisis de datos y el aprendizaje automático.

Más información

Para comenzar sus cargas de trabajo de aprendizaje automático de Apache Spark en instancias de VM de Google Cloud equipadas con procesadores escalables Intel Xeon de 2ª generación, visite http://intel.es/GoogleCloud.