Telemetría en la nube: avances en su estrategia informática

Monitorice sus recursos de forma más eficaz para optimizar el rendimiento y el coste total de la propiedad (TCO).

Descripción general de la telemetría en la nube:

  • La telemetría se refiere a la monitorización y al análisis de información sobre sistemas informáticos para monitorizar el rendimiento e identificar problemas.

  • Las mejores estrategias de telemetría usan un enfoque holístico multisistema para identificar parámetros clave que sean importantes para las operaciones empresariales e informáticas.

  • Entre las nuevas fronteras para la telemetría, se incluyen la inteligencia artificial (IA) y el análisis predictivo para detectar y, en algunos casos, resolver problemas sin participación humana.

BUILT IN - ARTICLE INTRO SECOND COMPONENT

¿Funcionan sus sistemas informáticos al rendimiento que deberían? ¿Cómo lo sabe? La telemetría le da información para favorecer el moderno centro de datos autónomo, adaptar nuevas estrategias de crecimiento y optimizar las experiencias de los usuarios.

¿Qué es la telemetría en la nube?

La telemetría en la nube utiliza herramientas de software para registrar y analizar información sobre infraestructura informática que de otra manera sería difícil de recopilar.

Para la gestión en la nube, la telemetría es de vital importancia: a simple vista, la infraestructura informática es muy similar tanto si el hardware funciona de forma óptima o no. La telemetría ofrece a los profesionales informáticos la capacidad de observar componentes y monitorizar aplicaciones de forma más profunda, con parámetros que registran el rendimiento, la utilización, el consumo de energía y mucho más.

Al hacer un uso eficaz de la telemetría, las organizaciones pueden mejorar los indicadores clave de rendimiento, incluidos TCO, fiabilidad, seguridad, rendimiento y consumo de energía. La telemetría también puede generar conocimientos para ayudar a los equipos informáticos a gestionar los requisitos de capacidad en evolución y detectar si la infraestructura se utiliza de forma eficiente.

Gracias a los recientes avances en telemetría y en la coordinación de la nube, las organizaciones pueden lograr avances hacia un centro de datos verdaderamente moderno y autónomo. La IA y el análisis predictivo en la telemetría en la nube pueden predecir fallos y otros problemas; y, a veces, incluso solucionarlos sin participación humana.

Optimización de la infraestructura con telemetría

Las funciones de telemetría se han vuelto más sólidas en los últimos años. Los parámetros y técnicas más recientes, disponibles gracias al hardware avanzado, permiten una monitorización y análisis en la nube más profundos que las anteriores generaciones de la tecnología. Impulsar el valor y el rendimiento de la infraestructura requiere adoptar un enfoque holístico multisistema hacia la telemetría.

Servidores.
Proteger las inversiones en hardware requiere telemetría de servidor que ofrezca un aspecto detallado al estado del servidor. Los parámetros relacionados con el consumo de energía y el flujo de aire volumétrico, así como el calentamiento y la refrigeración, pueden ayudar a identificar problemas que puedan poner en peligro el estado del hardware. La monitorización y el equilibrio de cargas del servidor, así como el seguimiento de la memoria del servidor, también son aspectos importantes.

Informática
Gracias a una telemetría eficaz, las empresas pueden gestionar los recursos informáticos de forma más eficiente. La telemetría puede detectar la utilización por núcleo y comparar los porcentajes de utilización de CPU con las especificaciones del componente. Si una CPU se ejecuta de forma poco eficiente, el departamento de informática puede solucionar problemas o sustituirla para lograr niveles de rendimiento esperados.

Memoria
La telemetría para módulos de memoria duales en línea clásicos (DIMM) se centra en la predicción de fallos. Dado que los problemas en un DIMM específico se suelen aplicar a un lote completo, la telemetría podría ayudar a analizar qué otros DIMM hay que cambiar para reducir los fallos. Los módulos de memoria persistente modernos (PMM), como la memoria persistente Intel® Optane™, permiten una telemetría más sólida. Esto se debe a que los PMM tienen un analizador de resistencia con un ciclo de vida previsto para mejorar el mantenimiento predictivo.

Almacenamiento
Las unidades de estado sólido (SSD) han experimentado mejoras significativas en las funciones de telemetría. Estas unidades, que incluyen las SSD Intel®, tienen herramientas modernas de análisis de estado que ofrecen información sobre el rendimiento y la vida útil restante. A medida que el estado de la unidad va deteriorándose, la telemetría permite predecir cuándo darán problemas las unidades.

Redes
La telemetría para la infraestructura de red ha avanzado en los últimos años. Mientras que los controladores anteriores solo buscaban E/S y rendimiento, los controladores más recientes pueden ofrecer una visión más amplia del uso de la red. Gracias a los NIC inteligentes basados en Intel® FPGA, el equilibrio de cargas se puede gestionar estrechamente para descargar cargas de trabajo de la red desde los recursos informáticos centrales.

Aplicaciones.
La telemetría en forma de monitorización de aplicaciones puede analizar más detenidamente si sus aplicaciones cumplen los parámetros de referencia. Los equipos informáticos pueden analizar la latencia y los tiempos de inactividad en la carga, así como otras medidas del estado general de la aplicación.

Al hacer un uso eficaz de la telemetría, las organizaciones pueden mejorar los indicadores clave de rendimiento, incluidos TCO, fiabilidad, seguridad, rendimiento y consumo de energía.

Estrategia de telemetría: consejos que puede usar

No hay una estrategia «de talla única» para la telemetría. Su infraestructura existente, los aspectos de costes a corto y largo plazo, y los objetivos empresariales determinarán el rumbo global de su estrategia.

No obstante, se deben tener en cuenta algunos principios básicos para cualquier organización que desee prepararse para el futuro con una estrategia de telemetría moderna:

  • Menos es más: aunque la telemetría se centra en la recopilación de información sobre el hardware y el software, no todos los datos son igualmente importantes. A menudo, la información se recopila demasiado pero se utiliza muy poco. Es importante identificar qué parámetros son los adecuados para seguir.
  • Vaya poco a poco: analizar las cargas de trabajo es un proceso de cuatro pasos que empieza con una visión del estado de la plataforma y la validación del hardware. A continuación, utilice la caracterización para entender mejor el comportamiento del sistema. Equilibre su plataforma para cargas de trabajo específicas con el tamaño adecuado del hardware. Una vez que el hardware se vea bien, perfile y optimice el software para identificar ineficiencias.
  • Sea predictivo: el hardware y las herramientas más recientes permiten ver problemas antes de que ocurran. Al realizar la transición a un hardware que pueda medir su propio estado y el resto de su vida útil, podrá poner en marcha una estrategia de mantenimiento predictiva, en lugar de reactiva, que reduzca al mínimo los fallos y las interrupciones del servicio.
  • Automatice decisiones: a medida que la telemetría mejora en la identificación de problemas, la extracción de datos de infraestructura puede ayudarle a tomar decisiones más adecuadas sobre la utilización y la optimización del rendimiento. Al detectar cómo se han equilibrado las cargas de trabajo y cómo se han utilizado los componentes en el pasado, la extracción de datos de infraestructura puede informar mejor sobre las decisiones que debe tomar en el futuro. Muchas de estas decisiones se pueden incluso automatizar al preparar modelos de IA, para que el rendimiento y el consumo de energía puedan optimizarse sin participación humana.

Las funciones de telemetría suelen evolucionar a la vez que los avances en la infraestructura; por ejemplo, si los nuevos tipos de hardware permiten tomar nuevas medidas. Piensa en cada componente nuevo que se ha añadido a su configuración actual y si puede afectar a su estrategia y parámetros clave.

Herramientas de Intel para la telemetría en la nube

En Intel, nos comprometemos a ayudar a las empresas a entender cómo se usa la telemetría de forma eficaz y a encontrar los parámetros que importan. Desde la telemetría habilitada por hardware hasta los kits de desarrollo y los marcos para los ingenieros de rendimiento, la tecnología Intel® funciona para mejorar la telemetría moderna en la nube.

Intel llevó la telemetría hasta el silicio con nuestras unidades de monitorización de rendimiento avanzadas (Intel® PMU). Este sofisticado hardware incorporado en el circuito permite una telemetría más sólida con parámetros y diagnósticos avanzados. Seguimos evolucionando los PMU junto con nuestras actualizaciones de la arquitectura.

Gracias a Intel® Telemetry Collector (ITC), los equipos informáticos pueden analizar y ver visualizaciones de rendimiento rápidamente en diversos sistemas. ITC le ofrece acceso al mismo conjunto de herramientas que los propios ingenieros de rendimiento de Intel usarían en una revisión de rendimiento.

A medida que evolucionen las funciones de telemetría, Intel continuará nuestra misión de innovación y educación en todas las etapas del análisis de cargas de trabajo y de la optimización. Desde el análisis predictivo y mejorado hasta los avances en telemetría basados en hardware, estamos muy contentos de poder favorecer la tecnología del futuro para nuestros clientes hoy mismo.

Descargo de responsabilidades legales

Es posible que las tecnologías Intel® requieran la activación de hardware, software o de servicios.

Ningún producto o componente es completamente seguro.

Sus costes y resultados pueden variar.

Todos los planes y las guías de productos están sujetos a cambios sin previo aviso.