Monitorización vs Observabilidad

Blog ABAST

Monitorización vs Observabilidad

17 de enero de 2023

Monitorización y observabilidad


Por Miguel Ángel Segura,
Responsable de Negocio Área Gestión TI

Seguramente hayas oído hablar del concepto de observabilidad como una evolución de la monitorización de servicios IT. Pero no todo el mundo se pone de acuerdo qué implica realmente, y es que es más complejo de lo que parece a simple vista. Por este motivo, trataremos de explicar los conceptos y dar nuestro punto de vista al respecto.

 

Monitorización

 

A modo de introducción, la monitorización tradicional nació por la necesidad de supervisar las métricas básicas de infraestructura (CPU, RAM, Disco, conectividad, etc). Y con el tiempo también se desarrollaron capacidades para controlar los procesos del sistema y realizar validaciones algo más complejas. Sin embargo, como esta información no era suficiente para validar la calidad del servicio, aparecieron las soluciones de APM – Application Performance Monitoring, que a través de diferentes aproximaciones permitían monitorizar el rendimiento y la disponibilidad de los servicios IT ante las acciones de los usuarios (monitorización de la experiencia de usuario).

El problema de la monitorización ha sido, y continúa siendo, que para ser efectiva se debe partir de supuestos que desgraciadamente no siempre se cumplen:

  • Definir umbrales muy precisos para alertarnos de anomalías sin generar ruido innecesario.
  • Tener la capacidad de que estos umbrales sean dinámicos: No es lo mismo la carga de un sistema cuando no hay nadie accediendo a él que en horario de máxima actividad.
  • Debemos saber de antemano todo lo que tenemos que controlar para verificar que el sistema se está comportando bien.
  • Conocer con detalle todos los componentes del sistema y sus relaciones, teniendo acceso a ellos.
  • Ser capaces de adaptar la monitorización a la misma velocidad que se producen cambios en los servicios.
  • Realizar una correlación de alertas que nos permita acceder rápidamente a la causa raíz de los problemas.

Y la perspectiva de futuro no parece que sea demasiado optimista al respecto: cada día los sistemas son más complejos (arquitecturas híbridas), tienen más componentes (pensemos en los microservicios), son más dinámicos (containers Vs arquitectura tradicional), y cambian a mayor velocidad (DevOps).

Ante este panorama se empieza a hablar con más fuerza de observabilidad.

Observabilidad

 

Aunque lo pueda parecer, no es un concepto nuevo: proviene de la Teoría de Control, una disciplina nacida en el siglo XIX y que tuvo un impulso importante durante la 2ª Guerra mundial. De forma muy simplificada – que me perdonen los expertos en la materia – viene a decir que un sistema es observable cuando se puede deducir todo su comportamiento a partir de las salidas que genera.

Entonces, ¿podemos decir que obtenemos observabilidad sobre un servicio cuando lo monitorizo de forma tradicional? ¿Y si medimos también la experiencia del usuario? ¿Y si añadimos también los logs? Aunque existe consenso en el mercado en que la observabilidad se basa en la capacidad de analizar las métricas, trazas y logs de los sistemas, este concepto en sí mismo implica algo más grande, o como mínimo con una aproximación diferente.

Hay quien dice que la monitorización es una parte de la observabilidad, otros que es pasar de medir lo conocido a lidiar con lo desconocido, otros lo simplifican más y afirman que es pasar de ser reactivo a proactivo. Sin querer entrar en discusiones filosóficas (existen tantas definiciones como grandes consultoras y fabricantes), al hablar de observabilidad por lo general nos referimos a poder hacer frente a situaciones desconocidas, adelantarnos a los problemas y ofrecer información valiosa a tiempo para la toma de decisiones.

¿Y esto se consigue analizando las métricas, trazas y logs? Pues sí, pero según nuestra experiencia, siempre que se cumplan unos requisitos clave que nos permiten hablar de observabilidad y no de monitorización tradicional:

  • Capacidad para aprender del comportamiento normal del sistema y así detectar anomalías.
  • Cabida para identificar automáticamente todo lo que se debe medir y controlar.
  • Trabajar con grandes volúmenes de información para identificar patrones y proporcionar información relevante.
  • Contextualizar todos los datos para poder generar información valiosa, por ejemplo: ¿Qué acción del usuario ha generado este registro en el log? ¿Cuánto ha tardado? ¿Cómo estaban las métricas del servidor? Etc.
  • Capacidad para identificar y adaptarse automáticamente a los cambios en los servicios.
  • Agilidad a la hora de predecir correctamente, calcular impactos y alertar sobre comportamientos anómalos.
  • Etcétera.

Como se puede ver, detrás de este concepto que a priori parece simple, existen muchos requisitos difíciles de alcanzar. Pero por suerte, con la evolución de la tecnología (Inteligencia Artificial, Big Data, automatización, etc) este reto ya no es imposible.

¿Estás preparado para este reto? En ABAST llevamos más de 20 años diseñando, implementando y evolucionando las soluciones líderes del mercado en el ámbito de monitorización y observabilidad. Y gracias a nuestro nivel de especialización, que nos ha permitido trabajar en los entornos más complejos, podemos aportar una visión eficiente de cómo alcanzar la observabilidad en vuestros servicios de TI.

Últimos posts publicados en el Blog de ABAST

Nuevo Nagios XI 5.8: Descubriendo Neptune y más

La nueva versión 5.8 de Nagios XI trae consigo una serie de mejoras y nuevas características importantes. Por encima de las demás destaca Neptune, la…
Leer más

Cómo modernizar tu arquitectura de Business Intelligence con Data Lakehouse

Data Warehouse, Data Lake, Data Lakehouse… Hoy en día nuestros diccionarios evolucionan de una manera vertiginosa y muchas veces no tenemos tiempo para entender los…
Leer más

IA y Ciberseguridad: ventajas y amenazas

La Inteligencia Artificial (IA) y la ciberseguridad se han convertido en protagonistas en el panorama digital actual y en este artículo exploramos cómo la IA…
Leer más

Registration

Forgotten Password?