WhiteMon: un camino íntegro para evolucionar su infraestructura de monitoreo

En este artículo exponemos la importancia y utilidad del monitoreo en infraestructuras de telecomunicaciones, influenciado fuertemente por la creciente demanda de Cloud Privado

Picture of Royer Yangali Cáceres

Royer Yangali Cáceres

Cloud Solutions Architect

IMPORTANCIA DE MONITOREO

La implementación de un monitoreo exhaustivo de plataformas en funcionamiento desempeña un papel fundamental en todas las organizaciones. Además de proporcionar una visualización en tiempo real y el procesamiento de eventos generados por los componentes de nuestra infraestructura, este enfoque nos permite identificar áreas de optimización, planificar el uso de recursos y detectar posibles vulnerabilidades de seguridad, entre otros aspectos. Y no cabe duda que estas capacidades se traducen en una reducción de costos y mejoras significativas en la experiencia del usuario final.

 

Es importante destacar que, en el contexto actual de migración hacia entornos en la nube, es fundamental contar con una solución de monitoreo diseñada específicamente para ambientes cloud-native. Esta solución debe ser capaz de integrarse de manera sinérgica con las aplicaciones y servicios que operan en la nube. De esta manera, se asegura que características esenciales como la escalabilidad, alta disponibilidad, flexibilidad y una gestión eficiente de recursos no sean aspectos ajenos al proceso de monitoreo.

DEFINICIÓN Y ALCANCE DE MONITOREO EN EL CLOUD

  • WhiteMon, una de las soluciones de monitoreo desarrolladas por Whitestack, basado en componentes de código abierto, está diseñada para abordar las exigencias de la Gestión de Fallas (Fault Management) y la Gestión de Rendimiento (Performance Management). Esta solución es capaz de supervisar una amplia gama de elementos, que incluyen routers, switches, servidores bare-metal, balanceadores, firewalls, máquinas virtuales, servicios web y bases de datos, entre otros.

Un gestor carrier-grade que, en líneas generales, proporciona una serie de capacidades esenciales:

  • Gestión de Fallas: Este gestor procesa eventos y alarmas de diversas fuentes, como traps SNMP, syslog, y Rest, permitiendo la adición de lógica personalizada según las necesidades.
  • Gestión del Rendimiento: Realiza un seguimiento constante del rendimiento de los elementos mediante métricas, generando alarmas personalizadas cuando sea necesario.
  • Compatibilidad Multi-Fabricante: Facilita la incorporación de elementos de diferentes marcas de forma sencilla, con soporte para MIBs estándar y propietarias, así como protocolos como SNMP v1/v2/v3, HTTP, entre otros.
  • Gestor de Gestores: Puede operar como un gestor de gestores, lo que permite su integración sin problemas con otras plataformas de monitoreo.
  • Tableros de Control Personalizados: Tanto para la Gestión de Fallas (FM) como para la Gestión del Rendimiento (PM), ofrece la capacidad de crear tableros de control personalizados para una administración eficiente de una gran cantidad de recursos.
  • Cloud-native: Esta solución se basa en la arquitectura nativa de la nube, lo que garantiza redundancia y alta disponibilidad. También permite realizar actualizaciones y mejoras de manera no disruptiva. 
  • Monitoreo NFV: Se integra de manera sencilla con componentes de red virtualizados, lo que posibilita el monitoreo de VNFs (Virtualized Network Functions) y CNFs (Cloud-Native Network Functions), teniendo una versión exclusiva y dedicada a este rubro.

Tal como se observa en el gráfico, WhiteMon se erige como una plataforma integral que abarca todos los componentes de la infraestructura multi-fabricante. Es especialmente versátil en entornos nativos de la nube, donde es capaz de supervisar una variedad de elementos en diversas capas. Esto abarca desde switches hasta las funcionalidades virtualizadas de red (VNFs) y las funciones nativas de la nube (CNFs) y sus respectivas aplicaciones/servicios.

COMPONENTES DE MONITOREO DE WHITEMON

Actualmente WhiteMon cuenta con dos principales distribuciones, las cuales son las siguientes:

1. WhiteNms Infra: orientado al monitoreo integral de infraestructura física y virtual con elementos multi-fabricante.

 

 

Como se puede observar en el gráfico, se tienen dos flujos: para Fault Management y Performance Management.

  • Fault Management: el objetivo es recepcionar eventos de distintos tipos de elementos (como switches, routers, servidores, aplicaciones, VNFs, CNFs, KNFs, entre otros) mediante syslog y SNMP para gestionarlos con OpenNms, en base a una lógica configurable. Se almacenan para revisión histórica en la base de datos de ElasticSearch y pueden ser visualizados gráficamente en Kibana.
  • Performance Management: el objetivo es recolectar métricas de distintos tipos de elementos (como switches, routers, servidores, aplicaciones, VNFs, CNFs, KNFs, entre otros), cuya configuración y protocolo a usar, variará de acuerdo al tipo de dispositivo (pueden utilizarse exporters de prometheus, openstack o SNMP). Prometheus se encarga de la gestión de los datos, permitiendo establecer umbrales (thresholds) y generar alarmas en base a ello. OpenNMS toma estas alarmas y las almacena en el histórico. Asimismo, se puede visualizar gráficamente los datos y generar tableros personalizados en Grafana.

En ambos flujos, es posible adicionar características como:

  • Integración Single-Sign-On (SSO): los portales para visualización de datos, Grafana y Kibana permiten integrarse a plataformas de autenticación externas.
  • Reenvío a plataformas externas: se puede reenviar alarmas hacia plataformas externas, pudiendo configurar a demanda, ciertos patrones. Por ejemplo, patrones para syslogs de seguridad (auditoría y autorización).

 

2. WhiteNFMon: orientado al monitoreo de aplicaciones/servicios cloud-native (CNFs, KNFs y VNFs).

 

Puede considerarse como una versión liviana de monitoreo, basado en las prácticas nativas del cloud para NFVs y sus servicios/aplicaciones. 
Respecto a  monitoreo PM, se toman métricas con Prometheus y son almacenados en su base de datos, los cuales pueden ser visualizados en tableros en Grafana y desarrollarse umbrales para generación de alarmas internas.
Respecto al monitoreo FM, ElasticSearch se encarga del almacenamiento histórico de eventos, los cuales pueden ser visualizados en Kibana.

Acerca de Whitestack

Whitestack es una empresa líder en el despliegue productivo de soluciones basadas en tecnologías y código abierto, con un fuerte foco en la industria de telecomunicaciones. La solución de Telco Cloud de Whitestack permite el despliegue natural de VNFs (basadas en máquinas virtuales), así como CNFs (basadas en contenedores), utilizando modelos de despliegues estándares en la industria. Es la solución de Telco Cloud más desplegada en América Latina, y está homologada sobre hardware de HPE y DELL. Sus soluciones de Open Networking permiten desplegar DC Fabrics abiertos en configuración Spine & Leaf, o redes ópticas de acceso y agregación, con switches abiertos (whiteboxes), gestionados por su propio controlador SDN para un aprovisionamiento de redes automatizado.

¡Contáctanos para conocer más!