Integración de Nagios XI y Dynatrace sin morir en el intento

Consolidación del monitoreo: elimine las tormentas de eventos, reduzca el MTTR con los datos de los hosts de Nagios y los problemas en Dynatrace aprovechando el motor Davis AI.

Descripción General

Consolide e integre sus herramientas de monitoreo. La integración de Nagios de Alanata le permite conectar el monitoreo de Nagios existente con Dynatrace. Enriquezca Dynatrace SmartScape con hosts de Nagios, ingiera los problemas de Nagios y deje que el motor de IA de Davis procese los problemas junto con los eventos nativos de Dynatrace en una solución AIOps integrada. Con esta extensión, puede usar Dynatrace como una plataforma unificadora para datos de soluciones de monitoreo externas, eliminar tormentas de eventos y minimizar el tiempo dedicado a la investigación.

Proporciona una vista central de toda su red de operaciones de TI y procesos comerciales. Los potentes paneles brindan acceso de un vistazo a información de monitoreo poderosa y datos de terceros. Las vistas proporcionan a los usuarios un acceso rápido a la información que encuentran más útil.

Conocer a detalle..

Características Clave

Sincronización:

  • Aloje información en dispositivos personalizados de Dynatrace, incluida la IP del host de Nagios y la configuración de monitoreo.
  • Estado de hosts y servicios monitoreados en forma de eventos de Dynatrace. Filtro para el estado del objeto de Nagios:
    • El estado no está bien
    • El tipo de estado es DIFÍCIL
    • La verificación activa o la verificación pasiva están habilitadas
    • La notificación está habilitada para Host o Servicio
    • El host y el servicio no están en tiempo de inactividad programado

Filtración:

  • Filtrado en grupos de host
  • Filtrado de nombres de servicios a través de la lista de expresiones regulares

Información de contexto:

  • URL del entorno de Dynatrace para vincular hosts/dispositivos personalizados y problemas en Dynatrace con hosts y problemas de Nagios

Métrica del problema:

  • Métrica que muestra el recuento de problemas para cada dispositivo, solo para dispositivos personalizados (opcional)

Tecnología Nagios:

  • Agrupa todos los dispositivos personalizados de los servidores Nagios creados por la extensión Nagios ActiveGate
  • Se creó el grupo especial con el nombre Servidores Nagios. Para cada punto final que representa el servidor de Nagios, se crea un dispositivo personalizado allí.

La extensión se distribuye como el archivo .custom.remote.python.nagios-VERSION.zip

Proceso de implementación

  1. Importe la extensión al servidor de Dynatrace. Importe el archivo  custom.remote.python.nagios-VERSION.zip presionando el botón en la GUI de Dyntarce: Settings->Monitoring->Monitoring technologies->Custom extensions->Upload extension

  2. Haga clic en  Nagios ActiveGate Extension (version x.y) y presione el botón Add new endpoint

  3. Implemente el archivo zip de extensión en el servidor ActiveGate
    – Para el servidor Linux, descomprima el archivo en /opt/dynatrace/remotepluginmodule/plugin_deployment
    – Para el servidor MS Windows, descomprima el archivo enC:\Program Files\dynatrace\remotepluginmodule\plugin_deployment

  4. Reinicie el servicio de complemento remoto
    : para el servidor Linux, ejecute: systemctl restart remotepluginmodule
    – Para el servidor MS Windows: reinicie Dynatrace RemotePlugin Moduleel servicio

Verifique el archivo de registro después de la configuración del punto final:

  • Para servidor Linux: /var/lib/dynatrace/remotepluginmodule/log/remoteplugin/custom.remote.python.nagios/NagiosPluginRemote.log

  • Para el servidor de Windows: c:\ProgramData\dynatrace\remotepluginmodule\log\remoteplugin\custom.remote.python.nagios\NagiosPluginRemote.log

 

Configuración

Antes de configurar la extensión en la interfaz de usuario de Dynatrace, por favor

  1. Cree un usuario de Nagios que será utilizado por la extensión

  2. Cree un token API de Dynatrace con los siguientes permisos:

    1. API v2: leer entidades

    2. API v2: Escribir entidades

    3. API v2: métricas de ingesta

    4. API v2: Ingesta de eventos

La configuración del extremo de la extensión proporciona estas opciones:

  • Nagios API URL – URL de Nagios Core  (obligatorio para completar)

  • Nagios Username – Nombre de usuario para conectarse a la API de Nagios  (obligatorio para completar)

  • Nagios Password– Contraseña para conectarse a la API de Nagios  (obligatoria para completar)

  • Verify Nagios SSL certificate – Verificar el certificado SSL de Nagios

  • Nagios CA certificates – Ruta al paquete de CA con certificados de CA que se usarán para la verificación (si se usa una CA personalizada) en formato PEM. Se usa solo si la verificación está activada. Si no se especifica, se utilizan certificados de CA integrados.

  • Nagios HostGroups to include – Lista delimitada por punto y coma de grupos de host de Nagios para incluir en la integración. Solo se incluyen los hosts miembros, se ignoran los demás hosts (obligatorio completar)

  • Nagios Service names to include – Nombres de servicios especificados como expresiones regulares delimitadas por un punto y coma (otros servicios se ignoran), por ejemplo, Mem.*sage;HTTP;Swa.*

  • Nagios metadata keys – Nombres separados por punto y coma de las claves de atributo de host de Nagios que se utilizarán en los metadatos del dispositivo personalizado

  • Nagios alert keys – Nombres separados por punto y coma de las claves de atributo de estado de alerta de Nagios que se utilizarán en metadatos de eventos personalizados

  • Nagios refresh hosts – Intervalo (en minutos) para consultar la API de Nagios para hosts y datos de inventario. Los hosts y el inventario se consultan al inicio de la extensión y periódicamente después  (obligatorio para completar)

  • Notification enabled – Capturar estados con notificación habilitada solamente

  • Nagios host DOWN – Mapeo de la gravedad de Nagios a la gravedad de Dynatrace

  • Nagios host UNREACHABLE – Mapeo de la gravedad de Nagios a la gravedad de Dynatrace

  • Nagios service CRITICAL – Mapeo de la gravedad de Nagios a la gravedad de Dynatrace

  • Nagios service WARNING – Mapeo de la gravedad de Nagios a la gravedad de Dynatrace

  • Nagios service UNKNOWN – Mapeo de la gravedad de Nagios a la gravedad de Dynatrace

  • Dynatrace Environment URL – URL para el entorno de Dynatrace utilizado para las llamadas a la API de Entity v2  (obligatorio para completar)

  • Dynatrace API Token – Token API de Dynatrace con el siguiente alcance de acceso  (obligatorio para completar)

    • API v2: leer entidades

    • API v2: Escribir entidades

    • API v2: métricas de ingesta

    • API v2: Ingesta de eventos

  • Verify Dynatrace SSL certificate – Verificar el certificado SSL de Dynatrace

  • Dynatrace CA certificate – Ruta al paquete de CA con certificados de CA para verificación (si se usa una CA personalizada) en formato PEM. Se usa solo si la verificación está activada. Si no se especifica, se utilizan certificados de CA integrados.

  • Dynatrace refresh host entities – Intervalo (en minutos) para consultar la API de Dynatrace para hosts y sus direcciones IP. Los hosts se consultan en el inicio de la extensión y periódicamente después  (obligatorio para completar)

  • Dynatrace problem resend time – Intervalo en minutos para reenviar eventos a Dynatrace para mantener el problema abierto en Dynatrace (de lo contrario, caduca después de 15 minutos)  (obligatorio para completar)

  • Problem metric – Enviar métrica de problemas (recuento de problemas para cada dispositivo personalizado creado)

  • Performance metrics– Si no hay definición, no se transfieren datos de rendimiento. Defina expresiones regulares/subcadenas delimitadas por un punto y coma que especifique la lista de servicios (p. ej., Mem;HTTP;Swa.*) Los datos de rendimiento para la lista de servicios coincidentes se transferirán a Dynatrace.

  • Metrics to hosts– Enviar métricas de Nagios al host de Dynatrace. Las métricas de infraestructura son monitoreadas por el agente de Dynatrace, por lo tanto, las métricas de Nagios no se envían de forma predeterminada. Actívelo si desea que las métricas de Nagios se envíen a los hosts monitoreados por el agente de Dynatrace.

  • Candidate to Custom device – Cree un dispositivo personalizado para el candidato de monitoreo, si no está habilitado, los eventos se envían al host del candidato de monitoreo

  • Use Events API – Si está habilitado, los problemas de Nagios se envían mediante la API de eventos en lugar de la extensión ActiveGate.

  • Allow Davis merge – Permitir que Davis AI combine eventos en problemas existentes (verdadero) o fuerce la creación de un nuevo problema (falso)

  • Debug – Configúrelo para habilitar el registro DEBUG en cada ejecución de consulta de extensión

  • License – Licencia válida requerida  (obligatoria para llenar)

 

Nagios alert keys

Nombres separados por punto y coma de las claves de atributo de estado de alerta de Nagios que se utilizarán en los metadatos de eventos personalizados.

				
					"name": "Name"
"plugin_output": "Status information"
"long_plugin_output": "Status information long"
"perf_data": "Performance data"
"status": "Current status"
 # hardcoded"last_update": "Last update"
"has_been_checked": "Has been checked"
"should_be_scheduled": "Should be checked"
"current_attempt": "Attempts current"
"max_attempts": "Attempts max"
"last_check": "Last check"
"next_check": "Next check"
"check_options": "Check options"
"check_type": "Check type"
"last_state_change": "Last state changed"
 # hardcoded"last_hard_state_change": "Last hard state changed"
"last_hard_state": "Last hard state"
"last_time_up": "Last time up"
"last_time_down": "Last time down"
"last_time_unreachable": "Last time unreachable"
"state_type": "State type"
 # hardcoded"last_notification": "Last notification"
"next_notification": "Next notification"
"no_more_notifications": "No more notifications"
"notifications_enabled": "Notifications enabled"
"problem_has_been_acknowledged": "Problem has been aknowledged"
 # hardcoded"acknowledgement_type": "Acknowledge type"
"current_notification_number": "Current notification number"
"accept_passive_checks": "Accept passive checks"
"event_handler_enabled": "Event handler enabled"
"checks_enabled": "Checks enabled"
"flap_detection_enabled": "Flap detection enabled"
"is_flapping": "Is flapping"
"percent_state_change": "Percent state change"
"latency": "Latency"
"execution_time": "Execution time"
"scheduled_downtime_depth": "Scheduled downtime depth"
"process_performance_data": "Process performance data"
"obsess": "Obsession"
"url": "Nagios URL info"
				
			

Claves de metadatos de Nagios

Nombres separados por punto y coma de las claves de atributos de host de Nagios que se utilizarán en los metadatos de dispositivos personalizados.

				
					"alias": "Alias"
"name": "Name"
"status": "Status"
"services": "Monitored services"
"display_name": "Display name"
"address": "IP Address"
 # hardcoded"parent_hosts": "Parent hosts"
"child_hosts": "Child hosts"
"check_command": "Check command"
"check_interval": "Check interval"
"retry_interval": "Retry interval"
"max_attempts": "Attempts max"
"event_handler": "Event handler"
"contact_groups": "Contact group"
"admins": "Admins"
"contacts": "Contacts"
"notification_interval": "Notification interval"
"first_notification_delay": "First notification delay"
"notifications_options": "Notifications options"
"notification_period": "Notification perios"
"check_period": "Check period"
"flap_detection_enabled": "Flap detection"
"low_flap_threshold": "Low flap threshold"
"high_flap_threshold": "High flap threshold"
"flap_detection_options": "Flap detection options"
"stalking_options": "Stalking options"
"check_freshness": "Check freshness"
"freshness_threshold": "Freshness thereshold"
"process_performance_data": "Process performance data"
"checks_enabled": "Checks enabled"
"accept_passive_checks": "Accept passive checks"
"event_handler_enabled": "Event handler enabled"
"retain_status_information": "Retain status information"
"retain_nonstatus_information": "Retain nonstatus information"
"obsess": "Obsessing"
"hourly_value": "Hourly value"
"notes": "Notes"
"notes_url": "Notes url"
"action_url": "Action url"
"icon_image": "Icon image"
"icon_image_alt": "Icon image aleternative"
"vrml_image": "VRML image"
"statusmap_image": "Statusmap image"
"have_2d_coords": "Have 2d coords"
"x_2d": "x_2d"
"y_2d": "y_2d"
"have_3d_coords": "Have 3d cords"
"x_3d": "x_3d"
"y_3d": "y_3d"
"z_3d": "z_3d"
"should_be_drawn": "Shoul be drawn"

				
			

Despues de ver lo anterior te asustaste..

No te preocupes, si cuentas con Nagios XI, el 99% de las anteriores configuraciones ya estan hechas.

Limitaciones actuales

  • Es posible que los eventos sobre problemas en Nagios con una duración de menos de 1 minuto no se sincronicen con Dynatrace porque Nagios se sondea cada minuto o menos.

  • Los problemas en Dynatrace se cierran al menos un minuto después de que la extensión detecta que el problema se ha resuelto en Nagios. Por lo tanto, puede llevar al menos 2 minutos cerrar un problema en Dynatrace cuando se resuelve el problema de Nagios.

  • Los puertos no se pueden leer desde la configuración, por lo que el dispositivo personalizado de Dynatrace solo tiene IP para las interconexiones con otros objetos de Dynatrace

  • Los reconocimientos de Nagios son parte de la información del evento de Dynatrace, no del problema de Dynatrace

  • Las propiedades del evento (última verificación de Nagios, último cambio de estado de Nagios, última actualización de Nagios) obtienen el valor desde el momento en que se ejecutó la encuesta del complemento de Nagios (tiempo de reenvío del problema de Dynatrace)

  • Las métricas de rendimiento de Nagios están vinculadas a dispositivos personalizados que representan el host de Nagios, pero no se muestran en la pantalla del dispositivo personalizado. Las métricas de rendimiento se pueden mostrar a través del explorador de datos o en el tablero.

Notas de Lanzamientos

1.18

  • Métricas de rendimiento de Nagios para la entidad host de Dynatrace

1.17

  • Corrección de errores sobre la información de reconocimiento

1.16

  • API v2 utilizada para la ingestión de eventos

  • Recopilación de datos de rendimiento de Nagios

1.15

  • enlaces URL correctos desglosados ​​para Nagios Core y Nagios XI

1.14

  • Mejoras en el registro de depuración

  • Instrumentación automática Dynatrace

  • Se corrigió un error sin un nodo existente en el caché

1.13

  • A partir de Dynatrace ActiveGate versión 1.231, Extension Framework se actualizó de Python 3.6 a Python 3.8

1.12

  • El host de Nagios, miembro de varios grupos de host, provocó la creación de dispositivos personalizados duplicados en el lado de Dynatrace. Ahora solo se crea un dispositivo personalizado en el primer grupo de dispositivos personalizados donde está presente un host.

1.11

  • Evento de cierre
    Los problemas en Dynatrace se cierran al menos un minuto después de que la extensión detecta que el problema se ha resuelto en Nagios si Use Events API está habilitado en la configuración de la extensión.

1.10

  • Supresión de eventos
    Nivel de supresión agregado en el mapeo de severidad para permitir ignorar el estado de Nagios por severidad. Para ignorar gravedades específicas, por ejemplo, Advertencia, establezca la asignación de gravedad en Suprimir en la interfaz de usuario de la extensión.

  • Permitir o deshabilitar la combinación de problemas de Davis
    Establézcalo en false para forzar la creación de un nuevo problema en Dynatrace para cada problema de Nagios.

  • Rest API es la opción predeterminada para enviar eventos a Dynatrace.
    Esto permite deshabilitar la combinación de problemas.

1.9

  • Un nuevo modelo de licencia implementado

Descargas

ArchivoModificado
 

Archivo ZIP custom.remote.python.nagios-1.12.zip Versión de ActiveGate anterior a la 1.231

22 de marzo de 2022 por Bohdan Špes
 

Archivo ZIP custom.remote.python.nagios-1.18.zip ActiveGate versión 1.231 y superior

17 de marzo de 2023 por Bohdan Špes
 
Recuerde que las versiones se iran actualizando por lo que es importante que revise posteriomente la siguiente fuente: 

Fuente: Dynatrace

Si te ha gustado, ¡compártelo con tus amigos!

Scroll al inicio

Portal de Clientes