Solved

All hosts and services Status in the top counter and the monitoring page UNKNOWN every few minutes

  • 27 October 2022
  • 1 reply
  • 691 views

Badge +5

Eric here,

I did a fresh install of Centreon 21.10.8, with a Central and Database server.

Upon adding servers to be monitored, I notice that the status of hosts and services go to UNKNOWN for a few seconds (about 5s to 10s) every few minutes. In the monitoring views as well, the status of hosts and services go to UNKNOWN for a few seconds (about 5s to 10s) every few minutes.

However the real status of the servers is unchanged, and checks on the command line from Central poller are OK.

 

 

 

What I have tried:

  1. Test Network Performance: I tried to see what is going on in the browser; I can see a lot of ajax/xhr requests from the browser to the server. The execution time of these requests in the browser does not seem to be long (100ms to 200ms for the top counter statuses and 1s to 2s for the monitoring views). I tried the same requests via curl in the cli on the Central server and I get the same execution times.
  2. Modifiy Refresh Settings: I tried changing the settings Administration  >  Setting >  Centreon web > Statistics page Refresh Interval from 15s to 47s and Administration  >  Setting >  Centreon web > Monitoring page Refresh Interval from 15s to 73s

I also noticed their is a javascript called vendor.2d6b7428.js that makes a large number of hosts and services status requests (once every 2s) right after the first status request initiated by the Web Page itself. I do not know what that script is.

 

Thanks in advance

--

OS: Redhat 8

Centreon Version: Centreon 21.10.8

Browser: Firefox 106.0.1

 

Steps to reproduce:

Simply open the browser on a monitoring view and observe for a few minutes.

 

 

Bonjour Team,

J'ai un soucis sur une nouvelle installation de Centreon 21.10.8; dans l'interface Web, le status des hôtes et services dans la bar de status et dans l'interface de monitoring passe en INCONNU pendant une dizaine de seconde de façon aléatoire

 

Le statut réel des services et hôtes ne change pas et les checks en ligne de commande sont OK.

 

 

Ce que j'ai tenté:

1. Test de performance réseau: Dans le navigateur j'observe que l'ensemble des statut est recolté via des requêtes de type ajax/xhr; la durée de ces requêtes n'est pas longue (100ms à 200ms pour la bar de status and 1s à 2s pour les vues de supervision): Jùqi tenté ces même requêtes en ligne de commande sur le Central et les performances sont similaires.

2. J'ai modifié les intervalles d'exéction des requêtes ( Administration  >  Paramètres  >  Centreon web > Intervalle de rafraîchissement pour la page des statistiques   &   Administration  >  Paramètres  >  Centreon web > Intervalle de rafraîchissement pour la page de supervision). Le même comportement se reproduit avec la même fréquence.

 

J'ai remarqué aussi qu'il y a un script vendor.2d6b7428.js qui lance plusieurs fois les requêtes de demande de statut des hôtes et services, environ une fois chaque 2s) juste après la première requête faite par page web elle-même. Il contribue peut-être au soucis mais je ne sais pas dire pour l'instant.

 

Si vous avez quelques pistes que ce soit, je suis tout ouis.

 

merci d'avance.

--

OS: Redhat 8

Version Centreon: Centreon 21.10.8

Navigateur: Firefox 106.0.1

 

Étape pour reproduire:

Simplement ouvrir une vue de supervision et observer.

 

 

icon

Best answer by uneric1 30 October 2022, 18:16

View original

1 reply

Badge +5

A solution was found in github issue #5609 ; the solution consisted of setting the parameter Instance timeout (Configuration > Pollers > Broker configuration > Output > Instance timeout OR “instance_timeout” in /etc/centreon-broker/central-broker.json) to it's default value. The value previously set by my team was 20 seconds, which caused a race condition between the freshness verification task, and the refresh interval for resource statuses, resulting in the flapping statuses.

Additional information for future readers:

  • The "instance_timeout" (Configuration > Pollers > Broker configuration > Output > Instance timeout) defines a freshness time for the statuses in the GUI; passed that interval, statuses are considered expired and shown as UNKNOWN until refreshed by a routine call to the API. Default value is 300s.
  • The "monitoring_default_refresh_interval" (Administration > Parameters > Centreon UI > Refresh Properties) defines an interval of time after which a query will be made to API to update the status of resources. Default value is 15s.

Reply