check_service_load

check_service_load
check_service_load
check_service_load.zip
2.4 KiB
19 Downloads
Details

Dieser Check sucht aus der Prozessliste Prozesse heraus, deren Usage >=100% sind.
Diese CPUUsage lässt sich nur indirekt über die CPUZeit ermitteln, weshalb eine Umrechnung erforderlich ist. Dabei können werte >=100% entstehen.
Dies hängt davon ab wie viele Cores ein System hat und ob ein Prozess Threadingfähig ist oder nicht.
Hat ein Prozess eine Load von >=100% über einen längeren Zeitrahmen, so wird ein Alarm generiert.

Dieser Prozess ist dann zu stoppen.

Aber Vorsicht! Es gibt ausnahmen! Aus diesem Grund wird eine Whiltelist zur Verwendung angeboten, in die dann der Servername, der Service und maximal mögliche Load angegeben werden kann. Dieser Service wird dann solange ignoriert, bis auch dieser Wer überschritten wird.

## WHITELIST
SERVER,SERVICENAME,LOWERT,UPPERT
hostname,i2050,200,200

In diesem Beispiel darf der Prozess i2050 eine minimal und maximale CPULoad von 200% aufweisen.

define service{
       use                             10min-service,nagiosgraph         ; Name of service template to use
       hostgroup                       windows-server
       service_description             check_service_load
       check_command                   check_nrpe!check_service_load!100!100
       contact_groups                  mail
       notes_url                       https://mywiki/check_service_load
       }