check_service_load
Dieser Check sucht aus der Prozessliste Prozesse heraus, deren Usage >=100% sind.
Diese CPUUsage lässt sich nur indirekt über die CPUZeit ermitteln, weshalb eine Umrechnung erforderlich ist. Dabei können werte >=100% entstehen.
Dies hängt davon ab wie viele Cores ein System hat und ob ein Prozess Threadingfähig ist oder nicht.
Hat ein Prozess eine Load von >=100% über einen längeren Zeitrahmen, so wird ein Alarm generiert.
Dieser Prozess ist dann zu stoppen.
Aber Vorsicht! Es gibt ausnahmen! Aus diesem Grund wird eine Whiltelist zur Verwendung angeboten, in die dann der Servername, der Service und maximal mögliche Load angegeben werden kann. Dieser Service wird dann solange ignoriert, bis auch dieser Wer überschritten wird.
## WHITELIST SERVER,SERVICENAME,LOWERT,UPPERT hostname,i2050,200,200
In diesem Beispiel darf der Prozess i2050 eine minimal und maximale CPULoad von 200% aufweisen.
define service{ use 10min-service,nagiosgraph ; Name of service template to use hostgroup windows-server service_description check_service_load check_command check_nrpe!check_service_load!100!100 contact_groups mail notes_url https://mywiki/check_service_load }