Systemüberwachung mit Profilen

Folgende Komponenten können verwendet werden, um Profile zur automatisierten Systemüberwachung zu erstellen.

Siehe allgemein auch den Abschnitt Konzepte zur Sicherung eines stabilen Betriebs.


Beispiel-Profile


Fehler des Reorganisationslaufs erkennen


Der Reorganisationslauf (zu finden im CronJobService unter dem Namen DW_REORGANISATIONTHREAD) löscht täglich (per Default um 03:00 Uhr) die veralteten Log-Einträge aus der Tabelle dw_log und schreibt den systemweiten permanenten Wert LastReorganisationDuration. Format: <Startzeitpunkt in ms seit 01.01.1970>-<Endzeitpunkt in ms seit 01.01.1970>. Die Lebensdauer des permanenten Wertes ist 36 Stunden. Hinweis: Auf einem Load-Balance-System wird der Wert nur auf dem Node Controller geschrieben.

Ausgelesen werden kann dieser Wert mit der Funktion get permanent(a, b). Hinweis: Diese Information (in anderer Form) kann auch über die Monitoring-Webseite ausgelesen werden.

Wenn der Reorganisationslauf startet, wird der Startzeitpunkt eingetragen, aber für den Endzeitpunkt der Wert 0. Am Ende des Reorganisationslaufs wird der Startzeitpunkt und der Endzeitpunkt eingetragen. Man kann also erkennen, ob der Reorganisationslauf beendet wurde, denn wenn nicht (läuft noch), dann ist der Endwert 0.

Man kann zudem erkennen, ob der Reorganisationslauf innerhalb der letzten 36 Stunden gelaufen ist, denn wenn nicht, dann ist der systemweite permanente Wert LastReorganisationDuration leer.

Desweitern kann bei beendetem Lauf die Dauer (Differenz in ms) bestimmt und bei Überschreiten eines definierten Schwellwertes ein Alarm ausgelöst werden.

Im folgenden Profil finden Sie eine beispielhafte Implementierung. Das Profil muss nach dem Importieren aktiv gesetzt werden und die E-Mail-Parameter im Antwortweg müssen noch angepasst werden: Profile-CheckLastReorganisation.pak