Rittal CMC-III per Icinga 2 überwachen
Es gibt viele Wege, Dinge in Icinga 2 zu überwachen; ich wollte unsere Rittal CMC-III LCPs ins Monitoring aufnehmen, aber das erwies sich als gar nicht so einfach: die Plugins, die ich auf Nagios Exchange entdeckte, funktionierten alle entweder nur teilweise oder gleich überhaupt nicht. Wie ich die Fragestellung für mich löse, zeige ich dir hier.
Ich habe kein eigenes Plugin geschrieben, sondern behelfe mir mit Bordmitteln – namentlich dem üblichen check_snmp
. Per object CheckCommand
definiere ich mit einen Aufruf, der konkret meinen Bedürfnissen angepasst ist und den ich für alle Abfragen verwenden kann. Die Abfragen ihrerseits laufen via SNMPv3, das logischerweise zuvor im Rittal-Webinterface aktiviert werden muss. Mit vars.rittal_warn
wird der Schwellenwert definiert, ab welchem der Service auf WARNING
gehen soll, mit vars.rittal_crit
analog der für CRITICAL
. Wichtig auch zu beachten: sollen mehrere Werte abgeprüft werden – im Beispiel ist das bei den Lüftern der Fall – so müssen sowohl die OIDs als auch die Schwellenwerte als Array übergeben werden.
Meine Definition für CheckCommand, die HostGroup und das Host-Template habe ich dir in in der Datei rittal.conf
zusammengefasst; der Host lcp-example
und all seine Service-Checks sind in der Datei lcp-example.conf
enthalten.
Der leicht gewöhnungsbedürftige Part an der Sache ist, dass die SNMP-Abfragen für die Temperaturen Zehntelgrad-Werte zurückliefern; die 143 bei der water-in-temperature
steht also für 14,3°C. Das ist Geschmackssache und sicherlich etwas, das sich scripten ließe – mir ist es den Aufwand lediglich nicht wert ;-) Insbesondere im Zusammenspiel mit den Graphen, die ich zeichnen lasse, lassen sich Ausreißer sehr zeitnah entdecken und Fehlerquellen eingrenzen. Wie überwachst du solche Dinge? Wie immer freue ich mich über Denkanstöße und Kommentare!
Hintergrundbild: 1505x 876px, Bild genauer anschauen – © Marianne Spiller – Alle Rechte vorbehalten