
Als System- oder Netzwerk-Administrator ist man sprichwörtlich blind ohne ein Monitoring-System im Netzwerk, welches über den gesundheitlichen Stand aller Server- und Netzwerkkomponenten informiert. Die Informationen, welche ein solches System liefern kann, sind schier unendlich. Am wichtigsten sind Daten zur aktuellen Auslastung, Status von Diensten und Informationen über die Hardware (Festplatten, Ventilatoren etc.). Für all diese überprüften Quellen, sprich Dienste, können Schwellwerte gesetzt werden. Wird ein solcher überschritten, können entsprechende Fachkräfte zum Beispiel über SMS informiert werden.
Ein solches Monitoring-System kann diese Daten über die Zeit hinweg aufzeichnen und technisch strategische Entscheide fallen einfacher. Zum Beispiel kann eine voraussichtliche Lebensdauer über den Daumen hinweg bestimmt werden. Als Provider kann man den Kunden Informationen über seine Systeme und deren Status zur Verfügung stellen. Ebenfalls können die Pikett-Techniker schneller Probleme feststellen und reagieren.
Auf dem Markt gibt es Zahlreiche Monitoring-Lösungen. Viele kosten nicht wenig Geld und passen meist super in Netzwerke die aus einem Guss sind. Arbeitet man jedoch in einem heterogenen Netzwerk mit unterschiedlichen Windows- und Unix/Linux-Systemen, wird es schon schwieriger. Netzwerkbedingt können vielleicht auch nicht alle Monitoring-Protokolle, wie zum Beispiel SNMP, zugelassen werden.
Sucht man etwas im Internet nach Monitoring-Lösungen stösst man bald auf «Nagios». Nagios ist gratis und äusserst mächtig. Da es diese Projekt schon einige Zeit gibt und die Entwicklung der Software mittlerweile in eine Sackgasse geraten ist, wurde das Projekt abgespalten (geforkt) wobei der Quellcode kopiert wurde und als neues eigenständiges Projekt weitergeführt wird. Einiges moderner und einfacher steht «Icinga» immer wie mehr in den Server-Räumen und unterstützt alle Administratoren bei ihrer täglichen Arbeit.
Icinga ist noch sehr jung, läuft aber bei meinen ersten Tests bereits äusserst stabil! Die etwas kompliziertere, textdateienbasierte, Konfiguration schafft aber viel Spielraum für Automatismen. Das heisst die Firmen-Datenbank, mit allen Informationen über System und Dienste, kann automatisch abgegriffen und entsprechende Konfigurationen erstellt werden. Erste Tests waren sehr erfolgreich und es werden Überlegungen angestellt bald mit Icinga produktiv zu gehen und das aktuelle Monitoring abzulösen. Durch die grosse Flexibilität sind Erweiterungen äusserst schnell auf die Beine gestellt. Somit wird Icinga bei der Genotec nicht nur über SMS und E-Mail notifiziert, Meldungen werden auch über Prowl direkt an iPhones geschickt, es werden automatisch Tracker-Items im internen Auftragssystem erfasst für die Dokumention des Ausfalls. Die Möglichkeiten sind nahezu unbegrenzt! Benachrichtigungen über Twitter implementieren kostet fünf Minuten Arbeit.
Ein solches integriertes System komplett auf die Beine zu stellen, ist eine spezielle Herausforderung! Alle Welten, die in sich so weit auseinander liegen, treffen aufeinander und werden auf einen gemeinsamen Nenner gebracht. Vermutlich wird die Genotec AG der erste Provider sein, der auf Icinga setzen wird… Ich persönlich bin von diesem Weg überzeugt und freue mich über Twitter und Blog über den weiteren Verlauf dieses internen Projekts zu informieren.
Die über Twitter geknüpften Kontakte mit den Entwicklern von Icinga sind toll! Wir und Icinga freuen uns auf den Abschluss dieser beiden Projekte, der Live-Schaltung unserer Instanz und dem produktiven Release von Icinga. Ebenfalls sind wir von unserer Zusammenarbeit überzeugt und sind uns sicher, dass beide Parteien davon profitieren können.
Links:



(9 Stimmen, Durchschnitt: 3.56 von 5)


















Wir setzten ebenfalls seit kurzem auf das Monitoring System Icinga überwachen im den Hardware Health im Moment von über 100 Dell Server produktiv.
Damit wir nicht den Überblick verlieren bei den Konfigurationsdatein, setzten wir das NCONF von der Sunrise ein, welches auch über mehrere Icinga Server skaliert: http://sourceforge.net/apps/mediawiki/nconf Fürs Iphone setzten wir die App “TouchMon” ein, welche genial ist
Wir möchten nun auch ein Netzwerkmonitoring für unsere (Juniper EX3200/4200, SRX5800) mit pnp4nagios realisieren und dem Skript von netways (http://blog.netways.de/2009/06/04/1500-cisco-switches-mit-trafficgraphen-fuer-10000-ports/), habt ihr Erfahrungen damit oder ist sowas in Planung?
Gruss Reto