Infrastrukturen und Anwendungsumgebungen werden immer komplexer. Dies erfordert, dass man alles im Auge behält und sicherstellt, dass die Reaktionen auf Ausfälle leicht automatisiert werden können. In diesem Artikel werden wir einige Lösungen vorstellen, die eine solche globale Sicht auf alle unsere Elemente ermöglichen, sei es physisch oder unter cloud. Review von Trendprodukten.
Ein Auge....auf alles!
Beim Monitoring oder der Überwachung von Infrastrukturen geht es darum, das reibungslose Funktionieren von IT-Lösungen in einer Unternehmens- oder Betriebsumgebung kontrollieren zu können. Um diese Art von Überwachung durchzuführen, gibt es in der IT-Welt Standards (sowohl in den Netzwerkprotokollen als auch in den Betriebssystemen). Diese Standards werden es uns ermöglichen, Nutzungsdaten in Echtzeit zu sammeln und Administratoren über den allgemeinen Zustand benachrichtigen zu können. Anschließend werden wir automatische Regeln aufstellen, um bekannte oder wiederkehrende Probleme zu lösen, um die Arbeit der zentralen Verwaltung zu erleichtern.

Zunächst müssen Sie verstehen, wie die Überwachungsaktionen auf den Quellelementen (d. h. auf Rechnern oder Anwendungen) definiert werden. Jedes zu überwachende Element verfügt über einen Zugang über ein Protokoll (z. B. SNMP oder WMI) und mit einer Identitätsverwaltung über Administrationsrechte (oder auch Administrationsprofil genannt). SNMP beispielsweise ermöglicht es, über eine Austauschdefinition entweder einen Status zu lesen oder mit dem Objekt, das man überwacht, zu interagieren.
Man muss diese Netzwerkprotokolle, die der Überwachung gewidmet sind, als Mittel zum Zugriff auf Informationen über den Betriebszustand betrachten. Wenn zum Beispiel ein Rechner nicht mehr im Netzwerk vorhanden ist (oder als ausgeschaltet gilt), wird man versuchen, seine Anwesenheit zu testen (PING und ICMP-Antwort), und je nach Ergebnis die Situation dem Administrator der Umgebung mitteilen. Man kann auch Windows über WMI befragen und es mit dem richtigen Benutzer und den nötigen Rechten bitten, uns mitzuteilen, ob eine bestimmte Anwendung oder ein bestimmter Dienst läuft oder gestoppt ist. Alle diese Situationen können durch verschiedene Mittel (Protokolle) oder durch die Installation von Agenten (spezielle Mini-Steuerungsprogramme), die entweder in Echtzeit oder zu geplanten Zeitpunkten weiterleiten, angewendet und überprüft werden.
In diesem Bereich gibt es zahlreiche Tools. Es gibt verschiedene Websites, auf denen diese Tools aufgelistet sind, z. B.: https://www.monitoring-fr.org
Beginnen wir mit einer Reihe von Tools. Das erste ist PRTG. Die Firma Paessler, die diese Lösung anbietet, hat eine Überwachungsplattform entwickelt, die unter Windows läuft. Es ist möglich, über Standardverwaltungsprotokolle sowohl physische Komponenten als auch Anwendungen aller Art zu verwalten.
Um sich einen Eindruck zu verschaffen, finden Sie hier ein Einführungsvideo:
In der gleichen Tendenz unter Windows-Servern gibt es auch die Lösung von ManageEngine OpManager. Das Produkt gibt es in verschiedenen Versionen (kostenlos für das Basismodul und kostenpflichtige Versionen für erweiterten Support mit zusätzlichen Funktionen).
Hier ist ein Video (auf Englisch), um das Produkt vorzustellen:
Ebenfalls sehr beliebt sind die Lösungen von SolarWinds, die ein sehr weitreichendes Überwachungsmanagement mit einer angabenreichen Oberfläche bieten.
Einführungsvideo (auf Englisch):
Der Hauptnachteil dieser Lösungen besteht darin, dass man einen Windows-Server für die Überwachungsaufgabe abstellen muss (was je nach Umgebung als umständliche Lösung angesehen werden kann). Dies führt dazu, dass wir Produkte einsetzen oder in Betracht ziehen, die in Containersystemen funktionieren können.
Zabbix ist ein webbasiertes Verwaltungssystem, das Netzwerkanalysen durchführen kann, um herauszufinden, welche Elemente überwacht werden müssen, und das auch die Möglichkeit bietet, sich mit APIs zu verbinden, um die Funktionsweise von Anwendungen (On-Premise oder SaaS) zu analysieren. Hier ist ein Video über die Einrichtung in einem LXC:
Wie Sie sehen, kann die Ersteinrichtung sehr schnell erfolgen und ermöglicht eine zentrale Verwaltung der Lösungen.
In der Open-Source-Welt gibt es eine Vielzahl von Möglichkeiten. Um nur einige zu nennen: Nagios, NetData (beide basieren auf Linux und können wie Zabbix in Containern betrieben werden). Es gibt auch ZenOss oder Centreon, das es auch in kommerziellen Angeboten gibt.
Je nachdem, wie komplex die zu überwachende Infrastruktur ist oder welche Managementregeln Sie einführen möchten, ist der Konfigurationsaufwand größer. Es empfiehlt sich, die Verwaltungsbegriffe zu planen und festzulegen, bevor Sie das geeignete Tool auswählen und sich an die Inbetriebnahme machen.
Es kann auch vorkommen, dass in manchen Fällen mehrere Überwachungswerkzeuge eingesetzt werden müssen, um alle operativen Fälle zu bewältigen. Dies kann manchmal dazu führen, dass man den Überblick verliert. In diesem Fall muss man sich auf sogenannte Informationsaggregatoren für die Überwachung stützen.
Das ist die Aufgabe einer Lösung wie Grafana.
Grafana ermöglicht es, verschiedene Datenquellen gleichzeitig zu verwalten, zu analysieren und erweiterte Dashboards zu erstellen. Außerdem können mit Grafana Fehlerbehebungsprozesse automatisiert oder erweiterte Benachrichtigungen für Administratoren erstellt werden. Hier ist das Video von ihrer Konferenz im Jahr 2019, das die Nutzung der Konsole und die Erstellung von Dashboards in Grafana zeigt:
Zusammengefasst...wird es kontrolliert?
Wie Sie vielleicht festgestellt haben, ist die Anzahl der existierenden Produkte ziemlich groß. Die Schwierigkeit, sich im Dschungel der Lösungsangebote zurechtzufinden, besteht darin, eine klare Vorstellung davon zu haben, was man zu überwachen hat, wie viel Zeit man dafür aufwenden kann und wie man die Wiederherstellungsprozesse im Falle eines Systemausfalls automatisieren möchte. Man nennt dies einen Katastrophenplan oder DRP (Disaster Recovery Plan). Es ist wichtig, sich auf Überwachungstools zu verlassen, um schneller reagieren zu können und Probleme schnell zu erkennen. Die Bedarfsanalyse erfordert die Unterstützung von Fachleuten, die Ihre Situation verstehen, analysieren und die richtigen Alternativen vorschlagen können.
Verfasser: Michel Aguilera
Wir teilen Ihre Herausforderungen, wir begleiten Ihre Veränderungen
Egal, ob Sie eine einfache Frage oder eine Anregung haben, wir stehen Ihnen zur Verfügung, um sie per E-Mail oder Telefon zu beantworten.