|
|
Forderungen an die Messung:
Für eine explizite Verfügbarkeitsmessung stellen wir daher folgenden Forderungskatalog auf:
- 1. Die Messung soll objektiv sein
Ausfallzeiten sollten weder durch den vom Ausfall genervten IT-Nutzer noch durch den mit der Reparatur beauftragten Mitarbeiter des Providers protokolliert werden. Die subjektive Sicht auf den Fehler verfälscht die Daten.
- 2. Die Messung soll detailliert sein
Eine genaue Identifikation der Fehlerursachen ist nur möglich, wenn nicht nur der Systemausfall, sondern auch der Komponentenausfall gemessen wird.
- 3. Die Messung soll lückenlos sein
Die Messung muss mit einer angemessenen sampling-Rate erfolgen. Das Messintervall muss einerseits so klein gewählt werden, dass relativ kurze Ausfälle (z.B. ein schneller Server-Reboot) nicht übersehen werden können. Andererseits darf auch nicht so fein gemessen werden, dass die Auswertung in einer Datenflut untergeht oder eine zu hohe Belastung der für die Messung zur Verfügung stehenden Kapazitäten entsteht.
- 4. Die Messung soll automatisiert ablaufen
Eine manuelle Erfassung von Ausfällen wird zumeist subjektiv sein, da die Erfassung mit großer Wahrscheinlichkeit doch wieder von den Mitarbeitern erledigt wird, die entweder unter dem Ausfall leiden oder ihn beheben (siehe 1 ). Auch 3) wird sich kaum manuell umsetzen lassen.
- 5. Die Messung soll möglichst direkt sein
Die Komponenten sollen nicht mittels einer anderen, ebenfalls für die Messung relevanten Komponente gemessen werden. Man denke an den obigen Netzwerk-ping zur Überprüfung eines Servers, der allerdings in erster Linie Netzausfälle messen wird.
Besser wäre eine direkte Aufzeichnung von Server-Lebenszeichen auf dem Server selber. Remote-Messmethoden sind immer von der Verfügbarkeit der Kommunikationswege abhängig.
- 6. Die Messung muss sinnvoll ausgewertet werden
Die Auswertung muss nach einem ähnlichen Modell erfolgen, wie man es bei der Modellierung der Zuverlässigkeit erstellt hat. Eine Vielzahl von Messwerten ist noch keine Garantie für eine nachhaltige Aussage.
- 7. Die Auswertung der Messung muss überprüft werden
Selbst die feinste Methodik wird immer Ereignisse als Fehler erfassen, die man ausklammern muss. Man denke an einen durch den IT-Kunden selber verschuldeten Systemfehler oder Ausfälle der Messapparatur selber, die fälschlicherweise als Systemausfälle erfasst werden.
- 8. Die Aufwand für die Messung muss angemessen sein
Es macht sicherlich keinen Sinn, mehr Aufwand in die Messung der Verfügbarkeit zu investieren als in verfügbarkeitserhaltende Maßnahmen.
Erinnert man sich an die Interpretation der Verfügbarkeit als die Wahrscheinlichkeit, das betrachtete System zu einem beliebigen Zeitpunkt funktionstüchtig vorzufinden, so bietet sich auch die Interpretation dieser Messung als eine Kette stochastischer Tests an. Jede Messung wird zu einer Stichprobe mit dem Ziel, mit hinreichend vielen Stichproben die Wahrscheinlichkeit des Ereignisses „System defekt“ festzustellen. Die Situation entspricht dann dem fortwährenden Ziehen von Spielkarten aus einem neuen Spiel, mit dem Ziel nachzuweisen, dass die Wahrscheinlichkeit für eine „böse Kreuz Sieben“ (entspricht dem Ereignis "System defekt") nicht mehr als 1 zu 32 beträgt.
|
|
|