Freitag, 19. Oktober 2018
Twitter Facebook Mister Wong Delicious stumbleupon digg Yahoo

Neueste Technologie für Administratoren

Systembetreuer im Windows-Umfeld brauchen Know-how über die neuesten Entwicklungen. Einsatzbeispiele und Tipps aus der Praxis führen zu mehr Effizienz im täglichen Betrieb. Wir bieten Skript-basierte Lösungen von Windows IT Pro exklusiv im deutschsprachigen Raum für unsere Abonnenten.

Mit Korrelation den Fehlerbehebungsprozess verbessern

Sascha Giese, Senior Sales Engineer EMEA (Quelle: SolarWinds)

Die Fehlerbehebung ist im IT-Bereich die hohe Kunst, die zugrunde liegende Ursache von Problemen im Rechenzentrum ausfindig zu machen. Ja, es hilft tatsächlich, ein Künstler zu sein! Um die Quelle eines Problems zu identifizieren, muss man die zugrunde liegende Ursache sowie die Auswirkungen eines Vorfalls verstehen. Anschließend können IT-Experten mit diesen Informationen arbeiten, um sicherzustellen, dass ähnliche Probleme nicht zukünftig erneut auftreten und die Leistung des Rechenzentrums weiter beeinträchtigen. Es ist ganz einfach: Man löst ein Problem und sorgt dafür, dass es nicht noch einmal passiert.

 

In herkömmlichen IT-Umgebungen mit lokal gehosteten Servern halten sich IT-Experten bei der Fehlerbehebung an die folgenden acht Schritte:

  • Das Problem definieren
  • Alle relevanten Informationen erfassen und analysieren
  • Eine Hypothese zur möglichen Ursache des Problems aufstellen
  • Einen Plan zur Behebung entwickeln
  • Den Plan umsetzen
  • Die Ergebnisse überwachen und den Plan neu erstellen, um die Ergebnisse zu reproduzieren
  • Schritte 2 bis 6 nach Bedarf wiederholen
  • Die zugrunde liegende Ursache bestimmen und zur späteren Verwendung dokumentieren

 

Heutzutage jedoch haben Technologien wie Cloud, Virtualisierung, hybride IT und hyperkonvergente Infrastrukturen unsere IT-Umgebungen grundlegend verändert und zahlreiche neue Faktoren entstehen lassen. Die Fehlerbehebung in diesen verteilten Systemen wird somit kritischer und deutlich komplizierter als je zuvor.

 

IT-Experten haben gelernt, unterschiedliche Ebenen gleichzeitig zu betrachten, um die zugrunde liegende Ursache von Problemen zu finden. Jetzt fehlen ihnen allerdings die nötige Transparenz und die Zeit, um alle Schritte für jedes Problem durchzuführen. Bei der Arbeit mit Cloud-Dienstanbietern (CSPs) erweist es sich für IT-Experten als schwierig, Zugriff auf bestimmte Infrastrukturbereiche zu erhalten, die nun extern gehostet werden. Wenn zu viele Dinge gleichzeitig passieren, werden Probleme so schnell wie möglich behoben, ohne dass die nötige Ursachenanalyse zur Verhinderung zukünftiger Probleme durchgeführt wird. Das ist so, als würde man einen Brand löschen, ohne herauszufinden, wie er auftreten konnte!

Der Mehrwert der Korrelation

Je komplexer die Fehlerbehebung wird, desto wertvoller wird die Korrelation als zusätzliche Methode zum Aufspüren von Fehlerursachen. Bei der Korrelation kommt das künstlerische Element ins Spiel: Variablen werden verbunden, um auszutesten, ob sie eine Auswirkung auf die Ursache von Leistungsproblemen oder Vorfällen haben. Erfahrene IT-Experten können sich wahrscheinlich denken, was los ist, aber sie brauchen Daten, um ihren Verdacht zu untermauern.

Mit der Korrelation können sie diverse wichtige Messwerte über einen bestimmten Zeitraum hinweg nachverfolgen und vergleichen, beispielsweise Netzwerk- und Anwendungsleistungszähler. Die Ergebnisse ermöglichen es ihnen, die Ursache eines Problems festzustellen und zu beheben. So kann beispielsweise die Korrelation von Netzwerklatenz- und Bandbreitendaten mit der Auslastung virtueller Maschinen sowie anwendungsspezifischen Daten dazu beitragen, die Ursache von Problemen mit der Leistung verteilter Anwendungen zu identifizieren. Schließlich sind nicht immer Fehler im Netzwerk an allem schuld.

Mit der richtigen Methode und den passenden Tools kann die Fehlerbehebung mithilfe der Korrelation sehr viel effizienter und wirkungsvoller gestaltet werden. Natürlich garantiert diese Vorgehensweise nicht, dass Sie sofort die Ursache des Problems ermitteln, doch sie kann den Prozess deutlich beschleunigen. Mit den folgenden Tipps wird die Korrelation so genau wie möglich:

  • Die Überwachung diszipliniert angehen: Eine effektive Korrelation erfordert zuallererst ein hohes Maß an Fachwissen und ein hohes Maß an Vertrautheit mit der Umgebung. Am besten erreicht man dies durch die ordnungsgemäße Überwachung des Rechenzentrums und des gesamten Anwendungsstapels.
  • Die richtigen Tools nutzen: Um den ganzen Prozess zu vereinfachen, sind automatisierte Überwachungstools empfehlenswert, die Messdaten aus Zeitreihen und Verlaufs-Leistungsmessdaten in einem zentralen Dashboard zusammenfassen. So können Daten zwischen fehlerverdächtigen Elementen visualisiert und korreliert werden, was die Problembehebung in der gesamten IT-Umgebung erheblich verbessert.
  • Zusammenarbeit ist entscheidend: Die Zusammenarbeit mit externen Cloud-Dienstanbietern ist mittlerweile ein wichtiger Bestandteil der Arbeit von IT-Experten. Gute Geschäftsbeziehungen mit Dienstanbietern verbessern die Transparenz einer Umgebung und tragen dazu bei, dass Probleme sachgerecht angegangen und behoben werden können. Daher sollten sich IT-Experten unbedingt darauf konzentrieren, ihre Softskills auszubauen, um für eine effektive und erfolgreiche Zusammenarbeit zu sorgen.
  • Die acht Schritte zur Fehlerbehebung nutzen: Auch wenn die oben genannten acht Schritte als eigenständige Methode ihre Grenzen haben, stellen sie dennoch die Grundprinzipien der Fehlerbehebung dar und können universell eingesetzt werden. Wenn sie zusammen mit der Korrelation angewendet werden, tragen diese Schritte entscheidend dazu bei, die Herausforderungen heutiger IT-Umgebungen zu meistern.

Fehlerbehebung, die heutigen Anforderungen gerecht wird

Die Fehlerbehebung ist zwar nicht mehr so unkompliziert wie früher, doch mit ein paar Anpassungen kann sie auch heute noch effektiv sein. In verteilten Umgebungen kann die Korrelation zu einem zentralen Bestandteil des Fehlerbehebungsprozesses werden. Auf diese Weise gewinnen IT-Experten die nötige Zeit und Effizienz, um die Betriebszeit ihrer Systeme erfolgreich aufrechtzuerhalten und unnötige Hürden zu vermeiden.

Sascha Giese, Senior Sales Engineer EMEA

Anmelden
Anmelden