IBM Z DACH - Group home

AIOps for IBM zSystems: Warum sind AIOps und Observability spannende Themen?

  

Wir leben in einer Welt, die sich immer stärker digitalisiert. Diese Entwicklung wurde durch die Pandemie noch beschleunigt: Immer mehr Prozesse und Abläufe können nun online durchgeführt werden, viele neue Applikationen sind entstanden. Immer mehr Daten werden produziert und müssen täglich bewältigt werden.

Alleine mit der schieren Anzahl an Applikationen, Microservices, hybriden Infrastrukturen wächst auch ständig die Komplexität, die den IT Betrieb anspruchsvoll und die Überwachung sowie im Fall einer Betriebsstörung eine Fehlersuche immer schwerer bis unmöglich machen. Die Menge an Informationen, die von das Monitoring und den Apps in realtime zur Verfügung gestellt werden, ist so groß, dass sie nicht wirklich von Menschen gelesen, erfasst und alle relevanten Daten ermittelt werden können.

D.h. wir brauchen Tools, die die verschiedenen Daten aus den verschiedenen Quellen/Bereichen sammeln, überwachen, filtern, Verbindungen darstellen und so den aktuellen Zustand der IT Systeme zeigen und die Fehlersuche erleichtern und beschleunigen. Das alles fällt unter den Begriff „Observability“.  

Hat man eine gute Übersicht und Sichtbarkeit erreicht, bietet es sich an, Analysen und Auswertungen zu verwenden, um zum einen die Apps und zum anderen den IT Operations Bereich zu optimieren und automatisieren. Z.B. die Performance einer App zu überwachen und bei bestimmten Symptomen automatisiert zu reagieren und so einen reibungslosen Ablauf zu gewährleisten. 

Um Zusammenhänge und Auswirkungen von einzelnen Komponenten oder Vorfällen auf das Gesamtsystem zu überblicken und verstehen zu können, werden immer mehr AI Funktionen, MachineLearning(ML) und Data Science auf IT Operations angewendet bzw. Observability-Produkte mit AI Funktionen erweitert und man spricht von AIOps.

Das Ziel ist es, immer früher zu erkennen, wo sich ein mögliches Problem entwickelt könnte und dem so schnell wie möglich entgegenzuwirken, so dass erst gar kein Problem entsteht, wie z.B. bei der intelligenten Anomaly Erkennung. Mit Hilfe von MachineLearning lernt das System, das tägliche, laufende „IT Business“ von unerwarteten, ungewöhnlichen Vorfällen zu unterscheiden und kann entsprechend proaktiv agieren und informieren. 

AIOPs wird also eingesetzt, um schnelle und genaue Entscheidungen zu treffen und die Ausfallsicherheit aufrechtzuerhalten.

IBM unterstützt auf dem Weg, erfolgreich und ausfallsicher eine komplexe IT Landschaft zu betreiben mit diversen Praktiken und Fähigkeiten, die IBM in drei Bereiche unterteilt hat: Erfassen/Erkennen, Entscheiden und Handeln.

Im Bereich „Erfassen/Erkennen“ geht es um die möglichst frühe Identifikation von potenziellen Problemen, idealerweise bevor diese zu einer Störung im Betrieb führen. Dazu zählen Thematiken wie das Monitoring und Überwachen der gesamten Infrastruktur und End-to-End Applikation Performance, Generierung von Warnungen für Vorfälle und Anwendung von Analysen zur Früherkennung von Anomalien. Hier finden sich u.a. Produkte wie IBM Z Monitoring Suite , IBM Observability by Instana APM for z/OS®  und IBM Z Anomaly Analytics with Watson.

Der Bereich „Entscheiden“ konzentriert sich auf die Fähigkeiten, schnell ein Problem einzugrenzen, die Ursachen zu analysieren und damit sich für die richtigen Maßnahmen entscheiden zu können. Neben anderen zahlreichen Praktiken und Technologien kommt hier die künstliche Intelligenz zur Unterstützung der Analyse und Entscheidungsfindung zum Einsatz, ob z.B. bei der Log Analyse mit IBM Z Operational Log and Data Analytics oder bei Kapazitätsplanungen mit IBM Z Performance and Capacity Analytics.

Im dritten Bereich liegt der Fokus, darauf dass Teams schnell reagieren und Störungen vorbeugen können. Ein großer Teil davon wird durch Automatisierung erreicht, wie z.B. die Automatisierung von Runbooks, oder die Möglichkeit durch Automatisierung für mehr und mehr Probleme selbstkorrigierende Maßnahmen zu verwenden und dadurch den Bedarf an manuellen Eingriffen zu reduzieren. Ein anderer wichtiger Teil ist die Bereitstellung einer integrierten Orchestrierungs- und Automatisierungslösung für die gesamte Hybrid-Cloud-Infrastruktur. In diesem Bereich findet man u.a. Produkte wie IBM zChatOps & IBM Z Service Automation Suite und IBM Z Advanced Storage Management Suite for z/OS. Einen holistischen Ansatz für proaktives IT Operations Management bietet das CloudPak for Watson AIOps.

Für weitere Informationen oder Fragen rund um das Thema AIOps for IBM zSystems kommen Sie gerne auf uns zu. Wir vom IBM zStack Team diskutieren gerne mit Ihnen über mögliche Schritte, wie Sie Ihre zSystems IT Operations einfacher und proaktiver gestalten können.

Weitere Informationen: https://www.ibm.com/z/aiops