OpenText-Startseite.
Technische Themen

Was bedeutet "Observability" bei IT-Betriebsabläufen?

Illustration von IT-Artikeln mit Schwerpunkt auf einem Laptop

Übersicht

Erfahren Sie, wie Sie die OpenTelemetry-gestützte Beobachtbarkeit nutzen können, um zu modernen Erkenntnissen zu gelangen.

Die Beobachtbarkeit von Unternehmenssystemen ist gegeben, wenn Betreiber, Entwickler und Systemzuverlässigkeitsingenieure (SRE) Veränderungen in der IT-Systemleistung schnell nachvollziehen und darauf reagieren können. Auf der Grundlage eines tiefgreifenden Verständnisses der Kommunikation zwischen Anwendungen und Microservices ermöglicht es Ingenieuren und Administratoren, Fehler und Verlangsamungen sofort zu finden, ohne die kostspieligen und arbeitsintensiven War Rooms, die große Unternehmen plagen. Die gewonnene Geschwindigkeit ist besonders hilfreich, wenn komplexe Anwendungen öffentliche Clouds, eigene Rechenzentren und Prozessoren von Drittanbietern umfassen, was die Identifizierung der Grundursache von Serviceverschlechterungen erschwert.

Advanced Observability unterscheidet sich von der herkömmlichen Überwachung in einem wesentlichen Punkt: Advanced Observability sammelt nicht nur die bei der Überwachung üblichen metrischen Daten, sondern erfasst auch den Transaktionsfluss und die Zeitabläufe und verknüpft sie mit korrelierten Ereignissen und Protokollen, um verwertbare Erkenntnisse zu gewinnen. Diese Erkenntnisse ermöglichen ein umfassenderes Verständnis des System-/Anwendungsverhaltens und helfen bei der Erkennung von Problemen, die sonst nur schwer zu erkennen wären.

Beobachtbarkeit ist kein neuer Begriff. Der 1960 im Zusammenhang mit der Kontrolltheorie entstandene Begriff der Beobachtbarkeit hat inzwischen auch in anderen Disziplinen Einzug gehalten, darunter in der IT. Aufgrund der Komplexität der hybriden Cloud ist "Cloud Observability" zu einem beliebten Begriff geworden.

Beobachtbarkeit

Was ist der Unterschied zwischen Überwachung und Beobachtbarkeit?

Beobachtbarkeit wird oft mit Überwachung verwechselt, aber die beiden sind recht unterschiedlich.

Die Überwachung bezieht sich auf die Beobachtung der Leistung eines Systems im Laufe der Zeit. Überwachungswerkzeuge sammeln in der Regel Leistungsdaten aus bestimmten Quellen, z. B. aus Protokolldateien oder Leistungszählern. Die Überwachung kann Ihnen zum Beispiel sagen, wie viele Benutzer im System sind, aber sie sagt Ihnen nicht proaktiv, wenn Sie eine Kapazitätsgrenze erreichen. Die Überwachung ist ein reaktiver Ansatz, der voraussetzt, dass Sie im Voraus wissen, was zu überwachen ist. Eine der Einschränkungen besteht darin, dass es sich auf die Erfassung von Metriken zu einem bestimmten Zeitpunkt konzentriert.

Die Beobachtbarkeit hat eine umfassendere Funktion als die Überwachung. Observability-Tools sammeln Daten aus allen verfügbaren Quellen, z. B. aus Protokollen, Leistungszählern und Anwendungscode. Dann analysieren sie diese Daten, um einen Einblick in das Innenleben eines Systems zu erhalten und sein Verhalten zu verstehen. Diese Daten können genutzt werden, um Probleme zu erkennen, bevor sie zu Problemen führen, indem sie Trends aufzeigen und Aufschluss darüber geben, wie das System verbessert werden kann.

Die Beobachtbarkeit ist das Ergebnis einer umfassenden Überwachung und einer Analyse auf Transaktionsebene, so wie das Sehen das Ergebnis der Augen und der visuellen Verarbeitung im Gehirn ist. OpenText™ Observability-Lösungen können in Verbindung mit der OpenText AIOps-Plattform sowohl die Observability-Einsichten als auch die umfassenden Event-, Systemmanagement- und Remediation-Funktionen liefern, die für die Wartung komplexer IT-Services erforderlich sind.


Welche Datentypen sind für die Beobachtbarkeit wichtig?

Es gibt zwei Denkansätze für Observabilitätslösungen:

  1. MELT. Dieses Akronym kennzeichnet die Arten von Daten, die im Rahmen der Beobachtbarkeit erhoben werden.
    • Metriken: Hierbei handelt es sich um die klassische Überwachung, d. h. die Messung von Aktivitäten im Zeitverlauf, von Reaktionszeiten im Mikrosekundenbereich bis hin zu vollständigen synthetischen Transaktionen.
    • Ereignisse: Die vom System erzeugten Ereignisse, die während des Messzeitraums auftreten.
    • Protokolle: Unstrukturierte Daten, die Aufschluss über die Systemaktivitäten geben.
    • Traces: Eine aufgezeichnete visuelle Darstellung der gesamten Reise einer Anfrage, während sie die Knoten eines verteilten Systems durchläuft, die eine zeitliche Aufschlüsselung mit Kontext über die Verbindung zwischen den Diensten liefert.
  2. Goldene Signale. Goldene Signale wurden von Google als Teil des SRE-Handbuchs populär gemacht und stellen einen eher leistungsorientierten Ansatz zur Problemlösung dar.
    • Latenzzeit: Die Zeit, die Ihre Anwendung benötigt, um eine Anfrage zu bearbeiten.
    • Verkehr: Die Anzahl der Anfragen, die Ihr System erhält.
    • Fehler: Die Rate der fehlgeschlagenen Anfragen.
    • Sättigung: Der Status der Kapazität innerhalb Ihres Dienstes.

Es ist zu beachten, dass die gesammelten Daten erhebliche Ähnlichkeiten aufweisen, aber je nach Kontext (Typ vs. Leistung) unterschiedlich beschrieben werden. Unabhängig davon, ob Sie MELT oder goldene Signale verwenden, besteht der Schlüssel darin, sich auf anomale Ergebnisse zu konzentrieren, um Probleme zu erkennen und festzustellen, wo sie auftreten. Im nächsten Abschnitt mit dem Titel Wie hilft OpenTelemetry bei der Beobachtbarkeit? erfahren Sie mehr darüber, wie OpenTelemetry diese Daten nutzt, um eine außergewöhnliche Beobachtbarkeit zu ermöglichen.


Wie trägt OpenTelemetry zur Beobachtbarkeit bei?

OpenTelemetry ist ein Open-Source-Projekt, das von der Cloud Native Computing Foundation verwaltet wird. Es bietet ein herstellerneutrales Instrumentierungsprotokoll zur Erfassung von Telemetriedaten, einschließlich Metriken, Traces und Protokollen. Das Protokoll funktioniert in allen Programmiersprachen und auf allen Plattformen und ermöglicht es Ihnen, alle Daten in einer einzigen Ansicht zu analysieren. Dieser standardisierte Ansatz rationalisiert die Instrumentierung bei gleichzeitiger Definition und Korrelation der Telemetriedaten. Der Hauptvorteil von OpenTelemetry ist seine Portabilität, die es Entwicklern und der zentralen IT-Abteilung ermöglicht, die für ihre Aufgaben am besten geeigneten Toolsets auszuwählen.


Beobachtbarkeit und IT-Betrieb

IT Operations überwacht in der Regel die Rechenzentren, um die Betriebszeit und Leistung der Dienste aufrechtzuerhalten. Wenn Probleme auftreten, die nicht mit Hardware- oder Softwarefehlern zusammenhängen, öffnet IT Operations Tickets für die Entwickler, damit diese die zugrunde liegenden Probleme mithilfe von Beobachtungstools untersuchen können. Entwickler führen in Promotheus oft komplexe Abfragen durch, erstellen Datenströme zur Analyse und greifen auf Protokolle zu, um Fehler zu untersuchen.

Mit der Einführung von OpenTelemetry können IT-Betriebsteams die Datenerfassung und -analyse mit Traces vereinfachen, die korrelierte Metriken und Protokolle enthalten. Die Korrelationsmöglichkeiten des OpenTelemetry-Protokolls machen es für die Betreiber überflüssig, komplexe Programmiersprachen wie PromQL zu verwenden oder Protokollabfragen durchzuführen, um Observabilitätsdaten zu initiieren und zu verstehen.

Stattdessen können sie mit einem Mausklick auf korrelierte Daten zugreifen. Die Operatoren können zwar keine Code-Updates vorschlagen, aber sie können Leistungsengpässe identifizieren und Tickets direkt an die verantwortliche Partei weiterleiten - egal, ob es sich dabei um einen internen Entwickler oder einen Drittanbieter handelt, dessen Anwendung sich verlangsamt hat.


Was sind die Vorteile der Beobachtbarkeit?

Unternehmen können durch diese wichtigen Vorteile eine vollständige IT-Überwachung erreichen:

  • Verbesserte Qualität: Je mehr Sie beobachten, desto mehr kritische Punkte können Sie finden, was zu besseren Produkten führt, die die Erwartungen der Interessengruppen und Kunden erfüllen.
  • Gesteigerte Effizienz: Durch die Beobachtbarkeit können Unternehmen Systeme und Software schnell debuggen.
  • Geringere Kosten: Lange Debugging-Phasen kosten viel Zeit und Geld, was durch die Beobachtbarkeit auf lange Sicht reduziert werden kann.
  • Schnellere Markteinführung: Wenn Sie die Beobachtungsmöglichkeiten nutzen, können Sie IT-Dienste wie neue/aktualisierte Anwendungen termingerecht bereitstellen.
  • Überwachung der Anwendungsleistung: Umfassende Beobachtungsmöglichkeiten ermöglichen es Unternehmen, kritische Softwareprobleme sofort zu diagnostizieren und Leistungskennzahlen zu verbessern.
  • Hilfreiche Geschäftsanalysen: Da es sich bei der Beobachtung um einen datenintensiven Prozess handelt, können Sie mehr über wichtige Leistungsindikatoren (KPIs) erfahren, z. B. über die Kapitalrendite (ROI) und Ihr Endergebnis.
  • Außergewöhnliche Benutzerfreundlichkeit: Die Erkennung von Problemen, bevor sie zu Problemen werden, führt zu einer außergewöhnlichen Benutzererfahrung, die den Ruf und die Rentabilität eines Unternehmens verbessern kann.
  • Infrastruktur-, Cloud- und Kubernetes-Überwachung: Observability kann helfen, Softwareprobleme in Infrastruktur- und Betriebsteams (I&O), Kubernetes-Umgebungen und in der Cloud zu erkennen. Das Ergebnis ist eine verbesserte Abdeckung aller Komponenten, die eine erfolgreiche Bewerbung ausmachen.
  • Verbesserte Ursachenanalyse: Die Kombination von Metriken, Protokollen und Spuren ermöglicht eine schnellere und genauere Ursachenanalyse. Teams können Daten über verschiedene Systeme und Dienste hinweg schnell korrelieren, um die Ursache von Problemen zu ermitteln.
  • Verbesserte Zusammenarbeit: Die Beobachtbarkeit schafft ein gemeinsames Verständnis des Systemverhaltens zwischen Entwicklungs-, Betriebs- und Geschäftsteams. Diese gemeinsame Basis verbessert die Kommunikation und beschleunigt die Problemlösung.
  • Vorausschauende Problemlösung: Mit umfassenden Beobachtungsdaten und fortschrittlichen Analysen können Unternehmen potenzielle Probleme erkennen, bevor sie sich auf die Benutzer auswirken. Dieser proaktive Ansatz reduziert Ausfallzeiten und verbessert die Zuverlässigkeit der Dienste.
  • Verwaltung der Skalierbarkeit: Observability liefert wichtige Erkenntnisse für die Verwaltung der Systemskalierbarkeit und hilft Unternehmen, ihre Ressourcen zu optimieren und ihr Wachstum effektiv zu planen.

Bei richtiger Implementierung kann die Beobachtbarkeit ein leistungsfähiges Werkzeug sein, um vollständige IT-Transparenz zu erlangen, was sich positiv auf die Qualität der IT-Leistung, die Effizienz, die Markteinführungszeit und die Rentabilität eines Unternehmens auswirkt.


Wie funktioniert AIOps mit der Beobachtbarkeit?

AIOps verbessert die Beobachtbarkeit, indem Erkenntnisse in Maßnahmen umgesetzt werden. Während beispielsweise die Beobachtbarkeit den Entwicklern hilft zu verstehen, wie sich bestimmte Codesegmente auf das Anwendungsverhalten auswirken, ermöglicht AIOps den Betriebsteams, mit minimalem Aufwand automatisch auf Ausfälle und Verlangsamungen zu reagieren. Zusammen bieten diese Tools den Teams maximale Transparenz und ein tiefes Verständnis von Problemen und deren Auswirkungen.

Diese Kombination ist für einen reibungslosen Betrieb unerlässlich, insbesondere wenn Sie über funktionsübergreifende Teams und eine stark verteilte Computerumgebung verfügen. AIOPs plus Beobachtbarkeit verbessern kritische tägliche IT-Vorgänge, darunter:

  • Präzises Debugging: Nutzen Sie Daten aus Ereignissen, Metriken, Protokollen, Traces und anderen verfügbaren Quellen, um Probleme schnell zu identifizieren und zu beheben.
  • Proaktive Erkennung: Erkennen Sie Probleme, bevor sie zu Problemen führen, indem Sie visuelle und algorithmusbasierte Trends nutzen, um potenzielle Probleme zu identifizieren.
  • Kostengünstige Wartung: Geben Sie Anwendungseigentümern und zentralen IT-Teams die Möglichkeit, Systeme im gesamten Unternehmen zu überwachen, um umfassende Einblicke in Software- und Hardwarefehler und -leistung zu erhalten, ohne auf teure Entwickler- oder SRE-Ressourcen angewiesen zu sein.
  • Verbesserte Effizienz: Gewinnen Sie Erkenntnisse darüber, wie Sie ein System verbessern können, und nehmen Sie entsprechende Änderungen vor.
  • Umfassendere Abdeckung mehrerer Cloud-nativer Architekturen: Nutzen Sie ein Tool eines Drittanbieters, um einen ganzheitlichen Überblick über mehrere Cloud-native Architekturen zu erhalten, anstatt sich auf die Performance-Tools der Anbieter von öffentlichen Clouds zu verlassen.
  • GenAI-basierte Beschleunigung des IT-Betriebs: Ermöglichen Sie es sowohl erfahrenen als auch neuen Operatoren, erkannte Probleme schnell zu verstehen und zu beheben - mit ereignisgesteuerten Vorschlägen zur Problembehebung und intelligenten Dokumentationsabfragen auf der Basis von GenAI.
  • Integrierte Abhilfemaßnahmen: Stellen Sie automatisierte oder benutzerimplementierte Abhilfemaßnahmen mit einer starken AIOps-Plattform bereit, um einen effizienten und effektiven Betrieb zu gewährleisten.

AIOps und Beobachtbarkeit haben weitreichende Anwendungen - von der Optimierung von Web-Transaktionen bis hin zur Sicherstellung, dass die IT-Leistung den Kundenerwartungen entspricht. Hier ist ein Anwendungsfall, der ihren Wert unterstreicht:

Nehmen wir an, Sie sind ein Entwickler und versuchen, die Ursache eines Systemabsturzes zu ermitteln. Bei der Überwachung müsste man sich vergewissern, dass alle relevanten Systeme überwacht wurden, manuell Daten von ihnen sammeln und dann versuchen, die Ereignisse zusammenzufügen. Dieser Prozess wäre schwierig und zeitaufwändig, da die Daten nach dem Absturz entstanden sind.

Mit AIOps und Observability haben Sie automatischen Zugriff auf Daten aus allen verfügbaren Quellen, einschließlich korrelierter Metriken, Protokolle und Traces. Sie haben auch Zugriff auf GenAI-Empfehlungen zur Behebung von Problemen aus öffentlichen und privaten Dokumentationen und zur automatischen Behebung von Problemen. Vor allem aber können Sie mit Hilfe von Analysen Anomalien aufspüren, die Sie auf das Problem hinweisen könnten, bevor es das System zum Absturz bringt.


Beobachtungsinstrumente und Kosten

Die Kosten sind ein wesentlicher Nachteil von Beobachtungsinstrumenten. Eine kürzlich durchgeführte Umfrage ergab, dass fast alle Befragten (98%) zumindest einige Male im Jahr mit Überschreitungen oder unerwarteten Kostenspitzen konfrontiert sind, wobei 51% mindestens einmal im Monat mit Überschreitungen oder unerwarteten Kostenspitzen konfrontiert sind.

Diese Spitzen sind in erster Linie auf die Aufnahmekosten zurückzuführen, die von den Anbietern von Beobachtungstools erhoben werden, die riesige Datenmengen im Zusammenhang mit Anwendungstransaktionen einholen können. Diese Kosten haben zwei Auswirkungen:

  1. Eine unvollständige Reihe von Anwendungen, die die Beobachtbarkeit nutzen (nur diejenigen, die als kritisch für das Funktionieren des Unternehmens eingestuft werden).
  2. Keine Erweiterung der Beobachtungswerkzeuge über SREs und Entwickler hinaus.

In beiden Fällen kann die Einführung von OpenTelemetry und die kostengünstigere Preisgestaltung von Anbietern wie OpenText die Überwachung auf alle IT-Services ausdehnen und IT Operations den Zugriff auf die Tools ermöglichen.


Was sind die besten Praktiken für die Beobachtbarkeit?

Um den Wert der Beobachtbarkeit in Ihrem Unternehmen zu maximieren, sollten Sie diese wesentlichen Best Practices berücksichtigen:

Beginnen Sie mit klaren Zielen

  • Definieren Sie spezifische Ziele für die Implementierung der Beobachtbarkeit.
  • Identifizieren Sie kritische Systeme und Dienste, die eine detaillierte Überwachung erfordern.
  • Festlegung von Basismesswerten für das normale Systemverhalten.

Definieren Sie aussagekräftige Metriken

  • Konzentrieren Sie sich auf Messgrößen, die sich direkt auf die Geschäftsergebnisse auswirken.
  • Anwendung der USE-Methode (Utilization, Saturation, Errors).
  • Erstellen Sie benutzerdefinierte Metriken für geschäftsspezifische Prozesse.

Geeignete Instrumentierung einrichten

  • Setzen Sie nach Möglichkeit automatisierte Instrumente ein.
  • Gewährleistung einer einheitlichen Kennzeichnung und Beschriftung in allen Systemen.
  • Gleichgewicht zwischen Datengranularität und Speicher- und Leistungskosten.

Effektive Dashboards erstellen

  • Entwerfen Sie Dashboards, die einen klaren Überblick über den Zustand des Systems geben.
  • Sowohl Übersichten auf hoher Ebene als auch detaillierte Drill-Down-Funktionen sind enthalten.
  • Anpassung der Ansichten an die Bedürfnisse der verschiedenen Interessengruppen.

OpenText-Lösungen zur Beobachtbarkeit

OpenText bietet umfassende Observability-Lösungen, die auf die komplexen Anforderungen moderner IT-Umgebungen zugeschnitten sind. Unser integrierter Ansatz sorgt für vollständige Transparenz in Ihrem gesamten IT-Bereich:

Cloud Observability Die Cloud Observability-Lösungen von OpenText bieten tiefe Einblicke in Cloud-native Anwendungen und Infrastrukturen über mehrere Cloud-Anbieter hinweg. Mit diesen Lösungen können Unternehmen die Auslastung, Kosten und Leistung von Cloud-Ressourcen überwachen und gleichzeitig eine optimale Servicebereitstellung sicherstellen. Teams können spezifische Probleme in Cloud-Umgebungen, wie z. B. falsch konfigurierte Dienste oder Ressourcenbeschränkungen, schnell erkennen und beheben.

Beobachtbarkeit der Anwendung Unsere Funktionen zur Anwendungsbeobachtung liefern detaillierte Einblicke in die Anwendungsleistung, die Benutzererfahrung und die Geschäftstransaktionen. Diese Lösung hilft den Entwicklungs- und Betriebsteams, das Anwendungsverhalten zu verstehen, die Nutzerströme zu verfolgen und die Anwendungsleistung zu optimieren. Sie umfasst Funktionen für die Echtzeitüberwachung, die Diagnose auf Code-Ebene und die Analyse der Benutzererfahrung.
Was ist neu in OpenText Application Observability?

Beobachtbarkeit der Infrastruktur Die Lösung von OpenText zur Beobachtung der Infrastruktur bietet eine umfassende Überwachung und Analyse Ihrer gesamten IT-Infrastruktur, einschließlich Server, Speicher und virtualisierte Umgebungen. Mit dieser Lösung können Teams die Ressourcennutzung, Kapazitätstrends und den Zustand der Infrastruktur in hybriden Umgebungen verfolgen und so eine optimale Leistung und Ressourcenzuweisung sicherstellen.
Was ist neu in OpenText Infrastructure Observability?

Netzwerkbeobachtbarkeit Unsere Lösungen zur Netzwerkbeobachtung bieten einen umfassenden Einblick in die Netzwerkleistung, Verkehrsmuster und Konnektivitätsprobleme. Es hilft Unternehmen, eine optimale Netzwerkleistung aufrechtzuerhalten, potenzielle Sicherheitsbedrohungen zu erkennen und eine zuverlässige Servicebereitstellung zu gewährleisten. Die Lösung umfasst fortschrittliche Analysefunktionen für die Fehlersuche im Netzwerk, die Kapazitätsplanung und die Leistungsoptimierung.


Die Quintessenz der Beobachtbarkeit: Bessere Sichtbarkeit Ihrer IT-Infrastruktur

Die Beobachtbarkeit ist ein wichtiges Element für das Verständnis des gesamten Zustands Ihrer gesamten Infrastruktur. Der Zustrom von Tools, die mit guten Absichten implementiert wurden, hat ein Chaos in Ihrem IT-Bestand hinterlassen, wodurch Ihre Systeme komplexer geworden sind als je zuvor.

Diese Komplexität erschwert die Fehlersuche und die Verwaltung des Systems erheblich. Mehr Werkzeuge führen zu mehr Problemen, vor allem, wenn häufig verwendete Werkzeuge nicht mehr funktionieren - was es noch schwieriger macht, Probleme zu finden und zu beheben.

Wirksame Beobachtungstools bieten einen proaktiven Ansatz zur Problembehebung, um Probleme schneller zu erkennen.

Verwandte Produkte

OpenText AI Operations Management

Gestalten Sie Unternehmenszuverlässigkeit mit Full-Stack-AIOps über Clouds hinweg

OpenText Core Application Observability

Überwachen und verwalten Sie Anwendungen kostengünstig mit OpenTelemetry

OpenText Core Infrastructure Observability

Steigern Sie die Leistung Ihrer Infrastruktur in der Cloud und vor Ort

OpenText Network Operations Management

Optimieren Sie Ihr wachsendes Netzwerk

OpenText Core Cloud Network Observability

Schließen Sie die Beobachtungslücke zwischen Cloud- und Off-Cloud-Netzwerken

Wie können wir behilflich sein?

Fußnoten