OpenText-Startseite.
Technische Themen

Was ist Chaos Engineering?

Illustration von IT-Elementen mit Schwerpunkt auf einer Glühbirne

Übersicht

Fragen Sie jeden Projektmanager, Entwickler oder Teamleiter. Während des Lebenszyklus der Softwareentwicklung können verschiedene Dinge schief gehen, z. B. Störungen, Cyberangriffe und Systemausfälle. Unerwartete Fehler sind vorprogrammiert, die den gesamten Prozess stören, die Ergebnisse einschränken und wichtige Ressourcen verschwenden können.

Chaos Engineering

Das Chaos-Engineering ist eine Disziplin, die untersucht, wie es zu solchen Fehlern kommen kann, und die Methoden zu ihrer Vermeidung bereitstellt. Wenn die Chaos-Ingenieure die Ursachen von Fehlern verstehen, können sie Pläne entwickeln, um sie zu verhindern oder zu entschärfen.

Beim Chaos-Engineering geht es nicht darum, Chaos zu schaffen, sondern darum, durch kontrollierte Experimente potenzielle Fehlerpunkte in einem System zu erkennen, bevor sie Probleme verursachen. Auf diese Weise können Chaosingenieure proaktiv Ausfälle und andere Störungen verhindern.

Was genau ist Chaos Engineering?

Beim Chaos-Engineering werden absichtlich Fehler in ein System injiziert, um dessen Widerstandsfähigkeit zu testen. Ziel ist es, potenzielle Fehlerpunkte zu erkennen und zu beheben, bevor sie zu einem tatsächlichen Ausfall oder einer anderen Störung führen.

Es gibt viele Möglichkeiten, Chaos in einem System zu stiften, aber das Wichtigste ist, einen Plan zu haben. Ohne einen Plan schafft man leicht mehr Probleme, als man löst. Bei der Erstellung Ihres Plans müssen Sie entscheiden, was Sie testen wollen und wie Sie es tun werden. Sobald Sie einen Plan haben, können Sie mit dem Experimentieren beginnen.

Software-Entwickler können mit OpenText™ Professional Performance Engineering, OpenText™ Enterprise Performance Engineering oder OpenText™ Core Performance Engineering ganz einfach Chaos-Engineering in ihre Arbeitsabläufe integrieren. Mit diesen Lösungen lassen sich nicht nur Leistungstests durchführen, sondern auch andere Chaos-Engineering-Experimente direkt in der Software durchführen.

Indem Sie diese Ereignisse in einer kontrollierten, nicht produktiven Umgebung erzeugen, können Sie testen, wie Ihr System reagiert und mögliche Probleme erkennen.

Sobald Sie potenzielle Fehlerquellen identifiziert haben, können Sie daran arbeiten, diese zu entschärfen. Dies könnte bedeuten, dass Sie die Überwachung oder Protokollierung hinzufügen, um Probleme zu erkennen, wenn sie auftreten, oder Ihr Design ändern, um es widerstandsfähiger gegen Ausfälle zu machen.

Was sind die Prinzipien des Chaos Engineering?

Die Prinzipien des Chaos Engineering sind:

  • Planen Sie: Entscheiden Sie, was Sie testen wollen und wie Sie es tun werden. Das Ziel ist es, eine Hypothese aufzustellen. Was kann in einem System schiefgehen? Welche potenziellen Schwachstellen können ausgenutzt werden?
  • Experimentieren: Geben Sie Fehler in das System ein und sehen Sie, wie es reagiert. Bei der Fehlerinjektion wird einfach ein Problem in ein bestehendes System eingeführt, um eine Schwachstelle aufzudecken. Es ist im Wesentlichen die Angewohnheit, absichtlich einen "Schraubenschlüssel" in ein System zu werfen, um zu sehen, was passiert.
  • Analysieren Sie: Verwenden Sie die Daten aus Ihren Experimenten, um potenzielle Fehlerquellen zu ermitteln.
  • Entschärfen: Wenn Sie ein Problem finden, können Sie Ihr Experiment beenden, um sich auf die Behebung des Problems zu konzentrieren. Andernfalls können Sie Ihr Experiment so lange ausdehnen, bis Sie den Kern des Problems erreicht haben.

Was sind die Vorteile von Chaos Engineering?

Warum also sollte ein Unternehmen Dinge absichtlich kaputt machen? Die Aufdeckung von Systemmängeln ist notwendig, um das System robuster zu machen. Chaos Engineering kann Ihnen helfen, Ausfälle und andere Störungen zu vermeiden. Indem Sie potenzielle Fehlerpunkte erkennen und beheben, bevor sie Probleme verursachen, können Sie Störungen proaktiv verhindern.

Darüber hinaus bietet das Chaos-Engineering eine Reihe von Kunden-, Geschäfts- und technischen Vorteilen. Der Hauptvorteil besteht darin, dass die Unternehmen stärkere Produkte entwickeln können, die sich auf ihr Endergebnis auswirken und die Erwartungen der Kunden erfüllen.

Chaos Engineering, auch bekannt als Resiliency Testing, kann Unternehmen dabei helfen, den Digital Operational Resilience Act (DORA) einzuhalten, der darauf abzielt, die Resilienz von Systemen regelmäßig zu testen, um Schwachstellen zu bewerten.

Wie unterscheidet sich Chaos Engineering vom Testen?

Chaos Engineering unterscheidet sich in einigen wesentlichen Punkten vom Testen. Beim Chaos Engineering geht es darum, potenzielle Fehlerpunkte zu finden, bevor sie Probleme verursachen. Beim Testen hingegen geht es darum, zu überprüfen, ob das System wie erwartet funktioniert. Kurz gesagt, Chaos Engineering ist proaktiv, während Testen reaktiv ist.

Chaos-Ingenieure arbeiten daran, Ausfälle und andere Störungen zu verhindern, indem sie kontrollierte Fehler einführen und beheben, bevor sie in einer realen Umgebung Probleme verursachen können. Durch diese kontrollierten Ausfälle lässt sich feststellen, welche Teile des Systems widerstandsfähiger sind und welche mehr Arbeit benötigen. Die Tests können nur überprüfen, ob das System funktioniert, wenn es fertig ist.

Inwiefern ähnelt es OpenText Professional Performance Engineering?

OpenText Professional Performance Engineering ist ein Tool, das sich hauptsächlich auf eine bestimmte Art von Performance Engineering konzentriert. Mit OpenText Professional Performance Engineering können Sie fortschrittliche Lasttests durchführen, die reale Nutzungsbedingungen simulieren. So können Sie potenzielle Probleme mit der Lastleistung erkennen, bevor sie Probleme verursachen.

Aber OpenText Professional Performance Engineering ist nicht einfach nur ein Performance-Engineering-Tool, das Lasttests in einer stabilen Umgebung durchführt; es ist ein Tool, das sowohl Performance-Engineering als auch Chaos-Engineering in einer Plattform vereint.

OpenText Professional Performance Engineering arbeitet direkt mit Gremlin zusammen, einer renommierten Failure-as-a-Service (FaaS)-Plattform, die es Ihnen ermöglicht, verschiedene Arten von Chaos-Ereignissen wie CPU-Spitzen, Netzwerklatenz und Festplattenfehler zu erzeugen. Sie können Gremlin-Chaos-Experimente direkt in OpenText Professional Performance Engineering organisieren und initiieren und Lasttests basierend auf abnormalen Bedingungen durchführen.

Insgesamt können Sie mit OpenText Professional Performance Engineering proaktiv Lastunterbrechungen während verschiedener Arten von Chaos-Ereignissen verhindern. Durch die Identifizierung potenzieller Fehlerpunkte, bevor sie Probleme verursachen, kann dieses Tool helfen, Zeit, Geld und wertvolle Ressourcen zu sparen.

Setzen Sie Chaos Engineering mit Performance Engineering Lösungen in die Tat um

Letztlich ist das Chaos-Engineering die Triebfeder für jedes erfolgreiche Softwareprojekt. Softwareentwickler können Chaos-Engineering einsetzen, um Projekte zu verwirklichen, die den Test der Zeit bestehen.

Durch OpenText's Partnerschaften mit Gremlin und Steadybit können OpenText Performance-Engineering-Lösungen die Leistung von Systemen unter Last und verschiedenen Chaos-Ereignissen gleichzeitig testen. So können Sie potenzielle Fehlerpunkte finden und Probleme proaktiv beheben.

Wie können wir behilflich sein?

Fußnoten