OpenText 首頁。
技術主題

什麼是混沌工程?

以燈泡為焦點的 IT 項目說明

概述

您可以詢問任何專案經理、開發人員或團隊領導人。在軟體開發生命週期中,有幾件事情可能會出錯,例如故障、網路攻擊和系統中斷。意料之外的故障一定會發生,這可能會打亂整個流程、限制結果,並浪費重要的資源。

混沌工程

混沌工程是一門研究這些故障如何發生的學科,並提供有助於避免故障的方法。透過瞭解故障的根本原因,混亂工程師可以制定預防或減緩故障的計劃。

混沌工程不是要製造混亂,而是利用受控制的實驗,在造成問題之前找出系統的潛在故障點。這樣一來,混亂工程師就可以主動預防中斷和其他中斷。

混沌工程到底是什麼?

混沌工程 (Chaos engineering) 是故意將故障注入系統以測試其彈性的做法。目標是找出潛在的故障點,並在造成實際停電或其他中斷前加以修正。

在系統中造成混亂的方法有很多,但最重要的是要有計劃。如果沒有計劃,很容易造成比解決更多的問題。在制定計劃時,您需要決定要測試什麼以及如何測試。有了計劃之後,您就可以開始實驗。

軟體開發人員可以使用OpenText™ Professional Performance Engineering、 OpenText™ Enterprise Performance EngineeringOpenText™ Core Performance Engineering,輕鬆地將混沌工程引入工作流程。這些解決方案不僅能利用效能負載測試,還能讓您輕鬆地直接在軟體中執行其他混亂工程實驗。

透過在受控的非生產環境中建立這些事件,您可以測試系統的反應,並找出任何潛在的問題。

一旦找出潛在故障點,您就可以開始著手緩解。這可能涉及增加監控或日誌,以協助在問題發生時找出問題,或改變您的設計,使其對故障更具彈性。

什麼是混沌工程原則?

混沌工程的原則是:

  • 計劃:決定您要測試什麼,以及如何進行測試。這裡的目標是建立一個假設。系統可能會出什麼問題?有哪些可能被利用的潛在漏洞?
  • 實驗:將故障注入系統,看看它的反應。故障注入簡而言之就是將問題引入現有系統以暴露漏洞的過程。這基本上是一種習慣,故意在系統中 「拋出一個扳手」,看看會發生什麼。
  • 分析:使用實驗資料找出潛在故障點。
  • 緩解:如果發現問題,您可以結束實驗,專注於緩解問題。否則,您可以擴大您的實驗規模,直到問題的癥結所在為止。

混沌工程有什麼好處?

那麼,為什麼會有公司故意弄壞東西呢?暴露系統缺陷是使其更穩健的必要條件。混沌工程可以幫助您避免中斷和其他干擾。透過找出潛在故障點,並在問題發生前加以修正,您可以主動預防中斷。

此外,混沌工程還提供了多種客戶、業務和技術優勢。主要好處是允許公司創造出更強大的產品,以影響公司的底線並滿足客戶的期望。

混沌工程 (Chaos Engineering) 也稱為彈性測試,可協助企業遵守數位營運彈性法 (Digital Operational Resilience Act, DORA),其目的在於定期測試系統的彈性以評估弱點。

混沌工程與測試有何不同?

混沌工程在幾個關鍵方面有別於測試。混沌工程專注於在潛在失敗點造成問題之前找出它們。另一方面,測試著重於驗證系統是否如預期般運作。簡而言之,混沌工程是主動的,而測試是被動的。

混沌工程師透過引入和修正受控制的故障,在故障可能對實際環境造成問題之前,預防中斷和其他中斷。這些受控制的故障有助於找出系統中哪些部分更具彈性,哪些部分需要更多的工作。測試只能在完成之後驗證系統是否運作正常。

它與 OpenText Professional Performance Engineering 有何相似之處?

OpenText Professional Performance Engineering是一種主要針對特定類型效能工程的工具。使用 OpenText Professional Performance Engineering,您可以部署先進的負載測試,模擬真實世界的使用狀況,這可協助您在問題發生之前找出潛在的負載效能問題。

但 OpenText Professional Performance Engineering 並非只是在穩定環境中執行負載測試的效能工程工具,而是將效能工程與混亂工程結合為單一平台的工具。

OpenText Professional Performance Engineering 可直接與著名的故障即服務 (FaaS) 平台 Gremlin 合作,讓您建立不同類型的混亂事件,例如 CPU 尖峰、網路延遲和磁碟故障。您可以直接在 OpenText Professional Performance Engineering 中輕鬆組織和 啟動 Gremlin 混沌實驗,並根據異常條件執行負載測試。

總體而言,OpenText Professional Performance Engineering 可讓您在不同類型的混亂事件中主動預防負載中斷。透過在潛在故障點造成問題前找出故障點,此工具可協助節省時間、金錢和寶貴的資源。

以效能工程解決方案實現混沌工程

歸根結柢,混沌工程是任何成功軟體專案的動力。軟體開發人員可以實施混沌工程,以執行經得起時間考驗的專案。

透過 OpenText 與GremlinSteadybit 的合作關係,OpenText 效能工程解決方案可以同時測試負載和不同混亂事件下的系統效能,讓您能夠找到潛在的故障點,並主動糾正問題。

我們能如何幫助您?

註腳