OpenText 首頁。
技術主題

什麼是 AIOps?

以問號為重點的 IT 項目說明

概述

AIOps 是 IT 作業人工智慧的通用簡稱。AIOps 的其他名稱包括 IT Operations Analytics (ITOA)、Advanced operational analytics、AI for ITOM、IT data analytics 和 Cognitive Operations。

AIOps 是將大資料分析、AI 和機器學習多層次應用於 IT 作業資料。其目標是自動化 IT 作業、智慧型識別模式、增強常見流程與任務,以及解決 IT 問題。

AIOps 將服務管理、效能管理和自動化結合起來,協助組織實現持續的洞察力和改善。它可以監控和管理應用程式及硬體系統的效能與可靠性、偵測異常問題、適應負載的變化、處理故障,並主動進行調整,將干擾減至最低。

AIOps

定義 AIOps

AIOps 是 Artificial Intelligence for IT Operations 的縮寫。它是包括機器學習和人工智能在內的先進分析技術,可監控並管理應用程式和硬體系統的效能與可靠性、偵測異常問題、適應負載變化、處理故障,並在不中斷或中斷最少服務的情況下主動或快速調整。AIOps 的其他名稱包括 IT Operations Analytics (ITOA)、Advanced operational analytics、AI for ITOM、IT data analytics 和 Cognitive Operations。

AIOps 是將大數據分析和機器學習多層次應用於IT 作業資料。其目標是自動化 IT 作業、智慧型識別模式、增強常見流程與任務,以及解決 IT 問題。AIOps將服務管理效能管理、事件管理和自動化結合起來,以實現持續的洞察力和改善。

業界分析師已經定義了 AIOps 平台應該提供的一系列功能。這些包括

  • 收集和彙集來自多種來源的資料,例如:網路、應用程式、資料庫、工具和雲端,以及各種形式的資料,包括指標、事件、事故、變更、拓樸、日誌檔案、組態資料、KPI、串流和非結構化資料,例如社交媒體文章和文件(自然語言處理)。
  • 管理資料、將資料儲存在單一位置以供分析和報告之用,也包括索引和過期等功能。
  • 透過機器學習分析資料,包括模式偵測、異常偵測和預測分析。
  • 從「雜訊」中分離出重要的警報。
  • 透過即時處理將資料關聯化和情境化,以便識別問題。
  • 扮演策略覆蓋的角色,匯集多種監控工具和其他投資。
  • 將知識編碼為回應和修復的自動化和協調。
  • 持續學習,以改善未來問題的處理與解決。

為什麼需要 AIOps?

許多組織已從靜態、分散的現場系統,過渡到更動態的內部部署、公有雲、私有雲和管理雲環境組合,在這些環境中,資源會不斷擴充和重新配置。

更多的裝置 (最值得注意的是物聯網)、系統和應用程式正提供 IT 需要監控的海嘯式資料。舉例來說,如果您有 10,000 台伺服器或虛擬機器,而且每分鐘監控 100 個指標,那麼每小時就有 6,000 萬個資料點。 

人類無法處理 IT Operations 所要處理的爆炸性資料。IT 團隊無法針對不同的問題排定優先順序,以便及時解決。他們被大量的警報淹沒,其中許多都是多餘的。這會造成警報疲勞,重要的警報可能會因為不重要警報的雜訊而被忽略。這會對使用者和客戶體驗造成負面影響。

傳統的 IT 管理解決方案無法跟上這個數量。他們無法從茫茫資訊海中聰明地篩選指標和事件。它們無法將相互依存但又各自獨立的環境中的資料相互關聯。它們無法提供 IT 作業所需的預測分析和即時洞察力,無法快速回應問題。

為了更快地識別、解決並預防影響重大的中斷及其他 IT 作業問題,企業開始轉向 AIOps。AIOps 可讓 IT 作業團隊快速、主動地應對中斷和宕機,同時花費更少的人力。它可以彌補動態、多樣化且困難的 IT 環境與使用者對系統可用性和效能的期望之間的差異。


AIOps 有哪些好處?

AIOps 對 IT 作業的好處包括

  • 更有效率地使用基礎設施和能力
  • 變革與績效之間有 更好的 相關性 ,以及其他改進的變革管理效率。
  • 透過異常偵測,在客戶受到影響之前預防問題發生。
  • 透過更快速的根本原因分析 (RCA),找出問題所在,或減少操作員在事故發生時必須檢視的項目數量。
  • 在重要 IT 系統中實現更快的平均問題偵測時間 (MTTD) 和平均問題解決時間 (MTTR)。
  • 統一 IT 環境的檢視
  • 深入瞭解哪些工作負載會導致成本上升。
  • 減少成本高昂的中斷。
  • 支援傳統基礎架構、公有雲、私有雲及混合雲。
  • 提供新 IT 服務的時間更快。

員工和客戶體驗的好處包括

AIOps 一般會因為網路的最佳化而改善 IT 服務的品質,它能使 IT 作業和 IT 作業團隊現代化,超越解決問題的層次,進而改善,讓 IT 系統和作業隨著時間的推移變得更好。

所有這些都會提高服務品質、客戶滿意度,並降低客戶流失率,同時比較手動的 IT 作業管理方式大幅節省成本。


AIOps 的三個階段

偵測 IT 事件

當發生或已經發生 IT 事件時,識別並報告這些事件。

  • 歷史分析
  • 效能分析
  • 找出瓶頸
  • 顯示哪些裝置已超載
  • 尋找服務故障
  • 將各種事件、日誌和指標關聯起來並將其背景化

預測 IT 事件

識別潛在的 IT 事件,並在事件影響使用者之前提出報告。

  • 異常偵測
  • 變更影響分析
  • 在故障、過載或其他故障情況影響使用者之前預測故障、過載或其他故障情況
  • 容量管理

緩解 IT 事件

自動修復 IT 事件或將報告傳送給人類,讓人類更容易修復問題。

  • 根本原因分析
  • 自動化或輔助預測性維護
  • 自動或輔助網路最佳化
  • 擴增技術支援

如何開始使用 AIOps

當您決定採用 AIOps 時,主要有兩種途徑:

兩者各有利弊,但大致上等同於購買一個很棒的引擎來打造自己的車子,或是購買一輛快車。考慮您想做的事。

建立您自己的 AIOps 解決方案

您可以使用快速、嵌入式 AIOps 引擎自行建置的原因如下:

  • 您有獨特的 IT 環境或非典型需求。
  • 您希望將 AIOps 納入更廣泛的公司 AI 專案。
  • 您擁有技術嫻熟的 IT、資料科學和軟體工程部門。
  • 您希望建立 AIOps 解決方案,並銷售給其他專注於某個產業的公司,例如電信業。

OpenText™ Vertica™ 資料平台是許多 AIOps 解決方案公司內部的強大資料分析引擎,這些公司銷售 AIOps 解決方案,通常是針對特定產業或地域客製化。

範例包括

購買開箱即用的 AIOps 解決方案

購買預先打包的開箱即用 AIOps 解決方案的原因:

  • 您希望充分利用供應商的專業知識。
  • 您想要更快地提升,也就是您沒有時間自己建立。
  • 您要讓專家專注於公司的核心競爭力,而非 IT 作業。
  • 您不想為軟體提供持續支援。

OpenText™ Operations Bridge是一款企業事件和效能管理軟體,可針對所有資料類型的任何裝置、作業系統、資料庫、應用程式或服務,自動監控和分析多雲端和內部部署資源的健康狀況和效能。

探索 AIOps 技術如何提供速度和規模,以在服務可靠性問題發生前保持領先,進而影響客戶體驗,最終影響收入。


AIOps 成功案例

AIOps 平台提供以 AI 為基礎的相關性,以減少雜訊

AIOps 協助葡萄牙最大的通訊與娛樂集團 NOS 區分噪音與事實,方法是使用以 AI 為基礎的自動事件關聯 (AEC),利用機器學習與演算法來分析事件串流中的模式,並利用這些模式將事件歸類在一起,這些事件很有可能源自相同的問題。這種分組方式可讓操作員集中處理事件。它顯示按 AEC 組合在一起的所有相關事件,使識別和處理根本原因變得更加容易。

AIOps 強化自動化 IT 監控解決方案

法國 IT 服務供應商 NXO France 使用 AIOps 建立並部署創新的自動化 IT 監控解決方案,以獲得 NXO 客戶所使用的動態複雜網路的完整準確檢視,並透過數千個開箱即用的作業自動執行補救行動任務。

利用 AIOps 主動解決問題、改善服務品質和決策流程

Türk Telekom 是土耳其領先的資訊和通訊技術公司。他們使用 AIOps 來提供即時的影響分析,並能夠自動執行演算法來偵測問題的根本原因,同時即時監控結果。「我們在其他業務領域與 OpenText 合作,並認為 AIOps 整套解決方案將有益於此專案」。

我們能如何幫助您?

註腳