OpenTextのホームページ。
技術トピックス

IT事業における可観測性とは何か?

ノートPCを中心としたITアイテムの図解

概要

OpenTelemetry主導の観測可能性を使って、どのように最新の洞察に移行できるかをご覧ください。

エンタープライズ・システムの可観測性は、オペレータ、開発者、システム信頼性エンジニア(SRE)がITシステム・パフォーマンスの変化を迅速に理解し、対応することで実現される。アプリケーションやマイクロサービス間の通信を深く理解することで、エンジニアや管理者は、大企業を悩ませる高コストで労働集約的なウォー・ルームを使わずに、障害やスローダウンを即座に発見することができる。複雑なアプリケーションがパブリック・クラウド、自社所有のデータセンター、サードパーティ製プロセッサーにまたがっており、サービス低下の根本原因を特定するのが困難な場合に、このスピードが特に役立ちます。

アドバンスト・オブザベイラビリティは、ある重要な点で、従来のモニタリングとは異なる:高度な観測可能性は、モニタリングで一般的なメトリックデータを収集するだけでなく、トランザクションのフローとタイミングをキャプチャし、相関するイベントやログと組み合わせて、実用的な洞察を提供します。これらの洞察は、システム/アプリケーションの動作をより包括的に理解し、他の方法では検出が困難な問題を特定するのに役立つ。

観測可能性は新しい用語ではない。1960年に制御理論との関連で作られた可観測性は、今ではITなど他の分野にも進出している。ハイブリッド・クラウドは複雑なため、「クラウドの観測可能性」という言葉もよく使われるようになった。

可観測性

モニタリングと観測可能性の違いは何ですか?

観測可能性はしばしばモニタリングと混同されるが、両者はまったく異なる。

モニタリングとは、システムのパフォーマンスを時系列で観察することである。モニタリング・ツールは通常、ログ・ファイルやパフォーマンス・カウンターなど、特定のソースからパフォーマンス・データを収集する。例えば、モニタリングはシステム上のユーザー数を知ることはできますが、容量制限に達したときにプロアクティブに教えてくれるわけではありません。モニタリングはリアクティブなアプローチであり、事前に何をモニタリングすることが重要かを知っておく必要がある。その限界のひとつは、特定の時点における測定基準の取得に重点を置いていることだ。

観測可能性は、モニタリングよりも広範な機能を果たす。Observabilityツールは、ログ、パフォーマンス・カウンター、アプリケーション・コードなど、利用可能なすべてのソースからデータを収集する。そして、そのデータを分析することで、システムの内部構造を可視化し、その挙動を理解する。このデータは、傾向を特定し、システムをどのように改善できるかについての洞察を提供することによって、問題を引き起こす前に問題を検出するために使用することができる。

観察可能性は、視覚があなたの目と脳の視覚処理の結果であるのと同じように、広範な監視とトランザクションレベルの分析の結果である。OpenText™ observabilityソリューションはOpenText AIOpsプラットフォームと組み合わせることで、複雑なITサービスを維持するために必要な、観測可能性に関する洞察と、広範なイベント、システム管理、修復機能の両方を提供することができます。


観測可能性にとって重要なデータ型とは?

観測可能性の解決策には2つの考え方がある:

  1. 溶ける。この頭字語は、観測可能性の一部として収集されるデータの種類を示す。
    • メトリクス:これは古典的なモニタリングであり、マイクロ秒単位のネットワーク応答時間から完全な合成トランザクションまで、時間経過に伴うアクティビティの測定である。
    • イベント:測定期間中に発生したシステム生成イベント。
    • ログ:システム活動に関する洞察を提供する非構造化データ。
    • トレース:分散システムのノード間を移動するリクエストの全行程を記録した視覚的な表現で、サービス間の接続に関するコンテキストを持つタイミングのブレークダウンを提供する。
  2. 黄金のシグナルグーグルがSREマニュアルの一部として普及させたゴールデンシグナルは、問題を解決するためのパフォーマンス中心のアプローチを表している。
    • 待ち時間:アプリケーションがリクエストを処理するのにかかる時間。
    • トラフィック:システムが受け取るリクエスト数。
    • エラー:失敗したリクエストの割合。
    • 飽和状態:サービス内のキャパシティの状況。

収集されたデータには大きな共通点があるが、文脈(タイプ対パフォーマンス)に基づいて異なる表現がなされていることに注意されたい。MELTを使うにせよ、ゴールデンシグナルを使うにせよ、重要なのは、異常な結果に注目して問題を検出し、その発生場所を特定することである。次のセクションでは、OpenTelemetryはどのように観測可能性を支援するのか、と題して、OpenTelemetryがどのようにこのデータを使い、並外れた観測可能性を提供するのかについて詳しく説明します。


OpenTelemetryはどのように観測可能性を助けるのか?

OpenTelemetryは Cloud Native Computing Foundationによって管理されているオープンソースのプロジェクトである。これは、メトリクス、トレース、ログを含む遠隔測定データを収集するための、ベンダーニュートラルな計測プロトコルを提供する。このプロトコルは、すべてのプログラミング言語とプラットフォームで動作し、単一のビューですべてのデータを分析することができます。この標準化されたアプローチは、テレメトリーデータを定義し相関させながら、計測を合理化する。OpenTelemetryの主な利点は、その移植性で、開発者と中央IT部門は、それぞれの役割に最適なツールセットを選択できる。


観測可能性とITオペレーション

ITオペレーションは通常、サービスのアップタイムとパフォーマンスを維持するためにデータセンターを監視している。ハードウェアやソフトウェアの障害とは関係のない問題が発生した場合、ITオペレーションは開発者向けにチケットを開き、観測可能性ツールを使用して根本的な問題を調査する。開発者はプロモテウスで複雑なクエリーを実行することが多く、分析のためにデータストリームを作成したり、障害を調査するためにログにアクセスしたりします。

OpenTelemetry の出現で、IT オペレーション・チームは、相関するメトリクスとログを含むトレースで、データ収集と分析を単純化できます。OpenTelemetryプロトコルの相関機能は、オペレータがPromQLのような複雑なプログラミング言語を使用したり、観測可能性データを開始し理解するためにログクエリを実行する必要性を排除します。

その代わり、ポイント・アンド・クリックで簡単に相関データにアクセスできる。オペレータは、コードの更新を提案することはできませんが、パフォーマンスのボトルネックを特定し、社内の開発者であれ、アプリケーションの速度低下を経験しているサードパーティ・ベンダーであれ、責任者にチケットを直接送ることができます。


観測可能性の利点とは?

組織は、これらの主な利点を通じて、ITの完全な観察可能性を得ることができる:

  • 品質の向上:観察すればするほど、より多くの重要な問題を見つけることができ、ステークホルダーや顧客の期待に応えるより良い製品につながる。
  • 効率の向上:観測可能性により、企業はシステムやソフトウェアのデバッグを迅速に行うことができる。
  • コスト削減:デバッグ期間の延長には多くの時間とコストがかかる。
  • 市場投入までの時間を短縮: 可観測性を確保することで、 新しいアプリケーションや更新されたアプリケーションなどのITサービスを スケジュール通りに 提供する ことができます。
  • アプリケーション・パフォーマンスのモニタリング:包括的な監視機能により、重要なソフトウェアの問題を即座に診断し、パフォーマンス指標を改善することができます。
  • ビジネス分析に役立ちます:観測可能性はデータを多用するプロセスであるため、投資収益率(ROI)や収益などの主要業績評価指標(KPI)についてより詳しく知ることができる。
  • 卓越したユーザー・エクスペリエンス:問題になる前に問題を検出することで、卓越したユーザー・エクスペリエンスを実現し、組織の評判と収益性を向上させることができます。
  • インフラ、クラウド、Kubernetesのモニタリング:Observabilityは、インフラと運用(I&O)チーム、Kubernetes環境、クラウド全体でソフトウェアの問題を検出するのに役立ちます。その結果、アプリケーションを成功させるためのすべてのコンポーネントのカバーが強化された。
  • 根本原因分析の改善:メトリクス、ログ、トレースを組み合わせることで、より迅速で正確な根本原因分析が可能になります。チームは、異なるシステムやサービス間のデータを迅速に関連付け、問題の原因を特定することができます。
  • コラボレーションの強化:Observabilityは、開発、運用、ビジネスの各チームにまたがるシステム動作の共通理解を生み出します。この共通基盤がコミュニケーションを改善し、問題解決を早める。
  • 予測的な問題解決:包括的な観測可能性データと高度な分析により、企業はユーザーに影響を与える前に潜在的な問題を特定することができます。このプロアクティブなアプローチにより、ダウンタイムが短縮され、サービスの信頼性が向上する。
  • スケーラビリティ管理:Observabilityは、システムのスケーラビリティを管理するための重要な洞察を提供し、組織がリソースを最適化し、効果的に成長を計画するのを支援します。

観測可能性を正しく実装すれば、ITの完全な可視性を得るための強力なツールとなり、組織のITパフォーマンスの品質、効率性、市場投入までの時間、収益性に好影響をもたらす。


AIOpsは観測可能性とどのように連携するのか?

AIOpsは、洞察をアクションに変換することにより、観測可能性を高める。例えば、開発者が特定のコードセグメントがアプリケーションの動作にどのような影響を与えるかを理解するのに役立つ一方で、AIOpsは運用チームが最小限の労力で停止や速度低下に自動的に対応することを可能にする。これらのツールを組み合わせることで、チームは最大限の可視性を確保し、問題とその影響を深く理解することができる。

この組み合わせは、特に部門を超えたチームや高度に分散されたコンピューティング環境を持つ場合、円滑な運用に不可欠である。AIOPと観測可能性は、以下のような重要な日常ITオペレーションを強化する:

  • 正確なデバッグ:イベント、メトリクス、ログ、トレース、およびその他の利用可能なソースからのデータを使用して、問題を迅速に特定して解決します。
  • プロアクティブな検出:視覚的およびアルゴリズムベースの傾向を使用して潜在的な問題を特定することにより、問題が発生する前に問題を検出します。
  • コスト効率の高いメンテナンス:アプリケーション所有者と中央ITチームは、高価な開発者やSREリソースに依存することなく、ソフトウェアとハードウェアの障害やパフォーマンスに関する幅広い洞察を得るために、企業全体のシステムを監視することができます。
  • 効率の向上:システムをどのように改善できるかを洞察し、それに応じて変更を加える。
  • 複数のクラウド・ネイティブ・アーキテクチャを幅広くカバー:パブリッククラウドベンダーのパフォーマンスツールに依存するのではなく、サードパーティのツールを使用して、複数のクラウドネイティブなアーキテクチャにわたる全体的なビューを実現する。
  • GenAIベースのITオペレーション・アクセラレーション:GenAIに基づくイベントドリブンな改善提案とインテリジェントなドキュメントのクエリにより、経験豊富なオペレーターと新しいオペレーターの両方が検出された問題を迅速に理解し、修正できるようにします。
  • 統合された修復:効率的かつ効果的な運用を推進する強力なAIOpsプラットフォームにより、自動化された、またはユーザーが実装した修復を提供します。

AIOpsと観測可能性は、ウェブトランザクションの最適化から、ITパフォーマンスが顧客の期待に応えることの保証まで、広範囲に応用できる。その価値を際立たせる使用例を紹介しよう:

あなたがシステムクラッシュの原因を特定しようとしている開発者だとしよう。モニタリングでは、関連するすべてのシステムがモニタリングされていることを確認し、手作業でデータを収集し、何が起こったかを突き止めなければならない。クラッシュが発生した後のデータであるため、このプロセスは困難で時間がかかるだろう。

AIOpsと観測可能性があれば、相関するメトリクス、ログ、トレースなど、利用可能なすべてのソースからのデータに自動的にアクセスできる。また、公的および私的な文書と自動化された修復の両方からGenAIの修復勧告にアクセスすることができます。最も重要なのは、システムがクラッシュする前に問題を指摘できるような異常を発見するための分析の助けがあることだ。


観測可能なツールとコスト

コストは観測可能性ツールの重要な欠点である。ある最近の調査によると、回答者のほぼ全員(98% )が 、少なくとも年に数回、超過料金や予期せぬ費用の高騰を経験しており、51% は少なくとも毎月、超過料金や予期せぬ費用の高騰を経験している

これらの急増は、主に、アプリケーション・トランザクションに関連する膨大な量のデータを取り込むことができる観測可能性ツールのベンダーが請求する取り込みコストによるものである。これらのコストには2つの結果がある:

  1. 観測可能性を使用するアプリケーションの不完全なセット(企業機能にとって重要であると評価されたもののみ)。
  2. 観測可能なツールをSREや開発者以外に拡張しない。

どちらのケースでも、OpenTelemetry の登場と、OpenText のようなベンダーが提供する、よりコスト効率の良い価格設定によって、すべての IT サービスにモニタリングを拡張し、IT オペレーションがツールにアクセスできるようになります。


観測可能性のベストプラクティスとは?

あなたの組織で観測可能性の価値を最大化するために、以下の重要なベストプラクティスを検討してください:

明確な目標から始める

  • 観測可能性を実装するための具体的な目標を定める。
  • 詳細な監視が必要な重要なシステムやサービスを特定する。
  • 通常のシステム動作のベースライン・メトリクスを確立する。

意味のある測定基準を定義する

  • ビジネスの成果に直接影響を与える指標に焦点を当てる。
  • USEメソッド(利用率、飽和度、エラー)を導入する。
  • ビジネス固有のプロセス用にカスタムメトリクスを作成します。

適切な計測器のセットアップ

  • 可能な限り自動計装を導入する。
  • システム間で一貫したタグ付けとラベリングを行う。
  • データの粒度とストレージおよびパフォーマンス・コストのバランスをとる。

効果的なダッシュボードの作成

  • システムの健全性に関する明確なストーリーを伝えるダッシュボードを設計する。
  • ハイレベルな概要と詳細なドリルダウン機能の両方を含む。
  • さまざまなステークホルダーのニーズに合わせてビューをカスタマイズ。

オープンテキストの観測可能性ソリューション

OpenTextは、最新のIT環境の複雑なニーズに対応するために設計された、包括的なObservabilityソリューションを提供しています。当社の統合されたアプローチにより、IT資産全体にわたる完全な可視性が保証されます:

クラウド・オブザベイラビリティOpenTextのクラウド・オブザベイラビリティ・ソリューションは、複数のクラウドプロバイダーにわたるクラウドネイティブなアプリケーションとインフラストラクチャに対する深い洞察を提供します。これらのソリューションにより、企業は最適なサービス・デリバリーを確保しながら、クラウド・リソースの利用状況、コスト、パフォーマンスを監視することができる。チームは、サービスの設定ミスやリソースの制約など、クラウド環境特有の問題を迅速に特定し、解決することができる。

アプリケーションの可観測性 当社のアプリケーション観測機能により、アプリケーション・パフォーマンス、ユーザー・エクスペリエンス、ビジネス・トランザクションに関する詳細な洞察が得られます。このソリューションは、開発チームと運用チームがアプリケーションの動作を理解し、ユーザー・ジャーニーを追跡し、アプリケーション・パフォーマンスを最適化するのに役立ちます。リアルタイムのモニタリング、コードレベルの診断、ユーザー・エクスペリエンス分析などの機能を備えている。
OpenText Application Observabilityの新機能は?

インフラの可観測性 OpenTextのインフラ監視ソリューションは、 サーバー、ストレージ、仮想化環境など、 ITインフラ全体を包括的に監視・分析 します。このソリューションにより、チームはハイブリッド環境全体のリソース利用率、キャパシティ・トレンド、インフラストラクチャの健全性を追跡し、最適なパフォーマンスとリソースの割り当てを確保することができます。
OpenText Infrastructure Observabilityの新機能は?

ネットワーク可観測性 当社のネットワーク・オブザベイラビリティ・ソリューションは、ネットワーク・パフォーマンス、トラフィック・パターン、接続性の問題に対するエンドツーエンドの可視性を提供します。組織が最適なネットワーク・パフォーマンスを維持し、潜在的なセキュリティ脅威を特定し、信頼性の高いサービスを提供できるようにします。このソリューションには、ネットワークのトラブルシューティング、キャパシティプランニング、パフォーマンス最適化のための高度な分析が含まれています。


観測可能性の結論IT資産に対する可視性の向上

観測可能性は、インフラ全体の状態を把握する上で重要な要素である。善意で導入されたツールの流入は、IT資産を混乱させ、システムをかつてないほど複雑にしている。

この複雑さは、システムのトラブルシューティングや管理に大きな支障をきたす。ツールが増えれば問題も増える。特に、頻繁に使うツールが機能しなくなると、問題の発見と解決がさらに難しくなる。

効果的な観測可能性ツールは、問題をより早く発見するためのプロアクティブな修復アプローチを提供する。

関連製品

OpenText AI Operations Management

クラウド全体にわたるフルスタックのAIOpsでビジネスの信頼性を構築

OpenText Core Application Observability

OpenTelemetryでアプリをコスト効率よく監視・管理

OpenText Core Infrastructure Observability

クラウドとオンプレミスでインフラストラクチャのパフォーマンスを向上

OpenText Network Operations Management

進化するネットワークを最適化します

OpenText Core Cloud Network Observability

クラウドとオフクラウドのネットワーク間の可観測性ギャップを埋める

脚注