OpenTextのホームページ。
技術トピックス

データウェアハウスとは何か?

クエスチョンマークを中心としたIT項目の図解

概要

データウェアハウスは、複数のソースからの大量のデータを保存、整理、分析するために設計された中央リポジトリである。

ビジネス・インテリジェンス、レポーティング、高度な分析をサポートするように設計されており、組織はより迅速で、より多くの情報に基づいた意思決定を行うことができます。顧客行動の分析、在庫予測、財務実績の追跡など、データウェアハウスは信頼できる基盤を提供します。

データウェアハウス

現代企業においてデータウェアハウスが重要な理由

現代の企業は、サイロ化したデータを統合し、正確でタイムリーな洞察を提供するためにデータウェアハウスに依存しています。

日々の業務のために構築された従来のデータベースとは異なり、データウェアハウスは、複雑なクエリ、長期的なトレンド分析、部門やシステムを横断した高速レポート作成に最適化されています。

組織は、ERPシステム、CRM、IoTデバイス、eコマース・プラットフォーム、市場フィードやソーシャルメディアなどの外部ソースから、膨大な量のデータを生成する。そのデータを収集・整理するための一元的なアプローチがなければ、データは断片的で一貫性がなく、十分に活用されていないままだ。

よく設計された最新のデータウェアハウスは、レポーティングを数日から数秒に短縮するだけでなく、助けにもなる:

  • 事業部門間のデータのサイロ化を解消する
  • 過去およびリアルタイムのデータから洞察を加速する
  • 信頼できるデータへの安全で管理されたアクセスを可能にする
  • 業界および地域の規制の遵守をサポート

データウェアハウスの主な利点

データウェアハウスにアナリティクスを一元化した企業では、テラバイト単位のデータに対するクエリの高速化、手作業による照合の削減、複数の事業部門にまたがるKPIの信頼性の向上など、測定可能な改善が見られます。

  • アクセスの一元化:異なるシステムやアプリケーションのデータを統合。
  • より速いパフォーマンス:複雑で大規模なアナリティクスのクエリ速度を最適化します。
  • 正確なレポート:信頼できる指標とKPIには、過去のデータを使用します。
  • データ品質の向上:検証、クレンジング、変換ルールの実施。
  • スケーラブルな意思決定:セルフサービスツールでビジネスユーザーとアナリストを支援します。

データウェアハウスのアーキテクチャ

すべてのアナリティクス・プロセスは、インジェスチョン、ステージング、ストレージ、クエリ、ガバナンスという5つのコア・レイヤーを通して実行される。各レイヤーを理解することで、スローダウンを特定し、コストを管理し、クエリの精度を向上させることができます。

  • データの取り込み: ソースシステムからデータを抽出、変換、ロード(ETL/ELT)、またはロードして変換する。
  • ストレージ層:分析に最適化されたスキーマにデータを整理する。
  • メタデータ管理:データの系統、文脈、構造を追跡する。
  • クエリー・レイヤー:BIツール、API、SQLエンジンとのインターフェイス。
  • ガバナンス& セキュリティ:アクセス、コンプライアンス、監査可能性を管理する。

データウェアハウスの種類

適切なデータウェアハウスのタイプは、データへのアクセスをどの程度迅速に行う必要があるか、誰がそれを使用するか、どのような意思決定を行うかによって決まる。一元化された長期的な分析から、迅速な業務報告や部門レベルのビューまで、それぞれのモデルは異なる優先順位をサポートします。

  • エンタープライズデータウェアハウス(EDW):ビジネスにまたがる一元化された統合リポジトリ。
  • オペレーショナル・データ・ストア(ODS):短期的またはリアルタイムに近いニーズにより俊敏なリポジトリ。
  • データマート:データウェアハウスのサブセットを各部門やユースケースに合わせてカスタマイズしたもの。

データウェアハウスにおけるスキーマ

スキーマは、クエリのためにデータがどのように構造化されているかを定義する。正しい選択は、スピード、ストレージ効率、レポートのしやすさに影響する。

  • スタースキーマ: ディメンジョン・テーブルにリンクされた中央ファクト・テーブル。
  • スノーフレーク・スキーマ: 正規化されたディメンジョン・テーブルは冗長性を減らしますが、クエリの複雑さが増す可能性があります。
  • ギャラクシースキーマ: ディメンジョン・テーブルを共有する複数のファクト・テーブルを持つスキーマで、相互に接続されたビジネス・プロセスを扱う場合によく使用される。

クエリ・パフォーマンスの向上、データ分析の強化、データ管理の簡素化、ビジネス・ニーズに応じた柔軟性を得ることができます。


データウェアハウスとデータベース:その違いは?

従来のデータベースがリアルタイムのトランザクションや業務データを扱うのに対し、データウェアハウスは大量の履歴データを分析することを目的として構築されている。この違いを理解することで、チームはパフォーマンス、スケール、洞察力のために適切なプラットフォームを選択することができる。

特徴 従来のデータベース データウェアハウス
目的 日々のトランザクション(OLTP) 履歴分析(OLAP)
データ量 より低い より高い
クエリーの複雑さ シンプル 複雑なマルチソース
更新頻度 コンスタント 定期的
ユーザー オペレーションチーム アナリスト、意思決定者

データウェアハウス、データレイク、それともレイクハウス?

その決断は、構造か柔軟性かということになる。ウェアハウスは管理された反復可能な分析を得意とし、レイクは生データの自由を提供する。

  • データウェアハウス:構造化され、分析用に管理されたデータ。
  • データレイク:生データ、非構造化データ、または半構造化データで柔軟性を確保。
  • レイクハウス両方のモデルを組み合わせたハイブリッド・アプローチ。

データウェアハウスの主な使用例

顧客生涯価値の分析からサプライチェーンの遅延予測まで、データウェアハウスは測定可能なビジネス成果を促進する分析に力を発揮します。

  • 顧客分析:チャネルを横断して行動、維持、解約を追跡
  • セールス& マーケティング:パイプラインのパフォーマンスをマーケティングアトリビューションに合わせる
  • 財務:P&L、予算、予測、コンプライアンスの分析
  • サプライチェーン混乱を予測し、調達を最適化する
  • オペレーション資産とプロセスの洞察による効率化の推進

オープンテキスト™ Analytics Database (Vertica)を使用して、GUESSがクエリを400倍高速化し、3 TBから36 TBに拡張し、80% のグローバルスタッフに洞察を提供した方法をご覧ください。


クラウド、ハイブリッド、最新の導入動向

クラウドネイティブウェアハウスはオンデマンドで拡張し、ハイブリッド設定はセキュリティと柔軟性のバランスをとり、マルチクラウド戦略はコンプライアンスと回復力を最適化する。

  • クラウドネイティブ・プラットフォームは簡単に拡張でき、リアルタイムの取り込みをサポートする。
  • ハイブリッド展開では、オンプレミスシステムとクラウド分析を組み合わせる。
  • マルチクラウド・アーキテクチャは、地域ごとのコンプライアンスとワークロード・バランシングを可能にする。

正しいデータウェアハウスの選び方

現在のデータソース、成長予測、クエリのニーズをマップする。最良の選択は、パフォーマンスを低下させることなく、10倍から100倍のデータとユーザーを処理できるように拡張することである。

  • 展開モデル:オンプレミス、クラウド、ハイブリッド
  • パフォーマンス要件:同時ユーザー数、クエリー速度、アップタイム。
  • データ量:スケーラビリティと保存形式(列方向か行方向か)。
  • セキュリティとコンプライアンス:暗号化、ユーザーの役割、データ主権
  • 統合:BIツール、API、データソースとの互換性。

オープンテキストはデータウェアハウスの利点をどのように生かすことができますか?

データウェアハウスは、それがもたらす洞察によって初めて価値を発揮するものであり、それはスピード、アクセシビリティ、データへの信頼によって決まる。OpenText Analytics Databaseは、エンタープライズグレードのパフォーマンスと、組み込みのガバナンスおよび高度な分析機能を組み合わせることで、これらのメリットを最大限に引き出します。

オープンテキストなら

  • 洞察までの時間を短縮- 高性能なクエリ実行により、アナリストは数十億レコードの複雑なレポートを数時間ではなく数秒で実行できます。
  • サイロ化を迅速に解消- レガシーシステム、API、クラウドプラットフォームなど、複数のデータソースとのシームレスな統合により、ウェアハウスにビジネスの完全な最新ビューが反映されます。
  • 信頼できるデータの維持- 組み込みのデータ品質、系統追跡、検証ワークフローにより、すべての意思決定が正確で検証された情報に基づいて行われるようにします。
  • パフォーマンスを低下させることなく拡張- 弾力的なスケーリングは、クエリの速度を低下させることなく、ワークロードの増大、ユーザー同時実行の増加、および大規模なデータセットをサポートします。
  • 高度な分析を可能にする- 組み込みのAI、機械学習、予測モデリングにより、チームは記述的洞察から処方的洞察へと移行することができます。
  • コンプライアンスと安全性を維持- エンタープライズレベルの暗号化、アクセス制御、監査ログが機密データを保護し、規制要件をサポートします。
  • 柔軟な導入- お客様のニーズやアーキテクチャに応じて、オンプレミス、ハイブリッド、プライベートクラウドのいずれかを選択できます。

データウェアハウスとOpenTextの分析・ガバナンスツールを組み合わせることで、データを保存・整理するだけでなく、測定可能なビジネス成果を促進するための戦略的資産に変えるプラットフォームを手に入れることができます。

クラウドリパトリシフト:データから読み取れること

200人以上のITリーダーが、データウェアハウスのクラウドオンリー戦略を見直し、オンプレミス、プライベートクラウド、またはハイブリッド導入を選択し、パフォーマンス、コスト効率、コントロールを取り戻そうとしています。

ガイドを入手する

脚注