データウェアハウス
でーたうぇあはうす
ひとことで言うと
業務システムのデータを時系列で統合・蓄積した分析専用データベースで、経営意思決定を支援する基盤。
解説
企業の意思決定支援のために、業務システムから抽出したデータを時系列に蓄積・統合した分析用データベース。サブジェクト指向、統合性、時系列性、非更新性の4つの特徴を持つ。ETL(抽出・変換・ロード)プロセスによりデータが収集され、OLAPやデータマイニングの基盤として利用される。
くわしく解説
データウェアハウス(DWH)は、複数の業務システム(販売・購買・会計など)から抽出・変換・ロード(ETL)したデータを時系列に蓄積し、経営分析や意思決定支援に特化したデータベースである。4つの特徴として、特定の分析テーマに焦点を当てたサブジェクト指向、複数システムのデータを統一形式に整えた統合性、過去から現在までの履歴データを保持する時系列性、一度ロードしたデータを更新しない非更新性が挙げられる。DWH上でOLAP(オンライン分析処理)を行うことで、多次元的なデータ分析が可能となる。データマートはDWHから特定部門向けに切り出したサブセットである。近年はクラウド型DWHも普及しており、大規模データの高速分析が可能になっている。
具体例で考えよう
量販店チェーンが全店舗の日次売上データをデータウェアハウスに蓄積し、地域別・商品カテゴリ別・季節別の多次元分析を行って仕入れ計画や販促戦略の意思決定に活用する。
試験対策ポイント
4つの特徴(サブジェクト指向・統合性・時系列性・非更新性)の暗記が最重要。OLAPとOLTP(業務処理)の違い、ETLプロセス、データマートとの関係も頻出。データマイニングとの違いも整理すること。