DWHとデータベースの違い
従来の「会計」や「販売」などのシステムにもデータベース機能はあり、それなりの量のデータを蓄積でき、帳票作成などの機能も用意されています。「顧客データが欲しければ顧客管理システムからインポートすればいいのでは?」と考える人もいることでしょう。
なぜ「DWH」という専用システムが必要なのでしょうか。普通のデータベースとの違いはどこにあるのでしょうか。
分析のしやすさ
一番の違いは「DWHは分析に最適化されている」ことです。というのも、一般にシステムが異なればデータの保存形態も異なるので、一方のシステムからもう一方のシステムへデータを転送する際には大きな負荷がかかります。データベースでこれを行う場合、処理に莫大な時間がかかってしまうのです。
たとえ時間をかけて1つのシステムにデータを統合しても、今度は集計や分析に時間がかかります。コンピュータにとって大変な負荷となり、一般的なデータベースでこれを行おうとすると、本業である会計や販売などの処理業務ができなくなる恐れもあります。
データの保存容量
DWHは、ストレージ容量が多いことも特徴です。通常のデータベースを利用した場合、データ量が大きくなると容量の限界を超えるため、明細データではなく集計したサマリデータの形で保管せざるを得ません。これでは長期にわたる「顧客動向」「売上推移」などの分析ができなくなってしまいます。
DWHの必要性
DWHとデータベースの違いについて整理しましたが、DWHが企業に注目されたのはどのような背景があったからなのでしょうか。ここからはDWHの必要性を解説していきます。
目的別・時系列データの有用性
DWHには提唱者がいます。米国のコンサルタントであるビル・インモン(William H. Inmon)氏という人で、1990年の自身の著作でデータウェアハウスを「意志決定のため、目的別に編成された時系列に統合されたデータの集合体」と定義しています。
目的を「意志決定」と明確化しているところがポイントです。ただの「データの倉庫」ではなく、意志決定を目的として整然(時系列)に蓄積された「集合体」でなければいけないということを意味します。
システム横断型分析の有用性
では、これ以前はどうだったのでしょうか。日本はもちろん欧米の企業でも、すでにコンピュータによるシステム化が進んでいました。小さいものはパソコンで、大型になるとオフィスコンピュータやメインフレームで、さまざまな業務をシステム化していきました。
たとえば「会計」「販売」「顧客」「生産」「在庫」「購買」という具合です。ところが、これらのシステム化された業務は単独で構築されているため、複数のシステムのデータを組み合わせて分析することができませんでした。そこで、データの統合的な分析を可能にする、分析特化型のデータ集合体の必要性が出てきたのです。
DWHの活用例
典型的な活用例としては、POSシステムのデータ分析でしょう。小売店で取り扱う商品数は数百から数千点以上、毎日レジで入力される販売実績が蓄積された膨大なPOSデータ分析にDWHは適しています。
たとえば、お客様情報や商品情報を現場で利用するため、情報を蓄積、瞬時に分析結果を表示したいというニーズがあるとします。バイヤーは商品を仕入れるため、接客担当者は顧客の動向を確認するためのデータ活用という考えです。
販売管理システムのデータベースからデータを抽出してエクセルなどで加工すれば、何とか分析することはできますが、データの抽出や加工に時間がかかり、分析結果を得られるまで数時間、あるいは数日を要してしまいます。これではタイムリーな判断や改善活動は不可能です。
DWHを利用することで、数年分のデータを蓄積・分析し、ほぼ瞬時に結果を表示できるようになります。
- 【その他の活用例】
- ・通常の販売データと異なる数値を発見し、早期に対策
- ・販売、顧客、地域などのデータから効果的なマーケティング戦略を立案
- ・顧客の離反、休眠化を防ぐための要因分析と対策
- ・傾向分析からサービス手数料や値引き金額の設定
DWHとデータベースの違いを理解して、データの有効活用を!
このようにDWHは、社内に散在しているデータを統合して、意思決定に役立つ判断材料をデータの中から見つけるために利用されます。ビッグデータのように膨大なデータではなくても、社内に価値のあるデータが眠っていませんか。そのままでは扱いにくいデータをDWHで蓄積し、「データ資産」として活用してはいかがでしょうか。