DWH(データウェアハウス)とは
DWH(Data Ware House:データウェアハウス)とは、さまざまなシステムからデータを集めて整理するデータベースのことを指します。直訳すると「データの倉庫」という意味です。社内のシステムなど、さまざまなデータソースから大量のデータを時系列に整理して保管でき、データ管理、データ分析などの情報活用に欠かせないシステムです。
意思決定を助ける「データの倉庫」
DWHが誕生する以前は、目的のデータを探すだけでも大変なうえ、古いデータは削除をする必要があるなど、データ管理には多くの手間を要していました。
データ量が少ないうちはそれでも問題ありませんが、蓄積されるにつれて時間がかかる不便な作業となり、経営判断に有効活用することに対してのハードルが高くなっていました。
DWHは大量のデータの中から条件に該当するものを抽出したり、データの重複を避けて保存したりできるので、データ管理や活用の問題を解決することが可能です。ビッグデータをうまく活用することが求められる昨今のビジネスでは、不可欠なツールといえるでしょう。
横断的なデータ分析を可能にする
現在ビジネスシーンにおいて多数のITツールが利用されています。例えば、CRMや会計システム、人事管理システムなどです。
一般に、それらのデータは別個に保存されており、複合的にデータを把握するのは困難です。そこで、それらのデータを一か所に集約し、分析に活かすための仕組みが求められました。そうして開発されたのがDWHです。
目的のデータがどこに保存されているか分からなくても、DWHにアクセスすれば見つけられます。豊富なデータを活用でき、より高度な経営分析が行えるようになりました。
DWHとデータベース・データレイクなどとの違い
DWHと似たものに、データベースやデータレイク、データマート、BIがあります。これらの違いを見ていきましょう。
データベースとの違いは「分析の容易さ」
DWHとデータベースとの違いは、期待される役割にあります。
データベースは、データの保存や編集などさまざまな機能をもちます。言い換えれば、データ分析以外にも期待される点が多いということです。
それに対し、DWHはデータ分析に特化することを求められます。各システムのデータを時系列的に収集し、サブジェクト別に整理することでスピーディーな分析ができるのです。
具体的には、DWHは列のみの入出力が可能な点でデータベースと異なります。通常のデータベースは行単位でデータを読み込むため、データの抽出(列による選別)が苦手です。不要な列の情報も読み込む分、抽出に時間がかかります。
一方、DWHは列単位で情報を読み込みます。不要な列の情報は読み込まず、抽出対象のデータのみをピンポイントで抜き出せるため効率的です。
以下の記事では、DWHとデータベースの違いに関してより詳しく解説しています。「本当にDWHは必要なのだろうか」と疑問に思った方は、ぜひ参考にしてください。
データレイクとの違いは「非構造化データも対象か」
データレイクは、非構造化データも保管の対象となる点がDWHと異なります。
データレイクもデータを保管する点では同じです。しかし、DWHはExcelなどのように列と行の規則性を持った構造化データが対象であるのに対し、データレイクは構造化データに加えて電子メールや画像・動画、CADデータなどの非構造化データも保管対象になります。
データマートとの違いは「分析の対象範囲」
DWHとデータマートとの違いは、分析対象が広いか、狭いかという点にあります。
データマートとは、目的に沿って作成したデータベースのことです。例えば、顧客へのメール送信を目的に、「会員番号」と「メールアドレス」だけで構築したものなどが該当します。
データマートの特徴は、比較的簡単に構築できることです。データの中から欲しいものだけを抜き出して、小型のデータベースを作るような感覚で作成できます。必要な情報以外は排除できるため、分析も手軽です。
ただし、その分析対象は狭い範囲にとどまります。全社的なデータを統合的に扱えるDWHとは、分析対象規模に大差があります。
以下の記事では、DWHとデータマートとの違いに触れつつ、どちらを導入すべきなのかに関して詳しく解説しています。ぜひ参考にしてください。
BIとの違いは「活用範囲」
DWHとBIツールとの違いは、データの蓄積・整理で活用するのか、データの分析で活用するのかという点にあります。
DWHはあくまでデータを蓄積し、目的のデータを抽出するためのツールです。つまり、抽出したデータをどう活用するかを考慮したシステムではありません。
一方、BIはDWHで蓄積・抽出されたデータの分析ツールです。BIの特徴は、本来専門知識が必要とされるデータの分析を、知識がない人でも行えるという点にあります。したがって、DWHとBIは組み合わせて活用すべきツールだといえるでしょう。会社が得たデータをタイムリーに経営判断へと結び付けられます。
以下の記事では、BIツールとDWHの違いについて詳しくまとめています。BIツールとDWHの住み分けについてさらに詳しく知りたい方、BIツールにも興味がある方はぜひ参考にしてください。
DWH(データウェアハウス)の4つの機能
DWHには満たすべき4つの機能があります。それぞれの機能について詳しく解説します。
サブジェクトごとに整理する
サブジェクトとは、データの内容のことです。「商品」や「顧客」などの項目が該当します。
DWHに蓄積されるデータは、さまざまな基幹系システムから集約されたものです。しかし、システムごとに整理されていたのでは、集約した意味がありません。そのためシステムごとではなく、サブジェクトごとに整理する機能が必要です。これにより、散在するデータをまとまった1つのデータとして扱えるようになります。
例えば「顧客」ごとに整理する場合、すべてのシステムの顧客データがまとめられた形で出力されます。これにより、システム横断的な分析が実現するのです。
データを統合する
DWHはさまざまなアプリケーションから情報を集めます。しかし、集めた情報の内容や保存形式はバラバラです。したがって、DWHで一括管理するためには、それらの差異を解消しなければなりません。
例えば、複数のシステムから顧客情報を集める場合、単にそれらのデータを合わせただけでは、重複が生じます。これでは、実際に1人しかいない顧客がデータ上では複数人いることになり、不都合が生じます。また、取引先の会社名が、あるアプリでは「取引先」、ほかでは「会社名」という項目になっている場合も問題です。このままでは、同じものを指しているのに、別の項目として扱われます。
このような問題を解決するのがデータ統合です。表現の統一や重複の削除などにより、データの整合性を高めます。
データを時系列で整理する
DWHでは、現在のデータだけでなく、過去のデータも時系列で整理されることが求められます。
通常のデータベースでは、最新の状態を重視します。例えば、ある顧客の会員ポイントを探すと、真っ先に出てくるのは現在の会員ポイントです。それ以前のデータまで読み込んでいると、余計な処理時間がかかるためです。
一方、DWHでは、その顧客が会員になってから現在に至るまでのポイントの推移をすべて保存します。現在の状態だけが分かるのではなく、大局的な流れを把握できることで、経営判断に活かしやすくなるでしょう。
データを消さずに保管し続ける
DWHはデータを永続的に保管します。原則として、保存したデータを削除できません。なぜなら、時系列の履歴として残るためです。
ただし、DWHは無限にデータを保存できるわけではありません。容量が限界になれば、不要なデータを削除することもあります。
以下の記事では、DWHを導入することで解決できる課題とメリットについて詳しく解説しています。DWHの導入を検討している方は参考にしてください。
DWH(データウェアハウス)の活用例
ここからは、DWHの活用例について解説します。DWHで何ができるか、どのように活用するかを知り、自社で導入した際のイメージをより鮮明にしましょう。
CRMにおけるデータ活用
顧客の個人情報や購買履歴などのデータ収集・保管が必要となるCRMシステム(顧客管理システム)では、大量のデータが蓄積されます。DWHを活用してCRMのデータを時系列で保管し活用しやすくすることで、顧客の購買行動・購買傾向の分析や受発注の迅速さ、コールセンターの対応改善などの業務やマーケティング施策への効果的な反映が可能です。
BIツールと連携して活用
BIツールはデータ分析を得意とするツールで、DWHで蓄積・保管されているデータと連携して分析することで高度なデータ分析・可視化が可能になります。
BIツールは専門知識を必要とする高度な分析機能が搭載されているため、DWHとのデータ連携活用で、より的確な経営判断や組織の意思決定につながるでしょう。
DWHの比較・選定ポイント
DWHを導入する際の比較・選定ポイントは、以下の3つが挙げられます。
- ■提供形態
- オンプレミス・クラウド・SaaS・サービスなど、提供形態によって価格や導入スピード、カスタマイズ性やセキュリティなどに違いがあります。
- ■機能性
- データ処理速度やデータ容量の拡張性、ユーザーインターフェースの使いやすさやデータの連携性など、自社に適した製品を選定しましょう。
- ■コスト
- クラウド型は比較的コストを抑えて導入でき、オンプレミス型は初期費用は高いもののカスタマイズ性が高いなどの特徴があります。
以下の記事では、DWHの選び方について詳しく解説しています。DWH製品についても詳しく比較紹介しているので、興味がある方はあわせてご覧ください。
DWHの概要を理解してより効果的なデータ分析を
DWHとは、社内のさまざまなシステムに散在するデータを集約し、横断的なデータの活用を実現するツールです。CRMやECサイト、航空券予約システムなど、さまざまな分野で活用されています。
実際の製品について知ることでより具体的に導入効果やメリット、活用法が見えてくるので、まずは気になる製品の資料請求をしてみてください。