DWH(データウェアハウス)とは
まずはDWH(データウェアハウス)とは何か、詳しく見ていきましょう。
意思決定を助けるデータの「倉庫」
DWHは様々なシステムからデータを保存し、それを分析するために整理する、いわばデータの「倉庫」です。
以前まで、データの管理は簡単なことではありませんでした。目的のデータを探すだけでも大変なうえ、古いデータは削除するなど、多くの手間を要していました。
データが少ないうちはそれでも問題ありませんが、蓄積されるにつれて不便さが目に付くようになります。この手間がかかるせいで、データを経営判断に有効活用することに対してのハードルが高くなっていました。
DWHは、大量のデータの中から条件に該当するものを抽出したり、データの重複を避けて保存したりできるので、このような問題を解決できます。ビックデータをうまく活用することが求められる昨今のビジネスでは、不可欠なツールと言えるでしょう。
横断的なデータ分析を可能にする
現在のビジネスでは、多数のITツールが利用されています。たとえば、CRMや会計システム、人事管理システムなどです。
一般に、それらのデータは別個に保存されており、全体的な視点からデータを把握するのが困難です。そこで、それらのデータを一か所に集約し、分析に活かすための仕組みが求められました。そうして開発されたのがDWHです。
目的のデータがどこに保存されているか分からなくても、DWHにアクセスすれば見つけられます。豊富なデータを活用できることで、より高度な経営分析が行えるようになりました。
DWHとデータベース、データマート、BIとの違い
DWHと似たものに、データベースやデータマート、BIなどがあります。これらの違いを見ていきましょう。
データベースとの違いは「分析の容易さ」
DWH(データウェアハウス)とデータベースとの違いは、期待される役割にあります。
データベースは、データの保存や編集などさまざまな機能を持ちます。言い換えれば、データの分析以外にもやるべきことが多いということです。
それに対し、DWHはデータの分析に特化しています。各システムのデータを時系列的に収集し、サブジェクト別に整理することで、より詳細な分析ができるのです。
具体的には、DWHは列のみの入出力が可能な点でデータベースと異なります。通常のデータベースは行単位でデータを読み込むため、データの抽出(列による選別)が苦手です。不要な列の情報も読み込む分、抽出に時間がかかります。
一方、DWHは列単位で情報を読み込みます。不要な列の情報は読み込まず、抽出対象のデータのみをピンポイントで抜き出せるため効率的です。
以下の記事では、DWHとデータベースの違いに関してより詳しく解説しています。「本当にDWHは必要なのだろうか?」と疑問に思った方は。ぜひ参考にしてください。
関連記事
watch_later
2020.10.19
DWH(データウェアハウス)とデータベースの違いとは?
続きを読む ≫
データマートとの違いは「分析の対象範囲」
DWHとデータマートとの違いは、分析対象が広いか、狭いかという点にあります。
データマートとは、目的に沿って作成したデータベースのことです。たとえば、顧客にメールを送ることを目的に、「会員番号」と「メールアドレス」だけで構築したものなどが該当します。
データマートの特徴は、比較的簡単に構築できることです。データの中から欲しいものだけを抜き出して、小型のデータベースを作るような感覚で作成できます。必要な情報以外は排除できるため、分析も手軽です。
ただし、その分析対象は狭い範囲にとどまります。全社的なデータを統合的に扱えるDWHとは、分析対象規模が逆なのです。
データマートとの違いをご理解いただけたでしょうか。以下の記事では、DWHとデータマートとの違いに触れつつ、どちらを導入すべきなのかに関して詳しく解説しています。ぜひ参考にしてみてください。
関連記事
watch_later
2019.11.28
DWHとデータマートの違いとは?選び方・導入前にすべきことを解説
続きを読む ≫
BIとの違いは「活用範囲」
DWHとBIツールとの違いは、データの蓄積・整理で活用するのか、データの分析で活用するのかという点にあります。
DWHはあくまでデータを蓄積し、目的のデータを抽出するためのツールです。つまり、抽出したデータをどう活用するかは関係ありません。
一方、BIはDWHで蓄積・抽出されたデータを分析するツールです。BIツールの特徴は、本来専門知識が必要とされるデータの分析を、知識がない人でも行うことができるという点にあります。したがって、DWHとBIは組み合わせて活用すべきツールだと言えるでしょう。
誰でもデータを活用できるので、会社が得たデータをタイムリーに経営判断へと結び付けられます。
以下の記事では、BIツールとDWHの違いについて詳しく述べられています。BIツールとDWHの住み分けについてもっと詳しく知りたい方、BIツールにも興味がある方は是非参考にしてみてはいかがでしょうか。
関連記事
watch_later
2019.12.09
イラスト付きで解説!BIツールとDWHの違いは?
続きを読む ≫
DWH(データウェアハウス)の4つの要件
DWHには満たすべき4つの要件があります。それぞれ見ていきましょう。
1.サブジェクトごとに整理される
サブジェクトとは、データの内容のことです。「商品」や「顧客」などの項目が該当します。
DWHに蓄積されるデータは、さまざまな基幹系システムから集約されたものです。しかし、システムごとに整理されていたのでは、集約した意味がありません。
それらを、システムごとではなく、サブジェクトごとに整理する機能が必要です。これにより、散在するデータをまとまった1つのデータとして扱えるようになります。
たとえば、「顧客」ごとに整理する場合、すべてのシステムの顧客データがまとめられた形で出力されます。これにより、システム横断的な分析が実現するのです。
2.データが統合される
DWHはさまざまなアプリケーションから情報を集めます。しかし、集めた情報の内容や保存形式はバラバラです。したがって、DWHで一括管理するためには、それらの差異を解消しなければなりません。
たとえば、複数のシステムから顧客情報を集める場合、単にそれらのデータを合わせただけでは、重複が生じます。これでは、実際に1人しかいない顧客がデータ上では複数人いることになり、不都合が生じます。
また、取引先の会社名が、あるアプリでは「取引先」、ほかでは「会社名」という項目になっている場合も問題です。このままでは、同じものを指しているのに、別の項目として扱われます。
このような問題を解決するのがデータ統合です。表現の統一や重複の削除などにより、データの整合性を高めます。
3.データが時系列で整理される
DWHでは、現在のデータだけでなく、過去のデータも時系列で整理されることが求められます。
通常のデータベースでは、最新の状態を重視します。たとえば、ある顧客の会員ポイントを探すと、真っ先に出てくるのは現在の会員ポイントです。それ以前のデータまで読み込んでいると、余計な処理時間がかかるためです。
一方、DWHでは、その顧客が会員になってから現在に至るまでのポイントの推移をすべて保存します。現在の状態だけが分かるのではなく、大局的な流れを把握できることで、経営判断に活かしやすくなるでしょう。
4.データが消えない
DWHはデータを永続的に保管します。原則として、保存したデータを削除できません。なぜなら、時系列の履歴として残るためです。
ただし、DWHは無限にデータを保存できるわけではありません。容量が限界になれば、不要なデータを削除することもあります。
DWH(データウェアハウス)の活用事例3選
DWHを活用することで、どのようなメリットが得られるのでしょうか。ここではわかりやすい3つの活用事例を見ていきましょう。
1.CRMにおけるデータ活用
CRMとは顧客関係を管理することです。顧客をとの密接な関係を築くことで顧客満足度を向上させることを目的とします。CRMには多くの顧客情報が必要とされます。そこで活躍するのがDWHです。
たとえば、顧客の購買傾向を把握するために、購買履歴のデータが必要になります。DWHであれば過去の履歴をすべて保存できるため、どのような属性の顧客が何を好むのかを把握しやすくなるでしょう。
また、顧客が商品を購入する際には、多くのプロセスが関与します。たとえば、受発注システムの処理速度やコールセンターの対応品質は、購買行動に大きな影響を与えるでしょう。DWHを使えば、これらの情報をプロセス横断的に把握・分析し、効果的なCRMを実現します。
2.大規模ECサイトにおけるデータ活用
ある大手企業は、世界最大規模であるPB(ペタバイト)クラスのDWHを導入しました。この企業のECサイトでは常時1.4億個ほどの出品があり、それらのデータを蓄積・分析する基盤としてDWHを利用しています。具体的には、以下のような業務で利用されています。
- ■購買者経験の分析
- ■出品者経験の分析
- ■収益管理
- ■不正行為の監視
- ■サーバ監視
- ■顧客対応管理
- ■セキュリティ
DWHであればこれらの情報をまとめ、全体的視点から顧客の行動を把握できるようになります。個別にデータを管理するよりコストを抑えられ、分析の効率も向上します。
3.航空券の予約システムにおけるデータ活用
航空券の予約において重要なのは、空席を減らすことです。空席があればその分売上を損失することになり、逆に席が少なすぎるとオーバーブッキングが発生してしまいます。
しかし、航空券の予約は不確定な要素があるため、ちょうど満席にするのは困難です。例えば、一度予約してからキャンセルされることや、当日乗客が無断で来ないことがあります。
これらの問題にもDWHは有効です。顧客一人ひとりの過去の明細を確認し、キャンセルの傾向などを分析することで、高精度な予測が実現します。
DWHの概要を理解して、より効果的なデータ分析を!
DWHとは、社内のさまざまなシステムに散在するデータを集約し、横断的なデータの活用を実現するツールであり、CRMやECサイト、航空券予約システムなど、さまざまな分野で活用されています。
DWHとはどのようなものなのかについて、理解していただけたでしょうか。以下の記事では、DWHを導入することによってどのような課題を解決でき、その他にどんなメリットがあるのかについて詳しく解説されています。DWHを導入することを検討している方は、見てみてください。
関連記事
watch_later
2019.11.28
DWHで解決できる課題と導入メリットとは?
続きを読む ≫