DWH導入前に見られる3つの課題
企業の日常業務は、DWHが導入されていなくても基幹系システムがあれば遂行できます。しかし、いざ本格的なデータ分析を実行しようとすると、以下のような問題が起こってしまうでしょう。
1.データが各所に分散している
全社のデータを分析したくても、もし開発部門のデータと顧客からのフィードバックが別の場所に保存されていたら、データを収集するところから始めなければいけません。
仮に必要なデータが集まったとしても、データが統一されていなければ分析可能な状態に加工するためのコストがかかってしまいます。例えば同じ顧客の情報でも、部門が異なると「男性」というデータが記録されていたり、「M」というデータが記録されていたりするということがあります。
2.データの分析に時間がかかる
分析に必要なデータにアクセスできたとしても、いざ大規模な分析を実行しようとすると、クエリの処理に膨大な時間がかかってしまい、効果的な分析作業ができないことがあります。これは、通常のデータベースが分析に必要なクエリを処理する能力を持っていないためです。
3.古いデータが残っていない
基幹系システムでは業務を遂行するのに必要なデータさえ保持されていればよいので、古いデータはディスクスペース確保、処理速度維持といった理由で順次削除されていきます。このため、長期間のデータを分析したいと思っても、該当期間のデータが削除済みで実行できないことがあります。
これらの課題を解決できるのが、大規模データの分析に特化したDWHです。次に、DWHを導入することによって、それぞれの課題をどのように解決できるのかを見ていきましょう。
DWHを導入する4つのメリット
データ運用における上記の課題は、DWHを導入することにより、どのように解決できるのでしょうか。以下の4つのメリットに分けて解説していきます。
1. データ収集を簡略化できる
DWHには、全社のあらゆる部門のデータが集積されますから、各部門からデータを取り寄せる手間はかかりません。また、部門ごとに「男性」や「M」といった異なるデータが使用されていた場合は、いずれかに統一したフォーマットに変換して格納されます。よって、利用者は必要な分析作業に集中することができるでしょう。
2.大量のデータを高速に処理できる
DWHの専用ハードウェアでは、分析に特化したアーキテクチャを採用しているので、従来型のシステムと比べて検索性能が飛躍的に改善されています。具体的には、1つのクエリ処理に対して複数ノードがそれぞれ独立してデータを処理することで、大量データの高速処理が実現するのです。
3.変更されたデータの履歴も参照できる
基幹系システムでは顧客の住所変更などが発生すると、住所データを上書きします。一方、DWHでは古い住所データを保持したまま、新しい住所データを追記していきます。
例えば、売り上げなどで記録ミスがあった場合、誤った元データ、正しい修正データを両方とも保持するのです。こういった履歴を含むデータによる分析が可能なのも、DWHの特徴であると言えます。
4.長期的に顧客の動向を分析できる
基幹系システムでは日次、月次、週次、期次といった周期でデータが算出されます。これらのデータは、順次DWHに送られ、格納されます。
基幹系システムでは算出から一定期間でデータが削除されるのに対し、DWHでは最低でも数年単位でデータを保持するため、基幹系システムのみでは不可能な「長期間にわたる顧客の動向」といったデータ分析も、DWHを導入することによって行うことが可能になります。
社内データを有効活用するために、DWHの導入検討を!
DWHを導入することによって、データに関する様々な課題を簡単に解決できます。しかも専用ハードウェア製品の場合、データサイズに合わせて小規模な投資から利用可能です。自社に蓄積するデータを最大限活用するためにも、DWHの導入を検討してみてはいかがでしょうか。
以下の記事では、様々なDWHシステムを比較しています。「実際にどのような製品があるのか知りたい!」という方は、ぜひ参考にしてみてはいかがでしょうか。
関連記事