DWHとは?
DWH(Data Ware House)は社内に分散しているデータを統合し、分析できるように整理するデータベースの1形態で、以下の特徴を持ちます。
- 統合管理
- 基幹システムなど社内のさまざまなシステムに格納されているデータを統合。書式や表記を統一することで、利用しやすい状態に保ちます。
- 時系列で保存
- データ分析で動向を把握するため、時系列でデータを保存。たとえば基幹システムのデータを追加する際は、古いデータを残したままデータの変化を発生順に格納します。
- サブジェクト指向
- データをサブジェクト(主題)ごとに管理。たとえば商品販売記録であれば、顧客名や品名、品番、販売日、販売数などの項目の組み合わせごとにデータを管理します。
以上の特徴により、DWHは目的の情報をスムーズに取り出すことに特化したデータベースといえます。
OLAPとは?
続いて、OLAPの概要を見ていきましょう。
オンライン分析処理のこと
OLAPとは「Online Analytical Processing」の略で、日本語に訳すと「オンライン分析処理」となります。OLAPツールは、DWHに蓄積されたデータを使って、さまざまな視点からリアルタイムで分析するためのツールです。
OLAPツールはデータサイエンティスト向けではなく、一般のビジネスマン向けです。SQLなどの問い合わせ言語を利用することなくデータを分析できます。表やグラフなど分かりやすい形でデータが提示されるなど、初心者が使いやすい製品も増えています。
BIシステムの一部
BIとは「Business Intelligence」の略で、データ分析、蓄積や抽出、レポート作成まで行い、経営戦略策定や意思決定を支援する技術を指します。BIシステムはBIに必要なあらゆる機能を総合的に持つツールです。
それらの機能のうち、データ分析を担うのがOLAPです。BIシステムを構成する包括的なソフトウェア群の一部として提供されます。
OLAPツールは、DWHからキューブと呼ばれる独自のデータベースを構築し、データを分析します。キューブは多次元的なデータベースなため、OLAPツールでは複数の視点からのデータ分析が可能です。
OLTPとは?
OLAPと混同されやすいものに、OLTPがあります。その概要を見ていきましょう。
オンライントランザクション処理のこと
OLTPは「OnLine Transaction Processing」の略で、日本語に訳すと「オンライントランザクション処理」となります。基幹システムはOLTPの一例です。トランザクション処理とは、複数の処理や操作をまとめて実行する形式のことです。
たとえば、ECサイトで商品を購入する際、決済と商品発送手続きは同時に行わなければなりません。これは商品の所有権が、決済と同時にECサイト運営会社から購入者に移転するからです。そのため、リアルタイムでトランザクション処理する必要があります。
また、OLTPではパフォーマンスを重視するため、データベースには最近の履歴だけを残します。この点がDWHと大きく異なります。DWHの場合、データは更新されず、消すことができません。
データ処理方法の一つ
OLTPの特徴は、処理方法がトランザクション処理であることだけではありません。それがオンライン(リアルタイム)で行われるのも特徴です。
リアルタイム処理ではない方法を、バッチ処理と呼びます。バッチ処理では、即座に処理する必要のないものを保存しておき、あとでまとめて処理します。たとえば、データのバックアップはバッチ処理です。
OLAPとOLTPの違いって?
OLAPとOLTPはどう違うのでしょうか。
使用するデータベース
OLAPではDWH、OLTPではそれ以外のデータベースが用いられます。なぜなら、OLAPとOLTPでは得意な処理が異なるためです。
OLAPは大量のデータを分析する方法です。したがって、大量のデータを保存するDWHと相性が良いと言えます。
一方、OLTPは小さいデータを高速処理できるのが特徴です。逆に、大量のデータを処理するのには向いていません。したがって、DWHとは正反対の特徴を備えたデータベースが必要になります。
データの処理目的
OLAPとOLTPはリアルタイムでデータを処理する点では共通しています。しかし、その処理目的は異なります。OLAPのデータ処理目的は、データ分析で、社内でビジネスマンが利用するのが一般的です。
一方、OLTPは基幹システムなどのリアルタイム処理で採られる手法です。多くの場合、ユーザーによるアクションへの即時対応が目的となります。
DWHの活用例
DWHの活用例を見ていきましょう。
ECサイトでの全面的な活用
あるECサイト企業は、毎月約8,000万もの訪問者を抱えています。そのユーザーのあらゆるデータを分析するために、ペタバイト級のDWHを活用しています。
具体的な活用対象は、購買者エクスペリエンス分析や不正監視、購買傾向分析、情報セキュリティなどです。
POSシステムのデータ分析
POSシステムとは、レジシステムと連動して物品の売上データを記録するシステムです。日々販売される物品の膨大なデータを保存しなければならないため、DWHが適しています。
DWHは時系列でデータを保存するため、年単位での売上分析も可能です。過去のデータから、目的のものを瞬時に抽出できます。
OLAPツールと連動させた場合、エクセルのようにデータを取り出すのに時間がかからないため、リアルタイムな分析が実現します。
DWH・OLAP・OLTPの違いを知りデータの有効活用を!
DWH・OLAP・OLTPの違いは以下のとおりです。
- DWH
- 大量のデータを統合的に保存するデータベース。抽出を容易にすることで分析を円滑化する。
- OLAP
- リアルタイム分析を行う。大量のデータを扱うためDWHと相性が良い。
- OLTP
- リアルタイムでトランザクション処理を行う。小規模なデータの高速処理に優れる。
以上を踏まえ、データを有効活用しましょう。
以下の記事では、DWHとは何かについてより詳しく解説しています。DWHについてもっと詳しく知りたいという方は、ぜひ参考にしてみてはいかがでしょうか。