データマートとは
データマートとは企業に蓄積された膨大なデータの中から、目的に応じて一部を取り出したデータベースです。
- <データマートの例>
- 顧客へのメール送信を目的として「会員番号」と「メールアドレス」だけを取り出して構築されたデータベース
データウェアハウス(DWH)との違い
データマートとデータウェアハウスを比較してみましょう。
|
データマート |
データウェアハウス |
特徴 |
分析対象が狭い・短時間での構築が可能・比較的安価 |
分析対象が広い・構築に時間が必要 |
データの使用範囲 |
一部門 |
全社で活用 |
サイズ |
100GB未満 |
100GB以上 |
データソース |
少ない |
多い |
データの構造 |
構造化データ |
構造化データ |
データウェアハウスは、企業全体のデータを蓄積した「倉庫」です。さまざまなシステムからデータを集約し分析に活かすことを目的とし、企業全体のデータを目的別・時系列ごとに管理できます。全社で活用できるインフラであり、横断的なデータ分析が可能なため、より高度な経営分析を実現します。
一方、データマートはデータウェアハウスを利用用途に応じてカスタマイズした細かい単位のデータベースです。分析対象は狭い範囲に限られるでしょう。しかし、必要な情報のみを保管するため、データウエアハウスよりも情報の取り出しが早く、分析がしやすいメリットもあります。
データマートとデータウェアハウスのどちらを構築すべき?
データウェアハウスはデータの一元管理により、運用コストの削減・業務効率の向上が期待できます。そのため、近年ではデータマート主体のデータベース体制から、データウェアハウスを取り入れる企業が増えています。
データマートは目的に特化したデータベースのため、使い勝手のよさがメリットといえます。短期間で構築でき、比較的安価な点もメリットです。しかし、データベースの管理には手間がかかるため、データマートが複数あると非効率です。
データマートからデータウェアハウスへ切り替える負荷は大きいため、急な移行はおすすめしません。まずは統合できるタイプのデータマートをベースに、データウェアハウスを組み立て、徐々にデータウェアハウスで情報を一元化していきましょう。
注目を集める「データレイク」とは?
社内にはログや画像ファイルなどの「非構造化データ」や、データ属性をタグ付けした「構造化データ」があります。データレイク(Data Lake)は、構造化・非構造化データを一元管理する保管庫です。
ビッグデータをそのまま扱うツールであり、保存データには一切処理を加えません。本来あるべき姿のデータを保管し、そのまま活用できます。
ビジネスではどのような情報が価値をもつかわかりません。データレイクがあれば社内のデータをすべて集約し、必要なタイミングで有効活用できます。保有しているデータを最大限活用するために、データレイクを取り入れる企業は拡大しています。
データウェアハウスやデータレイクの導入前にすべきこと
データウェアハウスやデータレイク導入前の注意点について解説します。
利用目的の明確化
データウェアハウスは、用途別に分類されたデータを時系列ごとに管理するものです。そのため、導入前には管理単位となる目的を決めなければなりません。重要なのは、データウェアハウスを利用してどのようなデータを分析・活用するのかを検討することです。データレイクを導入する場合も同様です。
利用目的を明確化せずにデータウェアハウスやデータレイクを構築すると、非常に使い勝手が悪いシステムになりかねません。また、用途ごとに誰が責任をもって管理するのか、運用体制を決めることも大切です。
予算の策定・確保
データウェアハウスやデータレイクがあれば社内のデータを有効活用できますが、構築・運用には大きなコストが発生します。
データレイクが必要な規模の企業であれば、管理・維持費だけで年間数百万円かかることも珍しくありません。さらに、運用担当者の人件費もかかるため、費用面の負担は大きいといえます。
また、集約しているデータを有効活用するために、BIツールを導入する可能性もあるでしょう。そうなると当然、BIツールの利用料金も必要です。システムの構築からデータ活用までの流れを考え、どれくらいの予算まで確保できるかを決めなければなりません。
データベースの運用負荷軽減量や、生み出される価値から費用対効果を算出して検討しましょう。
製品の比較検討
データウェアハウス製品にもさまざまな種類があり、製品ごとに強みとなる特徴が変わります。利用目的を明確にしていれば、どのような製品を選べばよいかわかりやすくなるでしょう。例えば、顧客の購入サイクルが短く、迅速な対応が求められる場合は、分析スピードの速い製品が好まれます。
また、データベースの分析には専門的な知識が必要になるため、社内の従業員の知識レベルで扱えるかどうかも重要です。既存の製品との連携やシステムの拡張が可能かどうかも確認しておきましょう。導入しても有効的に活用できなければ、導入後に後悔することになります。
データマートや各用語の意味を理解して最適なツール選択を!
データマートは、データウェアハウスから用途に応じて一部を取り出したデータベースです。データウェアハウスと違い分析対象の狭さが特徴です。
データウェアハウスは、社内のビッグデータを有効活用して新しい価値を創造できるため、近年需要が高まっています。
データマートとデータウェアハウス、そしてデータレイクの特徴をそれぞれ理解したうえで、自社にとって必要なシステムを選択しましょう。