データマイニングとは
データマイニング (Data mining)とは、収集された情報のなかから傾向や関連性を見出す分析手法です。売上予測や市場動向など、ある事象の発生予測やデータの類似性から新たな仮説を立てるなど、膨大なデータをビジネスに活かすのに役立ちます。
データマイニングで得られる知識(DIKWモデル)
データマイニングの多くは、マーケティングにおける課題を解決するために活用されています。例えば小売業においては、顧客データや購買履歴を用いてデータマイニングを行い、より効果的なキャンペーン施策が実施されています。そのほか製品・サービス改善や設備機器の分析など、活用先は業界を問わず多岐にわたるでしょう。
また、データマイニングを実施して得られる知識はDIKWモデルと呼ばれており、それぞれ以下のように分類されます。
- ■データ(Data):整理されていない数値
- ■情報(Information):「データ」を整理・カテゴライズしたもの
- ■知識(Knowledge):「情報」から得られる傾向・知見
- ■知恵(Wisdom):「知識」を利用して人が判断する力
一般的に、下に行くほど有用性の高いものと判断されます。
また、データマイニングで行えるのは知識発見までであって、実際にその「知識」に有用性があるのか、どう活用するのかは『人』の判断力にかかってきます。その点においては、データの取得から分析・課題解決までの一連の作業に重点をおく「データサイエンス」との違いであるといえるでしょう。
データマイニングの種類と分析手法
データマイニングはある事象の発生確率を予測したり、データを分類し相関関係を探索したりと、目的に応じて2種類の手法に大別できます。それぞれの特徴と具体的な手法をいくつか紹介します。
データの分析を自動化する「機械学習」
収集したデータからコンピュータが自分で学習しながら相関関係などを導き、顧客セグメントなど、人の手によらない新しい分類などを発見します。定義の難しい特性ごとにデータを分類するクラスタリングや、別の属性間での相関関係を分析するマーケット分析などがその一例です。これらは自ら仮説立てを必要としない点が特徴といえます。
また、「ある事象の原因の特定」や「顧客ごとの最適なマーケティングシナリオの選定」など複雑な条件が絡む課題の分析や最適化も得意分野です。データマイニングの有名な事例として、よく紙おむつとビールがあげられます。一見関係のないように見えるこの2つの商品も、売上データのアソシエーション分析から「スーパーマーケットでおむつを買う人が一緒にビールを買う傾向にある」ことがわかったそうです。
仮説を検証する「統計分析」
統計分析では多くの場合、事前に仮説をたて、必要なデータを集め、検証したい課題や事象にあわせて適切な分析方法を選定して分析します。分析結果を読み解き、効果検証を繰り返すため、統計学などの知識が求められます。
なお、統計学や確率論などを活用したデータマイニング手法としてよく知られるのは、「回帰分析」「主成分分析」「因子分析」です。
実際の分析現場では、必要に応じてあらゆる手法を組み合わせて、予測モデル構築や原因特定、最適化・最大化などのビジネスが必要とするアウトプットを分析結果として導きます。
データマイニングの分析手法についてより詳しく知りたい方は、以下の記事も参考にしてください。
データマイニングの手順
データマイニングを実施する際のフローは次のとおりです。
- 1.データマイニングで何を知りたいか、テーマや目的を決める
- 2.目的に沿ってデータ収集する
- 3.データを加工・整理し、分析しやすい形に整える
- 4.データのパターンや関連性などを分析する
- 5.分析結果から要因を特定し、効果検証を行う
データマイニング実施時のポイント
データマイニングは、売上増加や課題解決につながる分析手法ではあるものの、機械的に実施しただけでは必ずしも成果につながる結果を導き出せるわけではありません。収集したデータには誤ったデータも含まれており、より正確で一貫性のある分析を行うためにはデータクレンジングから効率的に進めることが重要です。プロジェクトの遅延や計画倒れなどのリスクを減らすことにも繋がります。
ここからは、データマイニングの実施をさらに具体的にイメージしていきましょう。
データ管理の場(データウェアハウスなど)を整備
データマイニングを行うために、まずはデータの収集が必要です。一般的には元となるデータが多ければ多いほど、有益な情報を採掘できる可能性が高まります。そのためデータマイニングに先んじて、データウェアハウス(DWH)をはじめとしたデータを管理できる場を設けるのがよいでしょう。
データウェアハウスは、大量のデータを保管するために設けられます。データの蓄積が目的であるため、データベースと違ってデータの削除・更新は原則として行いません。データウェアハウスについては、以下の記事でより詳しく解説しています。
データクレンジングを行う
データマイニングの精度をあげるためには、不要なデータを除去しておくことが大事です。データ量が少ない場合にはExcel関数を用いた方法でも実施できるでしょう。しかし、データ量の増加に応じて工数増と人的ミスが生じます。
RPAを活用したり、データクレンジングソフトを使い手作業を減らしたりして、データの信頼性を保ちましょう。
データマイニングツールの導入
データマイニングを実施するには、分析手法の選定や効果検証において知識や技術が求められます。担当者の育成コスト削減や業務にかかる負担軽減、効果の最大化といった観点からも、データマイニングツールの導入がおすすめです。
データマイニングツールを導入すれば、誰でも簡単に操作が可能なため、業務の属人化を防ぎます。データのグルーピングや類似性の抽出も迅速に行え、データ分析に要していた時間をコア業務へと振り替えられます。
データマイニングツールの具体的な製品が気になった方は、以下の記事で製品比較できます。選び方や導入時の注意点も解説しているため、参考にしてください。
データマイニングツールのもつ可能性
データマイニングツールを活用すれば、「人工知能」や「統計学」などの専門知識を基本レベルで理解しておくだけで分析結果を正しく読み解けます。データマイニングによって、従来行われてきた「顧客の購買情報にもとづいた営業戦略」などをさらに高度に実行できます。
また、Web検索技術の発達をうまく活用すれば「Web上の検索ワードに対してデータマイニングを行い、人々が何に関心を持っており、どのような視点で関心の対象を理解しているのか」を知ることも可能でしょう。
データマイニングツールでビッグデータを活用しよう
データマイニングを行うことで、これまで重要視されていなかったデータにも光を当てられます。例えば、「ショッピングモール内の温度、湿度、照明光度と売上との関係」といった、新たな視点からの相関関係も見出されるかもしれません。
いずれにしても「ビッグデータ」時代のいま「データマイニング」は企業の業績を飛躍させる大きなカギであることは確かでしょう。活用イメージがまだわかない場合は、具体的な製品比較をして、サポートを受けたりトライアルを行う方法もあります。以下より資料請求をして、製品の検討をしてみましょう。