データマイニングとは
データマイニング (Data mining)とは、大量のデータを統計学や人工知能などの分析手法を駆使して、「知識」を見出すための技術です。データマイニングという言葉の示す通り、情報(データ)から有益なものを採掘(マイニング)できます。
ITビジネスの分野では、近年「ビッグデータ」が注目を集めています。それに従い、ビッグデータを有効に活用するための手段として、データマイニングにも注目が集まっています。他にもCRMで顧客情報を管理する際にも利用されているのです。
データマイニングで得られる知識
データマイニングを行うことで得られる知識とは、どんなものなのでしょうか。情報を分類すると以下の4つに分けられます。
- ■データ(Data):整理されていない数値
- ■情報(Information):「データ」を整理・カテゴライズしたもの
- ■知識(Knowledge):「情報」から得られる傾向・知見
- ■知恵(Wisdom):「知識」を利用して人が判断する力
これはDIKWモデルと呼ばれており、下に行くほど有用性の高いものと判断されます。
データマイニングで行えるのは「知識」を見出すところまでであって、実際にその「知識」に有用性があるのか、どう活用するのかは『人』の判断力にかかってきます。また、このデータの蓄積から分析を生かして課題を解決するのが、データサイエンスの領域になります。
データマイニングの事前準備

準備その1: データマイニングの元となるデータの収集
データマイニングを行うために、まずは実際にデータを収集することが必要です。一般的には、元となるデータが多ければ多いほど、有益な情報を採掘(マイニング)できる可能性が高まります。そのためデータマイニングに先んじて、「データウェアハウス」を設けるケースも少なくありません。
データウェアハウス(DWH)とは
「データウェアハウス」はまさに情報(データ)の倉庫(ウェアハウス)であり、大量のデータを保管するために設けられます。
しかしいわゆる「データベース」とは、少し異なります。データウェアハウスはデータベースとは異なり、登録されたデータの削除や更新を原則として行いません。データウェアハウスは、データを蓄積することが目的だからです。
関連記事
watch_later
2019.11.28
DWHで解決できる課題と導入メリットとは?
続きを読む ≫
データマイニングとデータウェアハウス(DWH)の関係
そしてまた、改変されずに次々と積み上げられた情報の中にこそ、データマイニングによって採掘される原石が眠っているのです。したがって、データマイニングを行う上では、データウェアハウスの存在は欠かせないものとなっています。
ただし、データウェアハウスがデータマイニングを利用する前提のもと構築されている場合に限ります。また、データマイニングを利用する上でデータウェアハウスが必須となるわけではないので注意しましょう。
準備その2: 収集したデータの加工
収集されたデータは、データマイニングを行えるように加工されています。データマイニングはコンピュータシステム上で行うことがほとんどなので、データマイニング用のシステムに合わせて、システム上で動作可能な状態へと加工する必要があります。
特に、数値データや記号データといった「データ形式」は、原則としていずれかに統一する必要があります。また正確な結果を出すには、「正規化」などを施す必要もあります。こうしたデータの加工を「クレンジング」と表現する場合もあり、効果的なデータマイニングを行う上で非常に重要なステップとされています。
データマイニング2つの具体的手法

事前に仮説を用意しない「機械学習」
データの収集と加工が完了すると、実際にデータマイニングを実施することになります。
さまざまな手法や技術が用いられますが、代表的なものにはまず、「人工知能」などを活用した「機械学習」といわれる手法があります。「機械」とはコンピュータのことです。コンピュータの性能が上がり、ビッグデータの時代になり急速に発展している手法です。
「機械学習」では、事前に仮説を想定する必要がありません。データの中からコンピュータが自分で学習しながら相関関係などを導き、人ではできない新しい分類(顧客セグメント)などを発見してくれます。あるいは、「ある事象の原因の特定」や「顧客ごとの最適なマーケティングシナリオの選定」など複雑な条件が絡む課題の分析や最適化も「機械学習」の得意分野です。
事前に仮説をたてる「統計分析」
統計学や確率論などを活用したデータマイニング手法です。代表的な統計手法は「回帰分析」「主成分分析」「因子分析」などがあります。
統計分析では多くの場合、事前に仮説をたて、必要なデータを集め、検証したい課題や事象に合わせて適切な分析手法を選定して分析します。分析結果を読み解き、このサイクルを繰り返し実行します。そのため統計学などの知識を有する人物が必要となりますが、データマイニングツールによってある程度の専門知識を補ってくれる製品があります。
実際の分析現場では、必要に応じてあらゆる手法を組合せて、予測モデル構築や原因特定、最適化・最大化などのビジネスが必要とするアウトプットを分析結果として導きます。
いずれにしてもデータマイニングを行うには「大量の元データ」「データマイニング用のシステム」「データマイニングに必要な知識を有する人物」という3要素が欠かせません。
データマイニングの分析手法
データマイニングで主に活用される解析手法を3つ解説します。
手法1.クラスタリング
クラスタリングとは、購買データから似たような行動をしている人をグルーピングし、グループごとに適切な施策を打つ手法です。マーケティングにおいて、顧客セグメントを作成する際に活用されることが多くあります。
手法2.ロジスティック回帰分析
ロジスティック回帰分析は、「YES」と「NO」を明確に定義できるものの予測に役立つ手法です。例えば、顧客データからキャンペーンを行ったときに購入してくれる確率を予測できます。
手法3.マーケット・バスケット分析(アソシエーション分析)
マーケット・バスケット分析は、製品やサービスの相関性を見つける手法です。よく耳にするのが、「おむつとビールは一緒に購入される」という事例です。この相関性から、おむつ売り場の隣でビールを売ることで、売上を上げられました。
関連記事
watch_later
2019.11.28
データマイニングの分析手法とは?活用例もご紹介!
続きを読む ≫
データマイニングの持つ可能性
データマイニングツールを活用すれば、「人工知能」や「統計学」などの専門知識を基本レベルで理解しておくだけで、分析結果を正しく読み解けます。データマイニングによって、従来行われてきた「顧客の購買情報にもとづいた営業戦略」などを、さらに高度に実行できるようになります。
また、Web検索技術の発達をうまく活用すれば「Web上の検索ワードに対してデータマイニングを行い、人々が何に関心を持っており、どのような視点で関心の対象を理解しているのかを知ること」も可能でしょう。
ビッグデータを活用してデータマイニングを行おう!
データマイニングを行うことで、これまで重要視されていなかったデータにも光を当てられます。たとえば、「ショッピングモール内の温度、湿度、照明光度と売上との関係」といった、新たな視点からの相関関係も見出されるかもしれません。
いずれにしても「ビッグデータ」時代の到来した現代において「データマイニング」は企業の業績を飛躍させる大きな可能性を秘めています。ぜひデータマイニングツールをみて、導入を検討してみて下さい。
関連記事
watch_later
2020.11.24
データマイニングツール比較10選!選び方・導入の注意点とは?
続きを読む ≫