ビッグデータの代表的な分析手法
ビッグデータの代表的な分析手法を6つ紹介します。
1.属性ごとの傾向やニーズが分かる「クロス集計」
クロス集計は、データを属性ごとに分け、その属性の傾向を把握する分析手法です。たとえば、マーケティングにおいては顧客を居住地や年齢、性別などの属性に従って分け、それぞれのニーズを把握するのに使われます。
複雑な計算を必要としない分、ビッグデータの分析手法の中では比較的扱いやすいものと言えます。一目見てデータの意味するところを理解しやすいため、プレゼンで活用されることも多いです。マーケティングのほか、アンケート集計や世論調査など、さまざまな分野で利用されています。
2.類似グループごとの傾向が分かる「クラスター分析」
「クラスター(Cluster)」は「集団」を意味します。つまり、クラスター分析とはデータを分類し、その集団ごとの特徴を分析する手法のことです。
クロス集計では年齢や性別のように明確な属性によってデータを分けますが、クラスター分析では類似性に基づいてグループ分けします。そして、各クラスターの特性を分析し、マーケティング施策やブランディングなどに活かします。
たとえば、アンケート結果や購買履歴に基づいて顧客を「流行への関心が強い」「高級志向」に分類したとしましょう。この場合、前者には新製品の情報を提供するメルマガを、後者には高品質な製品を紹介するメルマガを配信するといった施策が考えられます。
3.データ同士の相関性が分かる「アソシエーション分析」
データ同士の関係性は、人間が一目見ただけでは分からないことがあります。それを明らかにする分析手法がアソシエーション分析です。マーケットバスケット分析とも呼ばれます。
たとえば、「商品Xは商品Yと同時に購入されやすい」といった関係性を見出すことが可能です。これが分かれば、店舗で商品Xと商品Yを並べて陳列するなどの施策を検討できます。また、ECサイトでよく見られる「この商品を買った人はこちらの商品もチェックしています」といったレコメンドもアソシエーション分析を利用しています。
4.事象の発生確率を予測できる「ロジスティック回帰分析」
ロジスティック回帰分析は事象の発生確率を予測する分析手法です。分析の結果得られる答えは確率であるため、1(発生する)と0(発生しない)の間の数値となります。
マーケティングにおいては、ある商品が売れる確率を予測するのに使われます。そのほか、ロジスティック回帰分析は医療において病気の発症率を予測するために用いられることが多いです。
5.複数の要因を整理できる「決定木分析」
決定木分析とは、クロス集計を繰り返すことで複数の要因を踏まえてデータを分類し、関連性を見出す手法です。主にマーケティング分野で、ターゲットを絞り込むために用いられます。
例として、一度のクロス集計で「商品Xは地域Aでよく売れる」ことが判明した場合を考えてみます。この場合、地域Aで商品Xを販売すれば売れやすいと予測できますが、これだけでは不十分です。そこで、ほかの要因を踏まえて以下のようにデータを細かく分けます。
地域A →男→20代→独身
→既婚
→30代→独身
→既婚
→女→20代→独身
→既婚
→30代→独身
→既婚
このように細分化して各グループの特徴を分析すると、「商品Xは地域Aの30代既婚女性に売れやすい」など、ターゲットを絞り込めます。ちなみに、「決定木」と呼ばれるのは上図が枝を広げた木に見えるからです。
6.複雑なデータをシンプルにできる「主成分分析」
主成分分析は、複数の要因を持つデータを、一部の要因を排除することで単純化する分析手法です。マーケティングにおけるセグメント分析やブランディングに利用されます。
基本的に、要因が多いほうが正確な分析結果を得られます。しかし、多ければ多いほど良いというものではありません。多いほど分析が複雑化し、扱うのが難しくなるためです。
例として、ある顧客にアンケートを取ったところ「流行に関心が強い」「新しいものが好き」「中古品は買わない」といった結果を得られたとしましょう。これらを個別に扱うこともできますが、まとめて「新しいもの好き」とすれば分かりやすくなります。
ただし、データを単純化すると一部の情報が切り捨てられるのが難点です。上述の例で言えば「中古品は買わない」という情報自体は失われるため、「発売して間もない新製品の中古品は買うのか」を予測できなくなります。
ビッグデータを実際に分析する方法
ビッグデータの分析はエクセルでもできますが、実際にはBIツールやデータマイニングツールが用いられるのが一般的です。では、それぞれ紹介します。
BIツールの活用
BIとはビジネスインテリジェンスの略です。企業に蓄積されているデータを意思決定などに役立てることを言います。
そして、BIツールはBIを実現するためのITツールです。他のシステムと連携すれば自動でデータを収集し、高度な機能でそれを分析するだけでなく、結果を視覚的に分かりやすい形で示してくれます。ビジネスにおける重要な意思決定を高速化し、企業の競争力を高めてくれるツールと言えるでしょう。
データマイニングツールの活用
データマイニングはビッグデータを活用する手法の1つです。膨大なデータを分析し、有益な知識を獲得することを言います。この記事で紹介したビッグデータの分析手法もデータマイニングに含まれます。
そして、データマイニングツールは、その名のとおりデータマイニングを行うためのツールです。専門的な分析機能を備えており、分析に必要な労力を軽減してくれます。
ちなみに、BIツールとデータマイニングツールに明確な違いはありません。BIツールは意思決定を支援する、データマイニングツールは分析をするという目的の違いはありますが、機能や特徴には共通点も多いです。
ビッグデータを分析する際のポイント
ビッグデータを分析する際、どのような点に留意すればよいのでしょうか。いくつかのポイントを解説します。
- 【目標を明確化する】
- データ分析自体は自社の利益をもたらしません。分析結果を基に施策を実施してこそ意味があります。そのため、「商品取扱量を最適化したい」「顧客満足度を高めたい」など目標を立てましょう。
- 【分析を繰り返す】
- 一度の分析で有益な知見を得られることはあまりありません。さまざまなデータを複数の分析手法で分析しましょう。
- 【管理層の理解を得る】
- データの活用は一朝一夕にはうまくいきません。前述したように試行錯誤を重ねる必要があります。この点について、あらかじめ管理層や経営層の理解を得ておきましょう。
ビッグデータの分析手法を知り、実際に活用してみよう!
ビッグデータの代表的な分析手法は以下の6つです。
- ■クロス集計
- ■クラスター分析
- ■アソシエーション分析
- ■ロジスティック回帰分析
- ■決定木分析
- ■主成分分析
また、実際にビッグデータをするには以下のツールが用いられます。
- ■BIツール
- ■データマイニングツール
以上を踏まえてビッグデータを活用し、ビジネスに活かしましょう。