マーケットバスケット分析とは
マーケットバスケット分析の概要を見ていきましょう。
一緒に購買されやすい商品の組み合わせを分析すること
マーケットバスケット分析は、購買データの分析により一緒に購入されやすい商品を明らかにすることです。データ分析によって新たな知見を得るデータマイニングの、代表的な方法として知られています。
マーケットバスケット分析の有名な例として、おむつとビールのエピソードがあります。分析の結果、おむつがビールと同時に購入される機会が多いことが判明したという話です。
両者が同時に購入されやすいのは、おむつを購入しに店を訪れた父親が一緒に自分のビールを買うからだと考えられています。このような商品同士の関連性は、人間が考えただけではなかなか見つけられないでしょう。しかし、マーケットバスケット分析を行えばこうした意外な法則も発掘できるのです。
さまざまな手法が使われる
マーケットバスケット分析は、一緒に購入されやすい商品を明らかにする分析の総称です。具体的な分析方法にはいくつかの種類があります。その中でも特によく用いられるのがアソシエーション分析です。
アソシエーション分析とは、膨大なデータから関連性の高いデータを見つけ出す分析手法です。これをレシートなどの購買データに適用すると、マーケットバスケット分析になります。
アソシエーション分析によるマーケットバスケット分析の方法
続いて、アソシエーション分析を利用したマーケットバスケット分析の方法を見ていきましょう。
1.評価指標の確認
アソシエーション分析では4つの指標を用いてデータ同士の関係性を数値化します。商品Aと商品Bの関係性を調べる場合を例に、指標の概要を紹介します。
- 支持度=同時購入者数/購入者全体数
- 顧客全員のうち、商品Aと商品Bを同時に購入する顧客の割合です。
- 信頼度=同時購入者数/商品A購入者数
- 商品A購入者のうち、商品Bも同時に購入する顧客の割合です。
- 期待信頼度=商品B購入者数/購入者全体数
- 顧客全員のうち、商品Bを購入する割合です。
- リフト値=信頼度/期待信頼度
- 期待信頼度(商品Bを単独購入する割合)に対する、信頼度(商品A購入者のうち商品Bを購入する割合)の割合です。
つまり、これが高いほど「商品Bは単独ではなく商品Aと一緒に買われやすい」と言えます。
2.表の作成・分析
次は表を作り、データを分析していきます。簡単な例を見ていきましょう。
- 【購入者数】
-
- 人参
- 25人
- 玉葱
- 60人
- ジャガイモ
- 40人
- ジャガイモかつ人参
- 20人
- ジャガイモかつ玉葱
- 20人
上記について全体の購入者数を100人としたとき、以下の表が作成されます。
商品A | 商品B | 支持度 | 信頼度 | リフト値 | |
---|---|---|---|---|---|
比較1 | 人参 | ジャガイモ | 20% | 80% | 2.0 |
比較2 | 玉葱 | ジャガイモ | 20% | 33% | 0.83 |
比較1・2は支持度だけを見ると同じになります。しかし、玉葱は単独購入される割合も高いため比較2の信頼度は低いです。
さらにリフト値を見ると比較2は1未満であるため、ジャガイモは玉葱と同時購入されるよりも単独購入されやすいと言えます。逆に、比較1を見るとジャガイモは単独より人参と同時に購入されるほうが2倍多いと判断できます。
マーケットバスケット分析を効率的に行う方法
マーケットバスケット分析はエクセルでも不可能ではありません。先ほど例に挙げたように、関数を用いて各指標の数値を算出して表を作れば可能です。しかし、膨大なデータについてそれを行うのは非常に手間がかかります。
したがって、本格的にマーケットバスケット分析を行いたいのであれば、データマイニングツールの導入をおすすめします。エクセルよりもはるかにデータの収集や計算が簡単です。さらに、算出した数値をグラフ化するなど、視覚的に分かりやすい形で示してくれます。難解な分析を円滑化する心強い味方となるでしょう。
マーケットバスケット分析を理解し、実践しよう!
マーケットバスケット分析は、一緒に購入されやすい商品の組み合わせを見つけることです。アソシエーション分析を始め、いくつかの手法が用いられます。
しかし、どういった手法を採用するにしても、膨大な購買データをエクセルなどで分析するのは困難です。そこで有効なのがデータマイニングツールです。
これを機に、ツールの導入を検討してはいかがでしょうか。