1. 有効な併買ルールを見つけ出す − アソシエーション・ルールの発見
Aという商品を購入する顧客はBという商品も購入する可能性が高いといった組み合わせや併買傾向のことを「アソシエーション・ルール」と言います。
「おむつを買う顧客は同時にビールも買う」という“おむつとビール”の事例が有名です。まったく異なるカテゴリーに属する商品が米国のとあるスーパーでは週末になると併買する顧客が多いというアソシエーション・ルールがデータマイニングによって明らかになったのです。
では、アソシエーション分析について、小売業のPOSデータを例に見てみましょう。アソシエーション分析で用いられる分析用データセットとデータマイニング・ツールでの分析結果は、図1のようなものです。
顧客IDはレジで会計した際の買い物カゴのID、または会計後に受け取るレシートIDだとイメージしてみてください。同じ顧客IDが付いた購入商品は、一回の買い物で一緒に購入された商品、ということになります。つまり顧客ID100000の買い物客やソーダ、ペプシ、ソーセージ、たばこ、シリアル、サルサソースを1回の会計で購入したことが分かります。
結果出力には併買商品の組み合わせが記載されています。結果出力の表には、「リフト値(Lift)」「支持度(Support)」「信頼度(Confidence)」「ルール(Rule)」という項目が並んでいます。ルールの1行目には、「野菜ジュース&鶏肉→バドワイザー」と記載されています。これは分析の結果から得られたルールであり、支持度、信頼度、リフト値はそのルールを評価する数値となっています。これらの数値について説明します。