マーケターのためのデータ分析実践入門
活用ケース解説
顧客理解を促進させる
顧客セグメンテーション分析(2)
1. 属性ごとの基準を作成する ― 有効なグループ分けのルールを作る
先ほど、「30歳代」「女性」「ファッションに興味あり」「美容関連商品の購入総額 3万円以上」という属性の組み合わせによるセグメンテーションを例にあげました。しかし最も特徴的なグループを見つけ出すために、年齢属性のグループ分け基準が10歳ごとで良いのか、5歳区切りが良いのか、別の最適な区切り方があるかは検証が必要です。またどの属性を採用すべきかも一概には判断が難しいでしょう。
ここで有効なのがデータマイニングや統計解析などのデータ分析です。ある企業での活用を例に決定木(ディシジョン・ツリー)と呼ばれる分析手法を利用したセグメンテーションをご紹介します。
通信販売会社F社では会員属性や購買履歴データなどを使い、カタログを送付して商品Aを購入する確率が高いセグメントを発見するためにディシジョン・ツリー分析を行いました。
ディシジョン・ツリー分析では商品Aを「購入した」/「購入しなかった」の二値の結果(目的変数)に対して影響力の強い属性を順に抽出してグループ分けします。
データマイニング・ツールによる分析結果がこちらです。
出力結果上から下に見ていきます。分岐が上にあればあるほど、「購入する」「購入しない」という結果を分ける重要な要因となります。
一番上のボックス(ノードと呼びます)はデータ全体を表しています。12,700人の会員のうち、商品Aを購入した人が10%だったことを示しています。
2段目に表示されている最初の分岐は「趣味・関心事」で分けられています。趣味・関心事が「グルメ、海外旅行」のグループと「ギャンブル・スポーツ」のグループです。「グルメ、海外旅行」のグループでは26%が購入しています。
さらに3段目では「グルメ、海外旅行」グループは「購入金額合計」額で分けられています。購入金額が「1万円以上」のグループは500人ですが70%の高い確率で購入していることが分かります。4段目では性別で分岐しており、「女性」320人は92%と非常に高い確率であるという分析結果が得られました。
分析結果をまとめると、「関心事:グルメ、海外旅行」「購入金額合計:1万円以上」「女性」セグメントに属する320名のうち92%もの人が商品Aを購入したということが判明したのです。
このセグメントは商品Aを購入する確率が非常に高いグループであるといえるでしょう。データマイニングを活用することで、購入確率が高いセグメントを見つけるための条件やルール(モデルと呼びます)自動的に見つけることができるのです。
なお、データマイニングでは、「買わない人」の属性も同様に予測することができます。前述の例では、趣味・関心事が「ギャンブル・スポーツ」で、購入回数が5回未満、年齢50歳以上という属性で分類された560人のグループにおいて、「買わない人」の割合が100%となりました。こういった属性のグループにはアプローチをしないか、別の視点によるアプローチが必要ということになります。