Data Scientists Special Talk Session
データサイエンティストが語るアナリティクスの現在と未来

【 前編:アナリティクスの現在を語る 】(4/4)

分析が、施策、実世界へと繋がる喜び

―― ここで、フィールドで実際にお仕事されている皆さまから、データサイエンティストとして印象に残った仕事などをご紹介いただけますでしょうか?現場のリアリティという面で、読者の方々にもご参考になるかと思います。山下さん、いかがでしょうか。

山下 一番嬉しいのは、お客様とゴールを決めたその時に、ほぼ当初の設定通りに行けた場合ですね。例えば、在庫のレベルが最終的にこれくらい下がったとか。需要の予測とか。そういうビジネスゴールにつながった時が、私は一番印象に残ります。

―― 自分で立てた仮説が検証されて、それがビジネスのペイン解消に繋がるところが、この仕事の醍醐味でもあると。

山下 まさにその部分ですね。お客様は、そのためにデータを活用したいし、そのためにSASを選んでくださっているわけです。ですからその価値を証明できた時は、やはり、次のやる気に繋がります。

孝忠 SAS Technical Newsの連載の中でも、事例を幾つか書かせていただいたんですが。分析した結果が実世界に落とし込まれた時。施策に落ちたものを目の当たりにすると、実感が違います。
 例えば、特定の嗜好を持ったお客様に、一押し商品のクーポンを送るといったOne to Oneレコメンデーション施策の場合、実際にその商品が店頭に並んでいて、クーポンを使って購入しているお客様を目の当たりにすると…「あ、自分が手がけた施策だ」と嬉しくなりますね。

―― なるほど。施策がかたちになっていた時ですね。

孝忠 マーケティングオートメーションのようなレコメンデーション業務においては、どんな商品を誰に届けるか、それをどう店舗に品揃えしていくかといったマーケティングの中心に、データサイエンティストとしての自分が存在します。これは非常に裁量権の大きな状態で、そういう業務に携わることができると面白いですね。

いつどこで、仮説は生まれるのか?

―― 辻さんはいかがでしょう?

 面白さでいえば、やはり仮説通りに結果が得られるか否かの部分かなと思ったんですが…。よくよく、どこで仮説が出ているのかな?ということを考えてみますと。

―― 仮説が生まれるタイミングですか?

 はい。事業会社は業務の中で仮説が生まれたりすると思うんですが、対して孝忠さんや私たちは、お客様のデータを用いるので仮説が生まれるタイミングは違うかもしれません。つまり…お客様のビジネス課題は理解できました。データを預かりました。けれどもその時点では、どうしたらそれが解決できるのか、どんな手法が適切なのかまでは、まだわからないんですね。
 それで、いつ仮説が生まれるのかを考えてみると…データを預かると私、ずっと見ているんですよ。生のデータを。この時間が長い。そして、実はこれが面白い。例えばECサイトのデータのログを拝見したとして、ID、日付ごとに並び替えたとします。

―― それは、取引ログでしょうか?

 閲覧ログと取引ログの両方です。そうすると、そのお客さんがスッと買ったのか、何と何とを比較しているのかが見えてくる。比較的金額が低いものは、興味があればすぐにカートインしている。しかし10万円を越えると、何回も見にきている。卑近な例で言えば、そういうことに始まって。

―― まずは生ログをフラットに観察していると、おのずと何かの事象が浮かび上がって見えてくるといったことでしょうか。

生ログに触れ、親しむ時間の重要性

孝忠 あ、辻さん、それは私も…。私がデータサイエンティストを目指す若い人たちに最初に言うのは、とにかく生ログを見ろと。これは絶対に言うんです。
 生ログを見るのは、苦しくて面倒な作業でもありますから、データを渡すといきなり集計を始めたり、グラフにしたりする人が多いんですが。それは、沢山ある情報をぎゅっと潰しちゃうことになるんですよね。その潰したデータから仮説を立てようとしても、もう情報がごそっと抜け落ちた状態になっている。
 だから生ログに当たって触れて、何というか、データと親しむというか…(笑)。そういう時間が絶対に必要なんです。

 人間の行動とは、本当にパタンで動いているものなんだなと、データを実際に見たらよくわかるんですよね。鉄道の乗車ログなどを拝見すると、多くの人たちは、朝に出て行く時間が大体決まっているんですが、しかし一定の割合で、夜も決まっている人がいるなとか。

―― そういったデータも取れるんですね?

 必ず同じ場所の自動販売機でジュースを買っているな、とかね。ということは、この自販機は事業所にあるのか、どうだろうとか。そういう謎が色々と出てくると、全然ビジネスに関わらないものもありますけれど、その中から、何となくの構造が…データの動きの構造が把握できてくる。

―― 山下さんも、同感という感じですか?

山下 データを俯瞰して見ていって、当たりや感覚を付けるというのは、非常に共感する部分です。

データに“嗅覚”を働かせる

―― 伺っていて非常に不思議な感じがしたんですが、一般的なイメージは、逆じゃないかと思うんです。データが膨大過ぎて見切れないから、帰納法的手法で何かルールを導き出すというような。ところがお二人は、膨大なデータそのものから何かを見出して、そこから演繹して全体を掴んでいくと。この辺り、もう少し詳しくお伺いできましたら。

孝忠 全部の全部は見ないんですよ。そこは勘所のようなものがあって…非常に経験が要求される部分ではありますが。ですからまったくの新人に「生ログは全部見て」というと、本当に全部見ちゃうから(笑)、そこは何というか…。鼻が良いっていうか。嗅覚があって、ここかな?フンフンみたいな感じで。

―― あの、そのスキルは育成できるものなんでしょうか?

山下 私も今、そう思ったんですが(笑)。そこは明文化されてないけれども、プロならではの、伝授しうるスキルがあるんでしょうか。

孝忠 SASの鼎談だから、というわけではありませんが、SASでは「データ探索」という言葉を提唱されているじゃないですか。今の私たちの話も、実はそのデータ探索に限りなく近しい話で。SAS的にはおそらく、Visual AnalyticsVisual Statisticsのコンセプトに該当すると思うんですが。それをもっと細かく、目視と人力でやる。それが、生ログを見て何かをピックアップするという行為なんですよね。

Analytics-nowandfuture-top

 事業会社の方々は、日々のビジネスに対する感覚も自ら持っていらっしゃるので、「見ずともわかる」データの部分もあると思いますが。いずれにせよ勘所を付けた上で、自分で仮説を持って、集約、探索と進んでいく。
 というのも、仮説を持たないと、探索はありえないと思うんですよ。どちらを見て、何をしていったらいいかがわからないので。それと私の場合はやっぱり「面白いな」があったから今日までやっているという、単純な理由がありますね。

―― 山下さんは、お二人の意見と違うような感じも…。

山下 いえいえ、同じですよ。付け加えるなら、仮説そのものを作るために事前に何かを行うということも、最近ではあるのかな。傾向等がまったくわからない状況で、仮説ありきではなく、何か想定外のことをオートマチックに発見するとか。そういう流れはあるかもしれませんね。

ツールが威力を発揮する地点

―― なかなか高度なお話なので、資質的なものも関係するかもしれませんが、そういったスキルを養う際に、SASのようなツールが道具として役に立つことはあるでしょうか。

 

山下 現在、どのようなツールがあるのか、使えるのかを見ていくのは、もちろん意味があると思います。ただ、今のお話を踏まえると、道具だけの問題ではないのかな。

孝忠 生ログを見るというのは、辻さんの「興味がある」っていう話に通じる部分があって。そういう気持ちが根底で必要なんですよね。そうなった人は、どんどん見たくなる。すると、ツールの力が非常に重要になります。見たいものがより見やすくなるとか、負荷が軽減される、探索がしやすくなる…そういった世界観ですよね。

 人によってやり方はさまざまだと思うんですけど、私の場合はある種のパタンがあって。最初は理解する必要があるので、ログを見ます。何らかの傾向があるのかないのか、変なデータは入っていないか。それらを肌感覚でつかむために、ザーッと見ていきます。
 その後に、今度はちょっとピックアップしながら「こんな人たちは、どういう動きをしているのかな?」と注目していく。そして「こうじゃないのかな?」と何らかの仮説が出てくると、今度はそれを確認するために、例えばビジュアライゼーション用のツールを使う。自分が見つけたパタンが、ある個人の動きだけなのか、一般的に当てはまるルールなのかという部分に関しては、データマイニングツールを使っていくという流れになります。