Data Scientists Special Talk Session
データサイエンティストが語るアナリティクスの現在と未来

【 前編:アナリティクスの現在を語る 】(2/4)

「アナリティクス成熟度」が上がってきた

―― お三方は、NEC、またはSASとして、データサイエンティストの立場でさまざまなお仕事をされています。そこで、実際のフィールドでは、お客様からのリクエストはどんなことが多いのか、お伺いできますでしょうか。

孝忠 ビッグデータブーム当初は「何かしたい」という漠然とした要望が、非常に多かったですね。何となくデータが溜まってるので、何とかならないかとか。ブームだから何かできないか、というお問い合わせです。
 それが現在は、要望がある程度クリアになった状態でお話が来ることの方が多くなってきた印象です。例えば「どう故障を検知したらいいか」「顧客嗜好性とマーケティング戦略をどう結ぶか」といった具合です。

山下 お客様の、レベル感の進展が大きいですよね。SASではアナリティクス成熟度と呼んだりしますが、仮にレベル5のお客様であれば、自社でどんどんデータ活用を進めていらっしゃるので、新しい方法やテクノロジーはないか?というお問い合わせになります。レベル1なら、最初は「何かしたい」かもしれない。それが段々「この在庫を減らしたいから何かできないか」と具体化していく、という流れは感じます。

 以前よくあったご要望は…「我々の知らない、新しいものを出してくれ」というもの。ところが前提として私たちは「お客様が何を知っているのか」を知らない。「こんな結果が出ました」と持っていくと「それは知っています」という、ゴールが見えない禅問答が始まります。もう1つが「これから分析を始めたいので、どうしたらいいのか教えて欲しい」というもの。
 どちらのケースも、目標が決まっていないんです。だから迷いが生じる。分析というのはまずは目標ありきなんですね。目標と現実にギャップがあって、課題解決のために分析をするとか。あるいは、目標にいち早く辿り着くために分析をするとか。

――そういった状況が、ここに至って大分変わってきたと。

孝忠 おそらく、日本でも事例がある程度できてきたからでしょうね。ある業種の中で「A社はこれで上手くいった」という話になると、「自社でも同じことがやりたい」あるいは「違うことをしたい」と、テーマがクリアになってきます。ブーム当初は本当に何もなくて、海外からそれらしい事例が少しずつ聞こえてきて…といった状態だったので。

予測モデリングが、根付いていない?

――辻さんはいかがですか?最近の現場の感覚としては。

 実は、そこなんですが。予測モデリングのお話というのが、思ったより少ないなと思うんですよ。企業のデータサイエンティストやIT担当の方々とお話ししていると、「何をやったらいいかわからない」から、「どんどん分析をしています」という流れには、変わってきています。しかし、意外と予測モデルが作られていない。
 レポート系の分析は、各社様、実践されているんですね。対照的に、予測してスコアリングし、一連の流れで業務やビジネスを最適化していこうという動きが、まだあまり見えない印象です。

データを預かると私、
ずっと見ているんですよ、生データを。
この時間が長い。
そして、実は面白い。

孝忠 レポート系の分析に関しては、2000年くらいにビジネスインテリジェンス(以下BI)ブームがあって。かれこれ15年程経つこともあり、日本の大手企業では、ほぼBIが実践されていますよね。
 他方の予測系については、理由はさまざま考えられますが、1つには「適用できる業務の狭さ」があるんじゃないでしょうか。お客様と話をさせていただく中でも、顧客に点数を付けるといったスコアリングの話か、いわゆる需要予測、電力予測のような話が中心で。一部の人たちの一部の業務にしか適応できないという狭さ。データサイエンティストが、それをどんどん開拓すべきなのかもしれないですが。

 私は、適応できる業務自体は、たくさんあるのかなと思っているんですけど。当たる/当たらないにフォーカスしてしまうと、なかなか取り入れられないのではないかという気がします。
 的中率を追及すること自体は否定しませんが、「来月どれくらいの売上になるんだろう」のようなトレンドが上がっているのか下がっているのか、あるいは振れ幅がわかるだけでも、意思決定の質は変わってくるだろうと思うんですね。ですが、その部分があまり実践されていないし、共感も得にくい。

欧米と日本、データに対する感性の違い

山下 欧米では、スコアリングしたデータを使って、モデリングで出た答えを信じて動くという傾向が強いんですよ。対して日本国内では、本当はできるんだけどやっていないケースが多いと、私も感じます。
 1つには、日本人の気質的な部分。機械学習やディープラーニングは、いわばブラックボックスですし。なんでこうなっているのかがわかりづらいモデルが沢山あるわけです。そうなると、ではそれを使ってプロモーションしよう、品質管理しようという風には、なかなかならない。例えば自動車の部品で、これが1カ月で壊れそうですといったモデルがあっても、腹落ちしない、信用できないということになる。マーケティングの世界では、比較的活用されていますけれども。
 これは長い話になってしまうんですが、やはり日本の教育システムですとか、統計に対する感覚の違いに根ざしているのではないか。本質的には「確率を出している」という点に尽きるんですけどね。

孝忠 そうですね。教育などのバックグラウンドの影響は大きいと思います。さらに、予測していなくても業務は現に回っているという事実がある中で、人間系を超える世界観を統計だけでやりきるのは、相当に難しい。どんなに凄いアルゴリズムを用いたとしても、超絶な職人の、微妙な人間の振れ幅を感知する力は越えることができない…という話かもしれません。
 NECでは予測に非常に力を入れていて、さまざまな商品やサービスを提供していますが、やはりその部分で止まることも多いですね。

―― 止まるというのは、具体的には…?

孝忠 例えばお客様に持っていって「こういう予測モデルです」とご説明します。でもやっぱり人間系で細かく整理できた方がいいね、という文化の壁に阻まれて、採用に至らない場合があるんです。

山下 気質として、日本は「納得できる幅が少ない」というイメージがあります。当たったか当たらないかというのは、一元的に答えが出るわけではなく、「どう見るか」の問題とも関わっていて…

 天気予報みたいなかたちで捉えられているとすると、外れると、おそらく腹が立ちますよね。でも予測はどちらかというと、降水確率みたいなものなんですね。その事象がどれくらい起こりうるのかというもの。あたかもピンポイントで数字が出ているようなんですけど、その背景には誤差範囲が含まれている。予測値をなめこだとすると、その周囲に、ぬるっとした誤差の部分がある。ここが非常に重要で、かつ、私にとっては非常に面白いところです。

―― なかなか、込み入った話になってきましたね。まさにデータサイエンティスト鼎談会の様相を呈してきました。