パーソナル・データ・サイエンティストの可能性について
執筆: アリソン・ボーレン(Alison Bolen)、「SAS Insights」編集者
私の子供たちはApple社のバーチャル・アシスタントの「Siri」が大好きで、宿題、スポーツの結果、理科の実験など何でも質問しています。尋ねる内容は、よくある話題(どんな犬が好き?)から、深遠なテーマ(自由意思って何?)まで、実にさまざまです。それに対してSiriは、無理のない範囲で答えてくれます。
私自身は、もっと実用的な用途にSiriを使っています。運転中や料理中、あるいは子供たちと遊んでいる最中など、別の活動で手が回らないときにレシピの参照、テキストの入力、カレンダーのチェック、道順の検索などを依頼します。
Siriや類似のシステム(Amazon Echo、Google Now、MicrosoftのCortanaなど)は「パーソナル・アシスタント」と呼ばれ、私たちの日常生活でごく当たり前の存在になりつつあります。米国で評判になったAmazon Echoの紹介動画を見ると、ある家族がこのサービスを1日中、買い物リストの整理、リマインダー機能の設定、音楽の再生などに使っている様子が描かれています。
こうしたシステムは、特に自然言語処理や機械学習を基盤としており、人間が話した言葉をコンピューター向けのクエリに翻訳し、膨大なデータポイントの中から答えを見つけ出した上で、質問されたのと同じ言語で人間に返答します。
もしもSiriがデータ・サイエンティストだったら?
こうしたパーソナル・アシスタントの次の進化ステップとして、特にビジネスの意思決定者が期待する機能は、大規模な企業データはもちろん、ソーシャルメディアのフィードや官公庁データのような公共データさえも照会できるようになることでしょう。
デスクやスマートフォンのボタンを押して以下のようなことを質問できるとしたらどうでしょうか?
- うちの会社で売上高トップ10の販売地域について、今年度末までの販売予測はどんな感じ?
- 最近のソーシャルメディアで顧客がうちの会社の新製品を説明するのに使っている形容詞のトップ3は?
- 今の四半期に最も収益を生み出しているマーケティング・プログラムはどれ?
- 今週、全ての顧客対応チャネルで、どんな問題に関する問い合わせが入っているか教えて。
こうしたシステムの目標は、アナリティクスを一般の人々の手元に届けることです。モデルの構築や複雑なアルゴリズムの開発にデータ・サイエンティストが必要な点は変わりませんが、この種のシステムにより、アナリティクスはごく普通の人が手軽に利用できるものになります。
ウェイン・トンプソン(Wayne Thompson)
チーフ・データ・サイエンティスト
SAS
こうした「パーソナル・データ・サイエンティスト」は、自然言語処理を駆使することで、ユーザーの要求をクエリに変換し、既知のあらゆるデータベースを検索し、見つけたデータにアナリティクスを適用した上で、ユーザーに答えを返します。おそらくチャートやデータ・ビジュアライゼーションも提示され、ユーザーはさらなる詳細にドリルダウンして調べることもできます。
「ここで説明しているのは、自動化と自然言語処理を駆使して質疑応答をこなすコグニティブ・ラーニング・システムです」と話すのは、SASのチーフ・データ・サイエンティストであるウェイン・トンプソン(Wayne Thompson)です。「機械学習が役立つのは、結果をどのように返すべきか決定するプロセスや、明示的に要求されてはいないものの結果をユーザーに提示する目的に役立つと思われる関連事項を解釈するプロセスです」
他に知りたいことはありませんか?
ユーザーが最初の結果を評価すると、パーソナル・データ・サイエンティストは、さらなる探索を促すために、関連する返答やチャートへのリンクを示すことができるようになります。例えば、「顧客が競合他社についてソーシャルメディアで話していることも知りたいですか?」、「来年の販売予測も出しましょうか?」などと話しかけてくるようになります。
こうしたプロンプト方式のヘルプ機能は、さらなるデータの探索のきっかけとして役立ち、データや分析手法に詳しくないユーザーの場合は特に効果的です。
結果の共有
そして最後に、ユーザーの質問したクエリが全く新しいものである場合や、逆に他の誰かが質問した内容に関連している場合には、パーソナル・データ・サイエンティストは「この結果をポータルで共有しますか?」あるいは「この結果を営業担当副社長と共有しますか?」などと提案してくるでしょう。これにより、重要な情報の周知が促進され、同じ情報に関心を持つ誰もがそのメリットを享受できるようになります。
「データ・サイエンティストは、データを処理し、データセットのタイプに応じて何を探せばよいかを把握できる洞察力とスキルを備えています」と話すのは、SASシニア・プロダクト・マネージャーのマイク・フロスト(Mike Frost)です。パーソナル・データ・サイエンティストの目標は、こうした専門家たちに取って代わることではなく、彼らの基本スキルの一部を一般の人々も利用できるようにすることです。
トンプソン自身もデータ・サイエンティストですが、取って代わられる不安を感じてはいません。「こうしたシステムの目標は、アナリティクスを一般の人々の手元に届けることです。モデルの構築や複雑なアルゴリズムの開発にデータ・サイエンティストが必要な点は変わりませんが、この種のシステムにより、アナリティクスはごく普通の人が手軽に利用できるものになります」
パーソナル・データ・サイエンティストの次の進化ステップ
データに関して何を質問すればよいか分からない場合でも、「うちの会社のサプライチェーンに関心があるんだけど」などと問いかけるだけで一般的なトピックを調べることも可能になるでしょう。システムはそのトピックに関する最も基本的な洞察を提示し、さらなる調査のヒントも提供してくれます。
どのような表現で質問を投げかけても、自然言語処理機能がユーザーの話した内容を解析し、コンピューターが理解できる一連のクエリに変換します。機械学習機能は要求を処理して結果を返すほか、明示的に要求されなかったものの質問者にとって有意義と思われる関連事項も探します。システムは基本的に、ユーザーが次に何を質問するかを常に予測しています。
複雑な質問の場合、パーソナル・データ・サイエンティストは、データに対する複数の視点を明らかにし、より深くデータを調べるためのヒントを示すために、チャートや結果のギャラリーを出力することもあるでしょう。
パーソナル・データ・サイエンティストは、使い込むほど学習していく入門レベルのBIデータ探索ツールと言えます。プリセットの機械学習モデルを用いて、ユーザーからの要求をモデルとデータのパイプラインにマッピングします。ユーザーがシステムとのやり取りを繰り返して的確な要求を投げかけるほど、学習の量と精度が高まっていきます。
あなたならパーソナル・データ・サイエンティストに何を質問しますか?また、このツールの活用は、あなたの業種でアナリティクスの利用を広げる取り組みにどのような効果をもたらしそうでしょうか?
次にお読みいただきたい資料
- 機械学習の基本や最新の活用例:機械学習の概要
- 自然言語処理の詳細:自然言語処理に関するSASのブログ(英語)