アナリティクス
概要と重要性
アナリティクスはデータと数学を活用して、ビジネス上の課題に答え、関係性を見出し、未知の結果を予測し、意思決定を自動化するものです。アナリティクスは幅広い分野を含むコンピュータサイエンスであり、応用数学、統計学、予測モデリング、機械学習の手法を基に、データから意味のあるパターンを見出し、新たな知見を発見することができます。
アナリティクスの歴史
これまでは、データストレージと処理速度がアナリティクスを制限する要因となっていました。しかし今日では、そうした制限はなくなり、大量のデータを何度も繰り返し分析できる、より高度な機械学習や深層学習のアルゴリズムを活用できるようになりました。
その結果、アナリティクスの標準的な機能である「説明」「指示」「予測」に、学習と自動化の機能が加わり、人工知能の時代が幕を開けました。
つまり、私たちは「何が起きたのか」「何をすべきか」を問うだけでなく、機械自身にデータから学習・自動化させ、さらには「どんな質問をすべきか」までも提案させられるようになったのです。
現在、ほとんどの組織がアナリティクスを戦略的な資産として扱い、多くの職務や技能の中心的な要素となっています。
機械学習による成長分野の一つが自然言語処理(NLP)です。コンピュータはNLPを使って音声やテキストを解釈します。チャットボットはNLPを活用して、オンラインチャットで顧客サービスの質問に答えたり、投資アドバイスを提供したりします。コールセンターのオペレーターに対して、あらかじめ準備されたシナリオに沿った応対案を提示することもできます。
機械学習と人工知能は、自動運転車や好みを学習して提案を行うシステムといった応用を可能にしました。そのおかげで、お勧めに基づいて好きなテレビ番組を一気見している間も、私たちを目的の場所まで確実に連れていってくれます。
もちろんアナリティクスが形作るのは私たちの余暇の過ごし方だけではありません。より高速で強力なコンピュータの登場により、アナリティクスと人工知能を活用する機会はさらに拡大しています。与信リスクの判定、新薬の開発、商品やサービスをより効率的に提供する方法の発見、不正の防止、サイバー脅威の検出、重要顧客の維持など、アナリティクスによって組織を成功に導く要因を理解できるだけでなく、その成果が社会全体にもたらす影響を把握することができます。
今日の世界におけるアナリティクス
リソースを活用して、アナリティクスプロジェクトを実行に移しましょう。プロジェクトの計画立案、データへの信頼性の回復、そしてアナリティクス戦略の策定に必要な情報がすべて揃っています。
データアナリティクスプロジェクトを始めるための10の質問
費用はどれくらいになるのか?どんな課題を解決したいのか?どこに障壁があるのか?これらは、アナリティクスプロジェクトの方向性を決めるために問うべき重要な質問の一例です。
アナリティクスに信頼が不可欠な理由
AIのような新技術やアナリティクスからより大きな価値を引き出すには、まず信頼が不可欠です。アナリティクスのリーダーたちは、データとアナリティクスに対する信頼をどのように構築しているのでしょうか?MIT Sloanは、こうした疑問を解明するために2,400人のビジネスリーダーを対象に調査を実施しました。
アナリティクス戦略を構築する
最高データアナリティクス責任者(CDAO)の優先課題は何か?アナリティクス戦略の策定。情報の信頼性の確保。データ駆動型の意思決定の推進。その他アナリティクス戦略の構築に役立つこちらのe-bookをダウンロードしてください。
アナリティクスの基本
中小企業がアナリティクスをどのように活用できるのか興味はあるものの、どこから始めればよいのかわからないとお考えの方に、このウェビナーは最適です。こちらのイントロダクションでは、企業規模を問わず、アナリティクスを始めるための方法をご説明します。
アナリティクスの全社的展開
デジタル社会からのプレッシャーは私たち全員に及んでおり、データの過負荷の問題は組織内の「数字に強い人々」だけの課題ではありません。スピード、アジリティ(俊敏性)、柔軟性、そしてイノベーションを必要としていない人が、どの組織にいるでしょうか?ですから、アナリティクスは統計の専門家やデータサイエンティストだけでなく、ほぼすべての人にとって優先課題となっています。
その結果、組織はより多くの従業員が理解しやすい形で情報提供をおこない、現場で使用している業務システムに分析結果を直接表示させ、関連する意思決定を自動化することで、より多くのユーザーがアナリティクスを活用できるような方法を模索しています。
クリックするだけで自動的に分析モデルを作成できる技術により、より多くのユーザーがアナリティクスを活用できるようになっています。複雑な問題であっても、データの種類を選んで目的を示すだけで対応可能です。システムが自動的に最適な分析モデルを作成し、その内容を分かりやすい言葉で説明してくれます。
アナリティクスを積極的に活用する組織は、他社との明確な差別化、大きな収益、そして場合によっては長期的な企業存続の可能性を手に入れることができます。
あらゆる面において完璧に適合
Levi Strauss & Co.がSAS®と共にどのような取り組みを行い、アナリティクスを駆使した意思決定のできる企業文化を築き、アパレルを愛する人々とのつながりを深めているのかをご紹介します。
小売店として人気の同社は、商品計画、配分、在庫管理を通じて計画を最適化し、機会を予測するためにアナリティクスを活用しています。
アナリティクスの仕組み
すべてのビジネスがアナリティクスのビジネスです。すべてのプロセスが改善に向けた準備の整ったアナリティクスのプロセスです。そしてすべての従業員が何らかの意味においてアナリティクスを活用するユーザーとなる可能性があります。アナリティクスを活用して何を実現しようとしているかにかかわらず、アナリティクスプロジェクトにまず必要なのはデータです。データが揃ったら、次にそれを分析する必要があります。そしてその分析結果は、意思決定を加速するために必要な部署や人に展開しなければなりません。組織がアナリティクスのライフサイクルを通じて迅速に行動するほど、アナリティクスを通じた改善を通じてより早く、目に見える結果を手にすることができます。
SASでは、データ、ディスカバリー、配置という3つの要素をアナリティクスのライフサイクルに必要な、繰り返されるステップであると考えています。どんな分野のどんな規模のプロジェクトであっても、これら3つの要素がすべて入っているはずです。1つずつ細かく見ていきましょう。
データ
現在のデータは速く大きく複雑です。アナリティクスによるソリューションでは、従来型の構成のデータに加え、ストリーミングセンターデータや画像・動画など、新たに登場した形式のデータを扱わなければなりません。
そういったデータを取得、整備、統制するためには、データ管理戦略も必要です。
どのようにデータの収集、整備、保存を行えば良いのでしょうか?データ準備には、アナリティクスプロジェクトにかかる時間の80パーセント近くを費やすと推定されていますその時間をもっと有効に使ってモデル構築が可能になるのではないでしょうか?
AIを用いたインテリジェントアナリティクスプラットフォームを活用することで時間のかかるタスクを自動化できる統合型のデータ品質およびデータ準備ツール群を用いて、データ準備の工程を合理化することができます。
さらに、データガバナンスによってデータの出典と内容を把握しデータ品質を監視できるため、データの信頼性を確保することができます。データガバナンスにより適切なタイミングでデータを保護することも容易になります。
ディスカバリー(発見)
ディスカバリーではデータの探索、ビジュアライゼーション(視覚化)、モデルの構築を実行します。最適なアルゴリズムを見つけるプロセスは時に試行錯誤となることがあります。しかし、そうした試行錯誤のプロセスもデータの整理、保存、比較が簡単になれば、作業の最適化が可能になります。
最適なアルゴリズムの選択は、データサイズ、ビジネスニーズ、トレーニング期間、パラメータ、データポイントなど、ざまざまな要因によってその成否が左右されます。経験豊富なデータサイエンティストでも、どのアルゴリズムが最適なパフォーマンスを出すかは複数のアプローチを試してからでないと判断できません。
実際、ディスカバリーフェーズになってから異なるデータ特徴を持つ複数のプログラミング言語で書かれた、複数のモデルを比較検討するというのはよくある話です。
例えば、メディカルスキャニングで肝臓の腫瘍を検出する最近のアナリティクスプロジェクトでは、複数のニューラルネットワーク内を探索する作業と、別々のモデルの結果を比較し文書にまとめる作業から始めたということです。
このような作業の連携は、異なったスキルセットを持つデータサイエンティストが自分の好きな言語でコードを書くことができる、というような場面で活用され、プログラマー以外の人たちも様々なアプローチで行われたアナリティクスの結果を見やすい画面でクリックするだけで使えるインターフェースで閲覧することができるため、便利に利用することができます。
デプロイメント(業務実装)
アナリティクスに費やした労力を無駄にしたくないなら、ディスカバリーフェーズで得られた結果を必要部署に展開して活用してもらう必要があります。機械学習もその他のモデルも、棚に飾っておくものではありません。ビジネス上の価値を得たければしっかりと活用しなければなりません。しかし、デプロイ(展開)フェーズは、組織が最も苦労する部分です。
モデルが1つの場合でも何千件の場合でも、モデルを選択するフェーズからデプロイするフェーズへ移行するためにはモデル管理が必要となります。モデル管理を行うことによってバージョン管理が可能となり、選択したモデルの登録、検証、一元管理が容易になります。これがモデルの展開と監視のための手順やルールを決めるのに役立ちます。また、データとモデルの使用についての透明性も高まります。
目標は、モデルを一度構築し、それをどこにでも展開できる状態にすること、つまり、経営陣のダッシュボード、業務システム、またはAPI経由で他のアプリケーションに組み込んだ状態にすることです。
アナリティクスのエコシステム
アナリティクスは急成長しています。アナリティクスのエコシステムには何百もの企業が存在し、組織のデータの保存、アクセス、分析、プレゼンテーションをサポートするための技術やサービスを提供しています。その範囲は、データ管理や視覚化から高度な分析、多くのオープンソースアナリティクスオプションを含む構築済みのアナリティクスソリューションまで多岐にわたります。
SASは、このエコシステム内のあらゆるプレイヤーと統合できる独自のポジションにあります。SASプラットフォームは、どのベンダーのハードウェアでも動作し、あらゆる種類のデータを取り込み、異なる言語のモデルを比較し、データ、ディスカバリー、デプロイメントの各フェーズで一貫したガバナンスを実現します
AWSやHadoopにデータを保存していますか?TwitterやGoogle Analyticsからデータを抽出していますか?PythonやSASでデータ分析していますか?インテルやNVIDIAのチップでプログラムを実行していますか?アナリティクスの結果をデスクトップや IoT デバイスに展開していますか?
SASプラットフォームは、あなたがすでに活用しているその他の従来型ソリューションも含め、これらの処理をすべて取り扱い可能です。その結果、データサイエンティストからIT、意思決定者まで、誰もが同じアナリティクスシステム上で連携して作業することができます。さらに、モデル管理、監視、透明性確保、データ履歴、およびアナリティクスプロジェクトやパッケージ間の統合といったメリットも得られます。
アナリティクスプラットフォームは、アナリティクスエコシステムのすべての要素を統合的に制御することで、アナリティクスのライフサイクルを加速し、データから具体的な成果を導き出す手助けをします。最終的には、アナリティクスへの投資全般(データ、テクノロジー、人材)に対する投資収益率が向上し、成功への足がかりとなります。
お勧めの関連資料
- 記事 Digital Transformation in SMBSAS® Viya®は、一つの環境でアナリティクスに必要な機能を全て実現したクラウド対応のプラットフォームです。アジャイルなIT環境に欠かせない高い信頼性、スケーラビリティ、セキュリティを備えたアナリティクス環境とガバナンスを提供することにより、 データ・サイエンティストからビジネス・アナリスト、アプリケーション開発者、そして経営幹部まで、あらゆる人々のニーズに対応します。
- 記事 流れ去るデータを捉えるソーシャルメディアやスマートメーター、センサーなど、常に流れ出てくるデータを扱う場合に、まず保存してから分析していませんか?イベント・データ・ストリーミングを使えば、流れこむデータを捉えてその場で分析し、必要なアクションをリアルタイムにとれるようになります。
- 記事 「情報に基づく直感」を備えた人材を育てるデータを扱う社員や、将来の意思決定者は“Informed Intuitant”になる必要がある。データを扱う社員や将来の意思決定者は、“Informed Intuitant”、つまり情報に基づく直感を操れる人になる必要がある。「Intuitant」という単語は造語であり、辞書には載っていない。私がこの用語によって伝えたいのは、意思決定者は、情報分析と直感の両方を意思決定の土台に据える必要があるということだ。The Corporate Executive Board(CEB)社では、このような人材を「情報に基づく懐疑論者(Informed Skeptic)」と呼んでいる。つまりは、科学的な情報分析と、直感的な情報への洞察は、どちらも重要なカギを握っているということだ。
1976年以来、SASは世界中の企業や組織から信頼され続けています。