アナリティクスの「工業化」

データを工場ラインのように処理するアナリティクス・ファクトリーとは?

執筆:エイドリアン・ジョーンズ(Adrian Jones)、SAS
 

より多くのデータをシステムに取り込み、組織全体にわたって予測分析を利用できる仕組みを作りながら、すべての部署で高品質なレポーティングを実現するには、どうすればよいのでしょうか?

まず、データが工場の組立ラインに乗っている様子を思い浮かべてください。収集されたデータは、さまざまな組立部品が在庫管理システムを通して保管棚に収められるように、データ準備システムの内部を流れていき、使用目的に応じて並べ替えや分類が行われます。次に、データは生産とパッケージの工程を順に通過し、モデルの構築や分析のために使われます。最後のステップは完成品の流通または展開です。この工程では、データから導き出したレポートや分析結果を配信することになります。

以上が私たちの考えるアナリティクス・ファクトリー(アナリティクス工場)です。原材料を加工して製品を生産・流通するように、データからアナリティクスを生産し組織に流通させる流れを「工業化」するという考え方です。本稿では、それぞれのステップをさらに詳しく追いながら、アナリティクスのための工場を作ることの利点を見ていきます。

  • データ準備

データ準備フェーズでは、体系的かつタイムリーな方法を用いてデータを分析担当者に送ります。データを取得する手段としては、データをファイルからコピーする、IT部門から業務データを受け取るなど、さまざまな方法があります。アナリティクス・ファクトリーでは、分析担当者の柔軟性を担保しつつ、統制された体系的なフレームワークが提供される、中間的な手法が取られます。モデル構築の際に行う1回限りの作業であれば、シンプルなプロセスでサポートするのが理に適っています。しかし、業務プロセスの中で多くのユーザーがそのデータを利用するような場合は、しかるべきパフォーマンス、評価基準、統制を確保しなければなりません。

アナリティクス・ファクトリーとは、アナリティクスを支える一連のプロセスを明確に定義するということです。そのためには、組織内のさまざまな部署に参加してもらい、上級管理職の積極的な賛同を取り付けた上で、部門横断の連携を推進することが必要です。

.

データ準備プロセスでは、これら2つのモードを素早く容易に切り替えることが重要です。このステップに必要なのは、ビジネスの創造性に、ITのプロセスや業務効率を結び付けることです。データ準備に対して工場型のアプローチをとることにより、多くの組織でこのグレーゾーンが取り除かれ、作業の重複や非効率性に起因する問題が軽減されます。

  • モデル開発

モデル開発フェーズで重要なのは、分析担当者が柔軟性とパフォーマンスに優れた環境の中で必要なデータを利用できるようにすることです。アナリティクス・ファクトリーでは、管理の行き届いた一元的な環境が提供されるため、ユーザーは目的の処理をどこで行うべきかに悩むことなく、目の前の作業に集中することができます。

  • モデル管理

モデル開発とモデル管理は密接につながっています。工場方式の場合、モデル管理はモデリングのワークフローと、それに関連した文書、注釈、コードおよびデータのサンプルを変更ログ内で提供します。この点は、かつてないほど規制が多い現在の世界でビジネスを行うために重要です。また、工場型アプローチでは、組織が利用するデータや処理リソースが増えた場合でも適切なガバナンスを確保できるような仕組みも提供されます。同様に、適切な承認と統制の仕組みを通して、組織の資産としてのモデルを必要な人が必要なときに利用できる環境も確保されます。

  • モデル展開

モデル展開は、データ準備、モデル開発、モデル管理の各ステップとつながっています。アナリティクス・ファクトリーのモデル展開では、先行ステージで得られた結果をもとに、本稼働モデルのパッケージを作成します。このパッケージは業務プロセスの内部にそのまま展開可能です。アナリティクス・ファクトリーの場合、このステップは業務効率が重視され、統制のとれた方式で実行されます。

今では、データ・プラットフォームと分析処理技術の発展により、スコアリングや分析処理のパフォーマンスを改善するテクノロジー・オプションが数多く用意されています。アナリティクス・ファクトリーは、モデルを複数のプラットフォームに展開する場合でもビジネスロジックが1つとして失われることのないよう、確実な処理を行います。その結果、分析担当者はモデルの妥当性について確信を深めることができ、またITチームは最も効率的な方法でモデルを展開できるようになります。工場アプローチを使うことで、このステップは業務部門とIT部門の信頼関係を強める手段として効果を発揮することになります。

  • 業務システム

業務システムは、分析プロセスの始まりであり、終わりでもあります。データの大部分は分析プロセスの開始時点で業務システムから取得され、それを分析した結果は最終的に業務プロセスまたはアプリケーションに戻され、そこで利用されます。このような形で分析にもとづいて業務を遂行する場合には、業務システムと分析システムを緊密に統制しなければなりません。そのため、システム間のやり取りについて厳格な運用ルールを定める必要があります。

工場アプローチでは、適切なインターフェイスと標準を定義することによって、「データが下流側で利用可能になること」および「展開されるアナリティクスが本稼働品質であること」の両方を担保しています。こうした標準は業務部門によって念入りに管理され、データの受け渡しの詳細が事前に定義されます。もうお分かりのように、アナリティクス・ファクトリーとは、アナリティクスを支える一連のプロセスを明確に定義するということです。そのためには、組織内のさまざまな部署に参加してもらい、上級管理職の積極的な賛同を取り付けた上で、部門横断の連携を推進することが必要です。

工場アプローチがもたらすさまざまな導入効果

アナリティクス・ファクトリーを機能させるためには、ビジネスの戦術と戦略の両面でアナリティクスをどのように活用すべきかを理解することが不可欠です。実際、分析プロジェクトが組織内の他のシステムやプロセスから分断されていることが原因で、なかなか進展しないことに苦しんでいる企業/組織は少なくありません。

アナリティクス・ファクトリーを活用すると、これらを連携させてアナリティクスの工程全体を「工業化」することができます。また、アナリティクスの本稼働環境のスケールアウトによって、分析プロセスの効率と価値も向上します。

ここで示したコンセプトのいくつかを採用するだけでも、アナリティクスを利用および提供する上での俊敏性が高まるはずです。そして、さらなる効率化を追求したり、テクノロジーのアップグレードにかかる無駄なコストを回避したりすることも可能になります。最終的に、組織内でアナリティクスの活用がさらに広まれば、組織全体の意思決定が強化され、分析担当者/IT部門/意思決定者の時間の節約もさらに進むため、そこから幅広い導入効果が生まれることになります。


エイドリアン・ジョーンズ(Adrian Jones)は、SASの「分析プラットフォームCOE(Analytical Platform Centre of Excellence)」のメンバーとして、ハイパフォーマンス・アナリティクスとエンタープライズ・アーキテクチャを担当しています。アーキテクチャの最適化を通じたデータおよびアナリティクスの戦略的活用の推進に関して、さまざまな部署を支援しています。この役割には、新製品の方向性を決めるディレクターや、顧客のもとで現場研修を行うインストラクターといった職務も含まれています。

Industrialize your analytics today

他のインサイト