アナリティクスを活用して不正を予測する

アイルランドの国税・関税当局の担当者が、データマイニングがどのようにフィットするかを説明

今日では国や地域を問わず、あらゆる官公庁や公的機関が、より効率的かつ効果的に業務を遂行するべき、という圧力に晒されている。これは実質的に、少ないリソースで業務の質を向上させる、ということだ。国税・関税当局も例外ではなく、その多くは、往々にして困難な経済情勢のなかで「リソースの節減」と「高まり続けるリスク」という、相反する課題に取り組んでいる。

従来のリスク対処手法は多くの当局において良好にその役割を果たしてきたが、今では、もっと高度な手法を用いて不正、エラー、無駄と闘う必要性が生じている。この闘いに備えて武装するべく、ますます多くの国税・関税当局が業務プロセスの改善手段としてデータマイニングとアナリティクスの採用に踏み切っており、その結果、新たなルールや規制に対するコンプライアンスの向上や、カスタマー・サービス(納税者向けサービス)の向上を達成している。

極言すると、官公庁・公的機関が日常業務の一部としてデータマイニングを採用した場合に最もメリットを受けるのは納税者と市民である。アナリティクスが不正、エラー、無駄の削減に役立つのであれば、納税者にとっては、この上ないことだと言えよう。

ダンカン・クリアリー(Duncan Cleary)氏
アイルランド国税・関税当局「Revenue」の上席統計担当者

では、データマイニングは税務当局のリスク分析ツールキットにどのようにフィットするのだろうか? リスク検知を目的としたビジネスルール群 ── および、さまざまなチャネルから収集したインテリジェンス ── は、それぞれの “持ち場” を確立しており、効果的に機能しうる存在である。この組み合わせにデータマイニングを追加すると、不正やエラーを検知・防止するためのパワフルなコンビネーションが得られるのだ。

データマイニングとは「データから “価値ある情報” を明らかにするために、大量のデータに対し、統計解析などの科学的手法を適用する取り組み」と定義することができる。多くの場合、データマイニングは、手作業では認識しえないようなパターンを検知することができるほか、関心のある結果(例:納税申告書がエラーを含んでいる確率)について予測的な推計を行うこともできる。

大まかに言うと、不正との闘いに利用できるデータマイニングには以下の3つのタイプが存在する。

  1. 教師ありの手法: 予測分析(予測的アナリティクス)としても知られる手法であり、ターゲット変数を予測する。
  2. 半教師ありの手法: 何らかのビジネス知識で分析の方向性を決めることができる。
  3. 教師なしの手法: 例えばセグメンテーションのような、探索的な手法。

予測分析を用いて不正と闘う

予測分析では、予測モデルを作成するにあたり、特定のターゲット変数の既知の結果を含んでいる特定のデータセットを使用する。このターゲット変数となるのは、ケースを精査した場合に算出される何らかの可能性/確率である(例:想定される収量/収率、ビジネスが失敗する確率、給付金/払戻金請求が不正である確率など)。モデルは、ターゲット変数が明確に定義されている場合ほど、より良好なパフォーマンスを示す。予測モデルを作成する手法は数多く存在するが、多くの場合、十分に確立されている手法(ロジスティック回帰、決定木、ニューラル・ネットワーク)を打ち負かすことは難しい。

予測モデルの真のパワーは、何からの関心対象に関して新しいケースを(それらのケースまたはイベントが以前に一度も評価されたことがない場合でも)スコアリングできる能力に由来している。スコアリングされたケースは優先度の高い順にランク付けされ、リソースの状況やリスクの重大度に応じて後続の作業に回すことが可能となる。モデルのパフォーマンスを評価する上ではフィードバックが極めて重要であり、モデルの改善は反復的かつサイクル型のプロセスで行われる。モデルに情報をフィードバックすることにより、時の経過とともに誤検知(誤った警告)の数が減少するほか、検知漏れ(実際に悪質なケースが注意をすり抜けること)の数も減少していくことになる。

多くの税務機関は今、不正やエラーを検知・防止するために、ビジネスルールやビジネス・インテリジェンスといった既存のツールと組み合わせる形で、これらの予測手法を活用しつつある。一部の機関では、これらの手法をリアルタイムに利用できる方式で現場のトランザクション・システムに組み込んでいるところもあり、アイルランドの国税・関税当局もその一つだ。

教師なしの手法で不正を探索する

教師なしの手法は、処理対象のケースベース(=すべてのケースの集合体のこと)の主要な特徴を理解するためのパワフルな手段となりうる。多くの取り組みでは、利用できるデータが多すぎるため、クラスター分析やセグメンテーションのような手法を使わずに母集団の基底構造を理解することは難しい。特に、ターゲット変数が利用できない場合には、母集団内の複数のグループ(グループ内のメンバー同士は似ているが、他のグループのメンバーとは似ていない集団)を識別するためにクラスター分析が役立つ。

セグメンテーションを済ませると、個々のケースにグループ・メンバーシップを割り当てることが可能になる。このメンバーシップを示すラベルは、取り扱い戦略を判断したり、サービスチャネル・オプションを識別したり、さらには、“税務当局が納税者の行動変容を促すために時間をかけて行う取り組み” の実効性をモニタリングしたりするために利用できる。

手法を組み合わせる:半教師ありの手法

「教師なしの手法からの出力」に「教師ありの手法の出力」を重ね合わせると(あるいはその逆を行うと)、追加的な洞察が得られることがある。例えば、一部のセグメントが本来的に高リスクであると判明する可能性がある。そのため、半教師ありの手法は、何らかのビジネス知識が利用できる場面で ── 最小限のトレーニング・データしか利用できない場面でさえ ── 役立つことが多々ある。

外れ値検出(異常値を識別・調査すること)も、不正との闘いにおいて重要な武器となりうる。どのような母集団でも、そこには異常な(変則的な)ケースが必ず含まれているものだが、それらの多くは実際には完全に正当だ。しかしながら、一部のケースは不正である可能性があり、それらを識別・調査することは可能である。

ケースベースのネットワーク・ビューも、不正やエラーの検知においてますます重要になりつつある。この領域では、ネットワーク分析のような手法を用いて “グループのリスク” や “相互連結したエンティティ群のネットワークを通じたリスク伝播” を検知することが、ますます容易になってきている。非構造化データ(テキスト、音声、画像、空間データなど)を不正検知のために大規模に利用する取り組みは始まったばかりであり、その重要性と有用性が将来的に拡大していくことに疑いの余地はない。また、税務当局は標本データではなく母集団データを保有するという点で特異な立場にあることから、「業務パフォーマンスを改善するためにデータマイニング手法をどのように活用できるか」という点に関する制限事項はほとんど存在しない。

アナリティクスを業務プロセスの中核に据える

では、いったい何が税務当局におけるデータマイニング手法の活用を妨げているのか? 良質なデータの欠如、統合/結合されていないデータ、スキルを備えたリソースの欠如、上級幹部レベルの予算的支援の欠如、IT面の課題、組織文化面の課題など、潜在的な障壁は数多く存在する。

これらの課題やその他の課題が、高度なアナリティクスを用いた不正検知の妨げとなる状況、あるいは、データマイニングを用いた機関パフォーマンスの改善の妨げとなる状況を放置してはならない。多くの場合は、目標が明確に定義された小規模で達成可能なプロジェクトから着手することが、成功への道のりの第一歩となりうる。結果は目覚ましいものである必要はないが、その結果によって「データマイニングが価値を追加しうる仕組みや、不正やエラーを削減できる可能性」が明らかになれば、次の段階として本格的な活用ケースが作成される運びとなり、アナリティクスを機関の業務プロセスの中核に据える取り組みを開始することができる。

極言すると、官公庁・公的機関が日常業務の一部としてデータマイニングを採用した場合に最もメリットを受けるのは納税者と市民である。アナリティクスが不正、エラー、無駄の削減に役立つのであれば、納税者にとっては、この上ないことだと言えよう。

著者紹介: ダンカン・クリアリー(Duncan Cleary)氏は、アイルランドの国税・関税当局である「Revenue」の上席統計担当者。専門領域は各種のリサーチ手法やアナリティクス手法の活用と、アイルランドの国税・関税当局におけるそれらの適用。具体的には予測分析、顧客セグメンテーション、リスク分析、大規模な調査、エビデンスベースの意思決定支援、ネットワーク分析、リアルタイム・リスク分析の活用など。

課題

多くの税務当局と同様、アイルランドの国税・関税当局は不正を予測・防止するための手ごろな価格のソリューションを必要としていた。

ソリューション

SAS® Fraud and Improper Payments

導入効果

アイルランドの国税・関税当局は、不正を減らし、最終的にアイルランドの納税者の負担軽減を図るために、従来の不正検知手法と一緒にSASを活用しています。

本記事に掲載された導入効果は、各企業によって異なる状況やビジネスモデル、入力データ、業務環境に固有のものです。SASの紹介する顧客体験は、各企業に固有のものであり、業務面や技術面の背景もそれぞれ異なるため、各事例に掲載されたあらゆる証言は、導入の典型例を示すものではありません。導入にともなう金銭的効果、導入結果、ソリューションのパフォーマンスなどの特徴は、個別の顧客のコンフィグレーションや使用条件に左右されるものです。本事例は、すべてのSASの顧客が当該事例と同じ導入効果を得られるとするものではなく、そうした効果を保証するものでもありません。SAS製品および提供サービスの保証内容は、各製品・サービス向けに締結された契約書内の保証条項に記載された内容に限られます。したがって、本事例に掲載された内容は、それらの保証内容をなんら補足するものではありません。事例に掲載された顧客は、各事例をSASとの契約にもとづいて提供しているか、SASのソフトウェアの導入成功にともなう体験を共有しているものです。