ビッグデータ時代の幕開け
~大量データをビジネスに役立てる、その前に考えておくべきこと~
従来の技術では処理が難しい複雑かつ大規模なデータ群を指す「ビッグデータ」が、市場で高い関心を集めている。ビッグデータに埋もれる価値の高いデータから新たな知見や洞察を獲得し、競争優位やビジネスチャンスの獲得につなげることが成長戦略の軸になると多くの企業が認識し始めているためだ。本稿では、ビッグデータを管理する上での注意点、ビッグデータが形成されてきた経緯、ビッグデータの可能性について解説する。
世界の情報量が年間59%の割合で増加する時代に
ブロードバンドの普及やストレージ容量の拡大、データ並列分散処理技術やインメモリデータベース技術の実用化などに伴い、データ活用の流れの中にビッグデータを含めていこうという考え方が脚光を浴びている。ソーシャルメディアやモバイル端末の普及を背景に、新しいタイプのデータが増えた。ビッグデータが新しいのは、企業が保有するデータの“量”と“質”がこれまでと大きく異なるというポイントにある。
量の側面から見ていこう。ビッグデータの明瞭な定義はいまだ存在せず、その範疇は専門家によって異なるが、数百テラバイトからペタバイト級のデータと捉えるのが通常だ。大容量を前提とするビッグデータは質の側面にも特徴がある。ビッグデータは分析対象としてリレーショナルデータベースに格納してきた構造化データだけでなく、テキストや音声、監視カメラによって収集される映像、グラフ形式データ、株価データ、会計トランザクションなど、さまざまな種類の非構造化データも包含する概念だ。また、リアルタイム性が高いという特性もビッグデータの要件に加えることがある。高い頻度で収集・蓄積されるデータを扱いたい場合、これまで以上に高速なデータ処理が求められる。たとえば、Webサービスの提供事業者はアイテムの購買要因となったキーワードを抽出するため、絶え間なく収集されるクリックデータから顧客の行動を解析するだろう。クリックデータをはじめ、センサ機器から収集するデータ、全地球測位システム(GPS)の位置情報、RFIDが生成するデータなどは即時性の高いデータの代表だ。
米調査会社のガートナーは、ビッグデータの管理において企業やCIOが情報の量だけでなく、多様性や速度といった課題にも焦点を当てる必要があるという見解を示している。世界の情報量が年間59%の割合で増加するビッグデータ時代では、量への対応だけに目を向けてしまう傾向があると指摘。ビッグデータの量に対する課題ばかりに注意を奪われると近視眼的な判断に陥り、多様性や速度といった他局面への対応に2年から3年を要する大規模な再投資が必要になってしまう。この中で企業は情報管理のあらゆる局面に対処する計画を立て、データへのアプローチを根本から見直す必要に迫られていると警鐘を鳴らしている。
米コンサルティング会社、マッキンゼーの調査部門であるマッキンゼー・グローバル・インスティテュートが発行した報告書 「Big Data: The next frontier for innovation, competition, and productivity」では、ビッグデータのビジネス価値について言及している。ビッグデータは1カ所にプールされたデータの塊で、コミュニケーションや意思決定の根拠とするために分析されるもの。データは物的資本や人的資本などと同様、効率的な生産活動を行う上で不可欠な存在だ。あらゆる分野に流入するビッグデータが、世界経済、あるいはビジネスに与えるインパクトや可能性は経営者にとって今後の重要な争点になるとしている。
コンピュータ技術の進展がビッグデータを形成
技術的な見地からデータ量の時系列推移を考察してみよう。メインフレームやオフィスコンピュータ時代の中央集権アーキテクチャが、当時より高速な処理が可能だった分散処理型のクライアント/サーバモデルに置き換わり、業務単位で運用されるサーバや各クライアント端末のハードディスクにデータが分散管理されるようになった。社内のデータ量は徐々に増大し、企業では重要なデータをデータウェアハウスで一元管理することにした。このように、アーキテクチャの変化はビジネスニーズに対応すべく発生し、コンピュータがビジネスニーズに応えることで、データが蓄積されることになった。そして、いまはクラウドコンピューティングが騒がれている。このような大きな流れの中で、企業が管理するデータはこれまでとは比較にならない規模と速度で増え続けている。
一方、ビジネス/業務面の見地からすると、企業には、意志決定のベースとしてデータを活用したい、というニーズがあった。たとえば、小売業ではPOSデータを蓄積・分析し、商品の入れ替えや陳列棚の最適化を行ってきた。また、ECサイト運営業者は、自社Webサイトのアクセスログを解析することで訪問者がどのページを閲覧して購入に至ったか、あるいは離脱したかを把握し、ユーザが必要とする情報をより容易に取得できるようにWebサイトを改良している。製造メーカーによる需要予測や、化学メーカーの生産ライン最適化、アパレルメーカーの出店戦略など、さまざまな場面で企業はデータ分析によって、優れた意志決定をしようとしてきたのだ。
適切な意思決定を行うために、より多くのデータを分析して、全体を把握することが望ましい。前述したように、企業が管理する業務データは増加の一途をたどっており、コンピュータ技術の発展に伴って管理できる非構造化データも爆発的に増えた。こうしてビッグデータが生まれたわけで、それを分析して意志決定に生かそうというアプローチは、当然の成り行きと言えるだろう。
ビッグデータの本質は最適な意思決定を行うことにある
ここまで見てくるとお分かりだろう。ビッグデータはこれまでの技術的成長の延長線上に位置する事象であり、新たなテクノロジを指す言葉ではない。ビッグデータが注目されてきたのは、構造化データだけを対象としたデータ活用は「だれもがやっている従来のやり方」にすぎず、「ライバルに勝つための最新の分析を行いたい」という企業ニーズにマッチしたためだ。たとえば、POSデータを利用しない小売業者は、いまや皆無と言っていい。しかし、ほんの数十年前は、どの企業も活用できていなかった。実際に利用するで、その価値に気づいたのだ。これから数年後、ビッグデータは当たり前のように活用されるものになり、ビッグデータという言葉も消え去っているかもしれない。
ビッグデータの本質は、単に大容量データを高速に処理することでなく、高速にはじき出した分析結果から将来の傾向やパターンを予測し、最適な意思決定を行うことにある。これに気づいた多くの企業はビッグデータを活用することの有効性を説いてマインドセットの再形成を開始するとともに、大量データを活用して質の高い意思決定を行う仕組み作りに着手している。
すでにビッグデータを高度に分析する技術基盤は整った。これは、企業はいつでもビッグデータの活用に乗り出せることを意味する。初期から莫大な投資を行う必要はない。スモールスタートによって情報システム部門と業務部門が積み重ねた小さな成功体験をもとに分析基盤をブラッシュアップし、データ活用範囲を拡大していくプロセスを踏むことも選択肢のひとつだ。ビッグデータへの挑戦は試行錯誤の繰り返しになるだろうが、企業にとって決して無駄に終わることはない。ビッグデータの活用基盤を整備することができれば、コンプライアンス上のリスクや業務コストの低減、整合性を担保した情報環境の実現など、多くの価値をもたらしてくれるはずだ。