Hadoop対応
ソリューション
Hadoopがビッグデータを解決します
88%の企業や組織がHadoopをチャンスと考えています。
御社ではいかがですか?
ビッグデータ活用のIT環境にHadoopを追加したいとお考えなら、お任せください。SASは、すべてのデータから貴重な洞察を導き出すのに必要な機能 をすべて提供しています。広範なデータ管理(ビッグデータの加工には多大な時間がかかります)、視覚的なデータ探索、インメモリ処理、高度なアナリティク ス、そして、最良の解決策をもたらすモデルの迅速な展開。それぞれの詳細をぜひご確認ください。
データの探索と視覚化
データを理解すること、それが価値を導き出すための第一歩です。
Hadoopの活用にあたっては、今現在どのようなデータがあるかを知ることが最初の課題です。また、Hadoopに適した用途を理解することも重要です。SASのソリューションでは、以下のことが行えます。
- 数十億件規模のデータも対話操作により数秒で探索:Hadoopのデータを視覚的な操作で素早く調査できます。例えば、構造化データ(業務データなど)と非構造化データ(Twitterフィードなど)の両方を検討して顧客のホンネをつかむことができます。
- 高速で強力なアナリティクスをあらゆるユーザーに提供:使いやすい分析機能により、技術的なスキルが高くないユーザーでも自力でデータを探索し、その意味を理解できます。
- 知見や洞察を共有:分析から得られた知見・洞察をWeb、モバイルデバイス、Microsoftのアプリケーションで簡単に共有でき、関係者で回覧することも可能です。
- 誰もが使えるSAS Analytics:アナリティクスの専門家やプログラマーでなくても、多くの利用事例で実証済みの真の分析機能を活用してHadoopから価値を引き出すことができます。関係の特定、予測の実行、シナリオの比較検討などが可能で、いずれもプログラミングの必要はありません。
- Microsoft Officeやモバイルデバイスとの統合:Hadoopに保管された情報は、まさに宝の山です。そこから導き出した知見や洞察を、誰もが簡単にアクセスし活用できる場所に配信することができます。
- 大規模な利用を想定して設計されたセルフサービス方式のBI:対話型のクエリ、BI、視覚化機能が、すぐに使える高度な分析機能と融合されています。そのため、誰もがHadoopから洞察を導き出することができます。
Hadoop向けのデータ管理
集めるだけでは不十分。ビッグデータは有効に活用することが重要です。
初期のビッグデータ・プロジェクトでは、とにかくデータを収集・保管することが重要でした。しかし現在は、そのデータをどう生かすかが重要です。求められて いるのは、膨大なデータセットを活用して違いを生み出すことです。SASのソリューションでは、以下のことが行えます。
- Hadoopデータに高速アクセス: Hadoopに素早く簡単にアクセスして、ビッグデータを貴重な情報に変換します。
- 「ゴミを入れたら、ゴミしか出てこないが(garbage in, garbage out)」悪循環からの脱却:統合データ・ストレージが質の高いデータを提供するため、正確なアナリティクスが実現します。
- ビッグデータを現場に役立つ形で提示:データ統合のプロセスを再利用できるため、ビッグデータそのものに集中し、より多くのビッグデータを活用することができます。
- ビッグデータ管理の迅速化:Hadoop内でデータ品質とデータ統合にMapReduceとYARNを活用し、信頼性の高いデータを確保する処理を高速化します。
- コーディング不要のビッグデータ管理:ビッグデータは今、ビジネスを支える情報源として重要性が高まりつつあります。SASは、業務部門とIT部門が連携してビッグデータを全社的に活用できるように支援します。
- Hadoop向けのデータ管理:ビッグデータを取り扱いやすくするため、SASはHive、Pig、MapReduce向けに数多くの変換処理を用意しています。ビッグデータそのものに集中し、より多くのビッグデータを活用することができます。
Hadoopでのアナリティクス
もう待つ必要はありません。すぐに答えを手にできます。
Hadoopには従来とは異なるアプローチが必要です。週に数個のモデルを作成する程度では効果を発揮できません。また現在のビジネスでは、分析結果が出るのを何時間も待っている余裕もありません。SASのソリューションでは、以下のことが行えます。
- これまでは考えもしなかった疑問に答えを出す:極めて複雑な計算処理でも、分散インメモリ環境で実行すれば、数分、場合によっては数秒で結果が得られます。
- より優れた洞察を導く:サンプリングではなくデータ全体を使って、より多くのモデルを実行できます。全データを用いて複数のシナリオを評価し、より多くのアイデアを試し、最良の答えを見つけることができます。
- 新たなチャンスをつかむ:より詳細かつ正確な結果が得られるため、正しい判断を下し、新たな収益機会を開拓し、増益を達成できます。Hadoopデータを最大限に活用することが可能です。で連動してメッセージを発信することにより、キャンペーンの効果を高めることができます。
- データを一貫してインメモリで処理:SASソリューションでは、ビックデータを一度メモリに読み込めば、その後は何度でも分析に使うことができます。複数のユーザーによる利用も可能です。ディスクにデータを書き込んだり、コストがかかるデータの移し替えを行ったりする必要は一切ありません。
- より詳細に踏み込み、より多くの課題に取り組む:モデルの評価と改良を重ねながら、より正確な答えを導き出すことができます。SASのソリューションなら、これまで手が出なかった課題にも取り組めます。
- 短時間の実験を繰り返して最良の結果を追求:超高速のインメモリ処理により、モデリングを高速かつ頻繁に反復実行し、最も高い価値をもたらすモデルを発見することができます。
モデルの展開と実行
モデルをより迅速に現場展開できるほど、より多くの価値を引き出すことができます。
分析モデルを作成して業務で利用するまでには、多大なリソースが必要になることもあります。しかし、期待どおりのメリットを享受するには、できるだけ短時間でモデルを現場に展開することが重要です。SASのソリューションでは、以下のことが行えます。
- データの移動を減らしてデータガバナンスを確保:Hadoop内のデータを移動せずにスコアリングできるため、遅延の原因となるデータ複製を回避することが可能です。
- モデルの展開を効率化:モデルスコアリングのプロセスをHadoop内で実行することで、手作業で起こりがちなエラーを回避し、より短時間で結果を得ることができます。
- IT部門とアナリティクス・チームの生産性を向上:迅速で自動化された展開が可能になるため、アナリティクス・チームはより多くのモデルを開発できるようになり、IT部門は戦略的なプロジェクトに集中できるようになります。
- Hadoop内でスコアリングを実行:Hadoop内でデータをスコアリングできるため、分析から得られた洞察を素早く行動に移すことができます。
- アナリティクスを効率よく業務に組み込み:モデルの展開は、分析作業から価値を導き出す上で不可欠のステップです。SASのソリューションではモデル展開が自動化されるため、より多くのモデルをより迅速に業務に組み込むことができます。
- 生データをその場ですぐにスコアリング:モデルだけでなく、データ準備プロセスやスコアリングの変数変換ロジックも含めたワークフロー全体をエクスポートすることができます。
データ・サイエンティストの皆様へ
現実と直結した結果をHadoopから取得。ほんの数秒で。
オールインワンの対話操作型環境であるため、Hadoop内のデータから正確な洞察を導き出すのに必要な機能がすべて揃っています。しかも超高速処理が可能です。SASのソリューションでは、以下のことが行えます。
- ひとつの環境であらゆる機能を実行:多数のユーザーが同時に作業し、データの操作と準備、データの探索、モデルの構築、モデルの展開などを処理することができます。SASのソリューションはアナリティクス・ライフサイクル全体をカバーしています。
- 優れた結果をもたらす優れたモデルを構築:世界最高水準の統計手法や機械学習手法を駆使して優れたモデルを作成し、Hadoopデータ全体を対象として実行することができます。
- 思考のスピードで分析:必要に応じて対話操作型のインメモリ環境でコードをカスタマイズすることもでき、その場合も速やかに結果が得られます。使いやすい環境と超高速処理により、データ・サイエンティストとしての創造性が大きく高まります。
- 全社規模のニーズに対応できる拡張性:膨れあがるデータ、増大するユーザー、複雑化する問題・・・。でも、ご心配はいりません。極めて拡張性が高いSASのインメモリ環境は、必要に応じて容易に規模を拡大することができます。
結果が得られるまでの時間を短縮:モデルを構築して速やかに反復実行し、最もパフォーマンスに優れたモデルを判断することができるため、作成から展開までの時間が大幅に短縮されます。
- インメモリでデータの一貫性を維持:SAS独自のテクノロジーにより、ビッグデータを1回だけ読み込めば、その後は何度でも分析に使用することができます。そのため、生産性が向上し、時間の余裕がない状況でも創造性を発揮できます。
- かつてないレベルの分析パワー:強力な統計手法、機械学習手法、テキスト分析、レコメンデーション・システムなど、豊富な分析機能が用意されているため、より多くのことを、より短時間で把握できます。
- アナリティクス・ライフサイクル全体をひとつの環境でカバー:Hadoop向けの複数の言語や技術を切り替えながら作業する必要がないため、効率よく洞察を導き出し、より優れた意思決定を支援することができます。データ・サイエンティストとしての業務を最初から最後までスムーズに進めることが可能です。