SAS® In-Memory Statistics for Hadoop
アナリティクス・ライフサイクル全体をひとつの環境で
Hadoopから的確なタイミングで知見・洞察を導き出すためには、これまでとは異なるアプローチが求められます。
インメモリ・アナリティクスだけなく、データの準備、探索、モデリング、展開までの全行程を最初から最後までカバーした対話操作型の総合ソリューションが必要です。
それなしで正しい答えを即座に得ることはできません。
利点
Hadoopを深く探索し、正確な洞察を高速に獲得
最先端の統計アルゴリズムや機械学習手法を適用して最良の答えを見つけることができます。複数の分析アプローチを探索・活用して洞察を導き出し、事実にもとづく意思決定を行えるようになります。
データ・サイエンティストの生産性を向上
高速なインメモリ・アナリティクス・プログラミング言語を用いて、複数のユーザーが同時に対話操作でHadoop内のビッグデータを分析することが可能です。データの準備、操作、変換、探索、モデル作成、アクセス、スコアリングのすべてをHadoop内で実行できます。
拡張性が高いエンド・トゥ・エンドの環境を最大限に活用
これまでは、統計担当者やデータ・サイエンティストがHadoop環境でアナリティクス・ライフサイクルの幅広いタスクを管理しようとすると、異なるプログラミング言語や製品を組み合わせなければなりませんでした。また、モデル運用の段階では、ソフトウェアの規模面の拡張性に難点がありました。しかし、これからは違います。データの準備や探索からモデルの構築と展開まで、SASのソリューションは豊富な実績があり、効果が検証済みで、正確な結果を出力し、お客様の本稼動環境に合わせて運用の規模を拡張できます。
データ処理における複数回の不要な行程を回避
Hadoop上で動作するSASのインメモリ・インフラでは、コストのかさむデータ移動が不要となり、データは分析セッションの最初から最後までメモリ内に保持されます。これにより、データ処理の待ち時間が大幅に減り、超高速で瞬時に分析を実行します。一般に、分析に先立つデータ準備にかかる時間は分析プロジェクト全体の80パーセントを占めるといわれていますが、幅広いデータ操作機能を備えたSASのソリューションでは、データ準備も短時間で簡単に行うことができます。
スクリーンショット
主な特長
- 対話操作型のインメモリ・プログラミング
- 分析データのアクセスと操作
- 記述統計
- 統計アルゴリズムと機械学習手法
- モデルの評価
- モデルのスコアリング
- テキスト分析
- レコメンデーション・システム