SAS In-Databaseテクノロジーの特長
SAS Scoring Accelerator
- 自動パブリッシング・クライアント。モデルをデータベースで使用できるSAS DS2プログラムに自動的に変換し、データベースに自動的に発行します。
- In-Databaseの実行。SASモデルスコアリングの計算をデータベース内で完全に実行できるようにします。
- SAS Enterprise Minerモデルのサポート。SAS Enterprise Minerの提供する予測モデルや記述モデルの頑健性を最適化するために、このパブリッシュ・モデルには事前のデータ変換フェーズ(データ補完など)も含まれています。
- SAS/STATモデルのサポート。SAS/STATプロシジャ(LOGISTIC、GENMOD、REG、GLMSELECT、GLM、GLIMMIX、MIXED)を使用して作成された予測モデルの選択されたセットをサポート。
- ランタイム環境。SAS標準の出力形式とユーザー定義出力形式がサポートされています。
- モデルのパブリッシングとスコアリング。Base SASからのプログラムによるモデルのパブリッシングとスコアリングをサポートするか、SASジョブとして実行するように登録/スケジュールできます。
- モデルパフォーマンスの追跡とモニタリング。SAS Model Manager(SAS/STAT線形モデルでは必須、SAS Enterprise Minerモデルではオプション)と完全に統合されているため、SAS Model Managerグラフィカル・ユーザー・インターフェイスを使用したデータベースにおけるSASモデルの登録、検証、スコアリングをさらに効率化できます。
SAS In-Database Code Accelerator
- In-databaseの実行。ユーザーが記述したSAS PROC DS2コードをデータベースで実行できます。
- 超並列処理。SAS PROC DS2プログラムのスレッド化されたコンポーネントをデータベースにプッシュダウンし、データ・プラットフォーム全体での超並列実行を利用できるようにします。
- パフォーマンスの向上。CPUを集中的に使用する計算や大規模なデータソースでのデータ変換に使用すると、最も優れたパフォーマンス・メリットを得ることができます。
SAS Data Quality Accelerator
- 大文字と小文字の区別。コンテキストに適した大文字と小文字がデータ列で使用されるようにします。
- 抽出。コンテキスト固有のエンティティまたは属性をテキスト文字列から抽出します。
- 性別分析。名前の性別を判断します。
- 識別分析。テキスト文字列で表されるデータの種類を判断します。
- 解析。文字列を個別の離散エンティティにセグメント化します。
- パターン分析。テキスト文字列の文字パターンの簡単な表現を表示します。これは、さらにデータ品質処理が必要か否かを判断するのに役立ちます。
- 標準化。均一性を確保するために、列内のすべての値に対して優先されるフォーマットを出力します。
- マッチコードの生成。テキスト文字列の「マッチコード」を生成します。マッチコードは、関連するものの同一ではない情報間のあいまい一致比較に使用されます。