SAS® Data Managementの特長

統一されたデータ統合開発環境

  • 役割ベースの使いやすいポイント・アンド・クリック方式のGUIと、権限設定に基づいてプロセスを管理できる直感的なウィンドウ群。 ドラッグ&ドロップで操作できる機能により、プログラミングの必要性が大幅に軽減
  • ソースシステムへのアクセス、ターゲット構造の作成、メタデータのインポート/エクスポート、ETL/ELTデータ処理フローの構築と実行などの機能を提供するウィザード
  • メタデータの表示、視覚化、理解に役立つカスタマイズ可能なメタデータ・ツリー・ビュー
  • ソースシステム側の問題の修復と、他のデータ管理プロセスで利用するビジネスルールの維持を容易に行うことができるデータ・プロファイリング専用GUI
  • 開発過程におけるジョブの対話型デバッグおよびテストと、ログへの完全なアクセスのサポート
  • ジョブやテーブルの変更箇所、変更日時、変更者を設計者が把握するために役立つ監査履歴とチェックイン/チェックアウト機能
  • データ統合タスクを任意のプラットフォームに分散できる機能と、さまざまなソースやターゲット・データストアに接続できる機能
  • サードパーティ・ベンダーのSubversionやCVS(Concurrent Versions System)との統合によるバージョン/ソース管理機能の強化(アーカイブ、差分、ロールバックを含む)
  • 現在のSASユーザーがSASジョブおよびコードを容易にインポートすることができる、強化されたSASコード・インポート機能
  • 単一および複数のジョブを展開するコマンドライン・ジョブ展開オプション

統合型のプロセス・デザイナー

  • ビジュアルなイベント設計機能を用いた、データ管理プロセスの構築と編集
  • データ統合、SAS Stored Processes、データ品質に関するジョブの実行制御
  • IF THENロジックとパラメータ化に基づいたジョブの条件分岐実行
  • ジョブやプロセスを並列で実行可能
  • パラメータ入力に対応したジョブを実行可能
  • 内部/外部イベントのリスニングと、条件に基づいたイベントの発行
  • 外部OSレベルのコマンドの実行(例:シェル・スクリプトの呼び出し)
  • RESTおよびSOAP Webサービスの呼び出し
  • 旧バージョンのジョブをリスト表示および(読み取り専用モードで)オープンし、過去のバージョンに戻ることができる、標準装備のバージョン管理機能
  • DEV/TEST/PRODのサポートにより、ジョブのプロモート/マイグレーションを完全にサポート
  • 一般的なスクリプティング言語を用いてデータ統合バッチジョブを自動的に展開する機能
  • SAS Decision Managerで作成された意思決定フローをSAS Data Integration Studio内のノードから実行
  • ビジュアル分析にかけるデータを準備するために、SAS Data Integration Studio内で利用できるノードからSAS® LASR にデータをプッシュ

優れた接続性とデータアクセス機能

  • 他のほとんどのソリューションよりも多くのプラットフォームで、より多くのデータソースをバッチまたはリアルタイムで処理できる優れた接続性
  • エンタープライズ・アプリケーション、非リレーショナル・データベース、RDBMS、データウェアハウス・アプライアンス、PCのファイル形式などに幅広く対応したデータアクセス・エンジン群
  • Oracle、Teradata、DB2向けのバルクロードに最適化された専用のテーブルロード機能
  • Hadoopファイルシステム(HDFS)向けのファイル読み込み/書き出し機能と、ジョブフロー内でのHadoopのMapReduce/Pig/Hive、およびHortonworksのサポート
  • Cloudera Impalaインターフェイスを通じてHadoopにアクセスしている際にテーブルを表示するためのCloudera Impala Source Designer
  • あらゆるデータソースを横断して一貫したデータ定義を実現する包括的な共有メタデータ環境
  • 最高水準のパフォーマンス、データ移動の削減、カスタム・コーディングの必要性の軽減を実現する、ネイティブ・アクセス手法
  • メッセージ指向ミドルウェアのサポート。IBMのWebSphere MQ、MicrosoftのMSMQ、Java Message Service (JMS)、TIBCO Rendezvousなどに対応。ファイルの解析および処理で非構造化/半構造化データをサポート
  • Webサービス経由で送受信を行う静的データおよびストリーミング・データへのアクセス
  • MPPデータベースに対するサポートの拡大(Aster Data nCluster、Pivotal Greenplum、Sybase IQなどに対応)。より多くのELTプッシュダウンを実現し、バルクロード・ユーティリティもサポート
  • SQLベースの処理を標準サポート。
  • Aster Data、Pivotal Greenplum、Hadoop、Sybase IQのデータベースに対する接続性の強化(より多くの処理をデータベースにプッシュダウンすることが可能)

一貫したメタデータ管理

  • データ変換/データ統合プロセスの全体を通じてメタデータの収集および文書化を自動的に実行。メタデータはいつでもすぐに再利用することが可能
  • 列の定義をソースからターゲットに継承し、インテリジェントなテーブル結合を自動化することができる、高度なメタデータ・マッピング・テクノロジー
  • 使いたいコンポーネントの所在を素早く特定できるメタデータ検索機能
  • 既存のオブジェクト(列、テーブル、プロセスジョブなど)に対する変更について適用範囲と影響を事前に評価することができる影響分析
  • 結果として求める情報を導き出すために必要となるパス、プロセス、変換操作を特定することができる機能
  • データ間の依存関係の検証に不可欠で、データに対するユーザーの信頼感向上に役立つ、データリネージ(データ系統)機能(リバース影響分析)
  • リレーションシップ・サービス経由でオブジェクト・メタデータ・リポジトリにバッチ更新を適用することが可能(SAS Lineageとの統合向けの機能)
  • メタデータの変更を検出/比較/分析するための変更分析機能と、それに基づく選択的伝播機能
  • オブジェクトのチェックイン/チェックアウトを含む、複数ユーザーによるコラボレーションのサポート
  • 開発環境/テスト環境/本稼動環境を横断したメタデータのプロモーションとレプリケーション
  • ウィザード方式によるメタデータのインポート/エクスポート機能、および列の標準化機能
  • 柔軟なメタデータベースの展開機能により、再利用可能なストアドプロセスまたはWebサービスの形でプロセスジョブをバッチ実行向けに展開することが可能

データ品質管理のための基盤

  • データ品質管理機能を各種プロセス(バッチ、準リアルタイム、リアルタイム)に組み込むことが可能
  • 世界の38以上の地域でローカライズに対応し、ネイティブ言語で提供されるデータ・クレンジング機能
  • 業務遂行およびレポーティング(トランザクションおよびバッチ)環境の両方で利用できるデータ品質管理機能
  • 対話操作型のGUIを用いて業務データをプロファイリングし、データの不完全性/不正確性/曖昧性を特定することが可能
  • 業務プロセスのジョブフロー内から直接アクセスでき、カスタマイズや再利用も可能な、データ品質ビジネスルール
  • データを企業標準に準拠させるための標準化ルールを、すぐに利用できる形で同梱。また、特別な状況に合わせたカスタムルールを作成することも可能
  • プロセス全体を通したメタデータの構築・共有により、クレンジング対象のデータに適用されたアクションについて正確なトレースを提供
  • ジオコーディング(緯度・経度情報の付加)など他の情報ソースを利用して、既存データの価値を向上させることが可能
  • データ管理者は、対話操作型の専用GUIを用いて業務データの概略を把握し、データを利用する活動を継続的にモニタリングすることが可能
  • データ品質に関するビジネスルールを制度化するためのシンプルなプロセス。 特定のプロセス/プロジェクト/組織が求めるビジネス要件に従ってデータを検証するために、基本的または複雑なルールを適用することが可能。 ルールの適用は、バッチモードまたはリアルタイムのトランザクション・クレンジング・プロセスの両方に対応
  • データをリアルタイムかつ継続的に検査し、品質が許容範囲より低下した場合は即座に検出することができる、データ品質モニタリング機能
  • 対処の必要な問題が発生すると自動的に発行されるアラート機能

ETL(抽出/変換/ロード)とELT(抽出/ロード/変換)

  • コラボレーション、プロセスの再利用、共通メタデータをサポートする、強力で使いやすい変換ユーザー・インターフェイス
  • 導入後すぐに使えるSQLベースの変換操作の形で、ELT機能を提供(例:テーブルの作成、結合、行の挿入/削除/更新、マージ、SQLの抽出/実行など)
  • 単一または複数のソースデータを対象にした取得、変換、クレンジング、ロード機能により、データウェアハウス、データマート、BI用/分析用データストアを容易に作成することが可能
  • データ統合/変換プロセスの全体を通じてメタデータの収集および文書化を自動的に実行。メタデータはいつでもすぐに再利用することが可能
  • どのようなプラットフォーム、どのようなデータソースでも実行できる変換処理
  • 300種類以上に及ぶ定義済みのテーブル/列レベルの変換処理
  • 導入後すぐに使える分析的な変換処理(例:相関と頻度、分布分析、要約統計量など)
  • 変換ウィザードまたはJavaプラグイン方式の設計テンプレートにより、メタデータによるトレースおよび登録に対応した再利用/反復使用が可能な変換処理を簡単に作成
  • 変換プロセスは、終了時の自動呼び出しやメッセージ・キュー、Webサービスを通じた呼び出しに対応し、異なるプロジェクトや環境で再利用することが可能
  • 変換操作は、対話型操作による実行のほか、スケジュールに基づくバッチ実行やトリガーイベントに基づく実行も可能
  • アーカイブ、発行チャネル、電子メール、各種のメッセージ・キュー対応ミドルウェア向けに情報を発行できるフレームワーク環境
  • ローディング中でもリフレッシュ、追加、更新を容易に実行
  • ユーザーが選択できるオプションにより、ローディング手法を最適化することが可能
  • データベースのローディング手法(例:バルクロード機能、インデックスとキーの作成、テーブルの削除や切り捨て)
  • 変換操作は、高速で効率的な処理が行えるように設計されたハイパフォーマンスなSASコードを自動的に作成した上で実行
  • 高度な変換操作:mergeおよびhash手法をサポートするType 1 SCDと、Type 2 SCDローダ用のテーブル差分および機能強化
  • 2つのデータソースを比較してデータの変更を検出可能
  • RESTまたはSOAP Webサービスを呼び出すことが可能

データ連携

  • データベース構造、エンタープライズ・アプリケーション、メインフレームのレガシーファイル、テキスト、XML、メッセージ・キュー、その他の幅広いソースに対する仮想アクセス
  • リアルタイムのアクセスや分析処理向けに、複数のソースを横断してデータを結合することが可能
  • リアルタイムのデータビューに瞬時にアクセスできるデータビューアを標準装備
  • クエリ最適化機能は、DBMSリクエストの一環として自動で実行、または高度なSQLエディタ内から手動で実行することができ、同質性の高いデータと異種混在データの両方に対応

マスターデータ管理

  • 強化されたメタデータ検索機能。タイプ/名前/日時や他のキーワードによる検索、フォルダや他のオプションによるサブセット化、後で利用するための検索条件の保存が可能
  • 入出力データソースに関するセマンティクス(意味)データ記述のサポートにより、ビジネス要素(顧客、製品、口座など)の個々のインスタンスの同一性を識別することが可能
  • マスターデータの品質向上に役立つ、強力な変換ツールと組み込み型のデータ品質プロセス
  • マスターレコードを検証して識別可能なデータグループに整理することを可能にする、高度なファジー・マッチング・テクノロジーとクラスタリング手法
  • データの整合性を継続的にチェックおよびコントロールするために役立つ、リアルタイムのモニタリング機能、ダッシュボード、スコアカード
  • 本格的なマスターデータ管理製品に移行するための基礎としても利用できる必要十分な機能性
  • 単一のトランザクションから、数百件のトランザクションの一括処理にまで対応できるデータフィード機能
  • 1つのソースデータに対する複数のデータセットを用いた処理を1回のパスで実行することが可能

データガバナンス

  • 強化されたWebベースの参照データ管理環境およびビジネスデータ環境により、セマンティクスの参照とガバナンスの取り組みが容易化
  • ビジネス用語を階層構造で編成し、用語の所有者やシステム・メタデータ(テーブルやデータ管理プロセスなど)に関連付けることができる、統合型のビジネスデータ用語集
  • レポート作成や問題への対処のための幅広いデータ管理者向け機能。例えばWebベースのダッシュボード作成、ビジネスルール例外モニタリングなど
  • メタデータの変更をSASリレーションシップ・サービスに発行する機能。これにより、ビジネスユーザーはSAS Lineage内で関係を視覚的に把握し、変更の影響を評価することが可能

移行と同期

  • データベース構造、エンタープライズ・アプリケーション、メインフレームのレガシーファイル、テキスト、XML、メッセージ・キュー、その他の幅広いソースの間で、データを移行または同期することが可能
  • ソースとターゲットに対するメタデータベースのアクセス
  • 定義済みの変換機能を収録した広範なライブラリが提供され、独自の拡張や他の統合プロセスとの共有も可能
  • データを移動/同期/複製するタイミングでクレンジングを実行するためのデータ品質ビジネスルールを標準装備
  • キー・フィールドに対する変更を検出し、複数のデータベースを横断してその変更を複製または同期することが可能
  • 1つ以上のシステムで生じた変更をスケジュールに従って他のシステムに伝播できる統合スケジューラをオプションで利用可能
  • 同期/移行プロジェクト向けのリアルタイム・データサービスを提供

メッセージ・キューイング

  • メッセージ・ベースの接続性を介して非同期型のビジネスプロセスを統合することが可能
  • 代表的なメッセージ・キューイング製品へのインターフェイスを搭載。Microsoft MSMQ、IBM WebSphere、Tibco Rendezvous、Java Message Service(JMS)などに対応
  • 保証されたメッセージ/トランザクション配信により、業務中断に起因するコスト増を軽減
  • メッセージ・キュー・マネージャー毎に最適化されたアクセスを提供することで、管理の労力を最小限に抑制
  • あるアプリケーションの動作が他のアプリケーションの動作を自動的にトリガーすることを可能にする、イベントベースのアプリケーション統合
  • イベント駆動型の動的な実行ストリームおよびアラート発行
  • 分散した異種システム間でもメッセージを送受信することが可能

パーティション化と並列処理

  • Hadoopへの並列書き込み
  • SAS Scalable Performance Data ServerのためのSAS PROC DS2機能およびSAS FedSQL機能

S3変換

  • Amazon環境との間でデータをプッシュ/プルすることが可能

CASのためのソースデザイナー

  • SAS Data Integration Studioの内部から、SAS® Viya™ CASへの接続を構成および実行することが可能
  • お客様は既存のSAS 9.4プラットフォームの利点を享受し続けながら、SAS Viyaの機能/特長を使い始めることが可能

SAS® Metadata Bridge for Tableau

  • Tableau(ファイル)とTableau Server(リポジトリ)をサポート

強化された運用管理およびモニタリング

  • ジョブのステータスとパフォーマンスに関するレポートと傾向情報により、各種指標(CPU、メモリ、I/Oの使用率など)をトレースし、前回と今回のプロセス実行のパフォーマンス比較を随時更新することが可能
  • 以下のようなタイプのジョブなど、統合環境全体を管理およびモニタリングできる機能:
    • データ品質ジョブ
    • データ連携キャッシュジョブ(データ連携キャッシュを更新するためのスケジューリングされたクエリ)
    • プロセスフロー
    • 迅速かつ容易なトラブルシューティングを実現するログファイル・アクセス(Webベース)
    • SAS® Stored Processes
    • データ統合ジョブ