「IBM InfoSphere DataStage」とは
IBMの提供するクラウドベースのデータプラットフォーム「IBM Cloud Pak for Data」上でデータの統合が可能なETLツール。各工程の自動化・効率化によって、コストの削減、イノベーションの加速を実現します。
高速での処理や各種AI機能が魅力で、小売、エネルギー、ヘルスケアなど各業界の大企業に加えて、自治体、教育機関などにも導入実績を持つ信頼の製品です。
「IBM InfoSphere DataStage」でできること
「IBM InfoSphere DataStage」では、以下のような機能を利用可能です。
▶︎データ統合・各種AIサービス
データの統合、「IBM Cloud Pak for Data」プラットフォーム上で以下の機能を利用した分析や管理が可能です。
・データサイエンス
・イベント、メッセージング
・データの仮想化
・データウェアハウジング
▶︎高機能な処理エンジン
並列処理およびロード・バランシング(負荷分散)を活用して、大量のデータをすばやく処理します。
▶︎データの保護および流れの確認
・IBMデータカタログのメタデータ交換を活用した機密データの保護
・データリネージュ機能を活用したデータの変換、統合における流れの確認
が可能です。
▶︎CI/CDのジョブパイプライン自動化
開発、テスト、デプロイなどの一連のプロセスを自動化し、開発コストを低減します。
▶︎構築済みのコネクター、ステージ
構築済みのコネクター、ステージを利用して、クラウドソースとデータウェアハウスの間でデータを移動できます。
▶︎Webベースのインタフェース
機械学習支援設計で使いやすく、開発者の生産性を向上、コストの削減を可能にします。
▶︎データの品質チェック
ターゲットとなる環境に取り込まれるデータの品質チェック、問題解決を自動で行います。
▶︎自動障害検出
自動で障害を検出し、インフラ管理のコストを削減します。
▶︎ジョブ・テンプレート
ジョブを自動生成し、カスタムルールを用いたパターンを適用することができます。
「IBM InfoSphere DataStage」の強み
▶︎豊富な導入実績
小売、エネルギー、ヘルスケアなど各業界の大企業に加えて、自治体、教育機関などにも豊富な導入実績を持ちます。
▶︎柔軟な導入オプション
クラウドに加えて、オンプレミスでの導入も可能。ニーズに合わせて柔軟に選択可能です。
▶︎高速でのデータ統合
前述のとおり、並列処理とロード・バランシング(負荷調整)を活用して、高速でのデータ統合処理を可能にします。
▶︎その他
任意の環境へのデプロイ、仮想化によるコスト削減などが可能です。