SAS® High-Performance Data Miningとは
SASのハイパフォーマンス・アナリティクス製品群では、大量の多様なデータを使用するモデルの開発と処理が可能になります。これらの製品(統計、データマイニング、テキストマイニング、計量経済分析、最適化)はいずれも、拡張性の高い分散型のインメモリ処理アーキテクチャで利用できます。
SAS® High-Performance Data Mining でできること
ハイパフォーマンス変数削減
• 構造化データに対して次元を削減することで、元の変数群のサブ
セットを選択
• データ分散の最大量を説明するような変数群を識別すること(=共
分散分析)により、教師なしでの変数選択を実行
• 分布に関する計算やCORR(相関)、COV(分散)、SSCP行列の出
力を提供
• カテゴリカルな入力をサポートする目的でCLASSステートメント
を使用
• 統計プロシジャでも使用可能な統計量と行列情報を出力
ハイパフォーマンス時系列次元削減
• 類似度やクラスタリングなどの作業を行うために次元を削減
• 入力データに関して3種類の時系列フォーマットに対応(トランザ
クション型(transactional)、転置型(transposed)、列方向型
(columnwide))
• 次元削減済みの時系列を3種類のフォーマットで出力(トランザク
ション型、転置型、列方向型)
• 入力データに関して複数の時系列変数をトランザクション形式で
処理
SAS® High-Performance Data Mining の強み
・新たなチャンスをつかむ
極めて高速なパフォーマンスにより、分析処理にかかる時間が短縮され、洞察が速やかに導き出されます。きめ細かく正確な結果が出るため、情報にもとづく意思決定を、確信を持って行えるようになります。データから新たな収益機会を引き出し、大きなビジネス価値を獲得しましょう。
・極めて難しい課題を解決する
豊富に用意された業界最高水準の高度な分析手法を用いて、難しい課題や未解決の問題に取り組んだり、新たなアイデアをテストしたりすることができます。また、ハイパフォーマンス・テキストマイニングと組み合わせれば、テキストデータの中に隠された関係を明らかにし、予測能力をさらに強化することができます。
・重要な意思決定の精度を高める
データマイニング結果の精度を高め、意思決定の正確性を高めることができます。それを実現する秘訣は、サンプリングした一部のデータではなく、また構造化データ/非構造化データの違いを問わず、利用できる全データに対して高度な手法を適用することです。このソリューションなら、より多くの変数を扱い、従来よりも頻繁にモデリングを反復実行することが可能です。