Datadogとは
Datadogは、ログ・リクエストトレース・メトリクスを 1つのプラットフォームで監視して、スタック全体を可視化する最新のログ管理システムです。
オンプレでもクラウドでも、場所や規模を問わずに、インフラストラクチャーからアプリケーションまで1つで監視することが可能です。サーバーにエラーがないか、システムのレスポンスが遅くてユーザーが使用できなくなっていないかなどを監視して、異常があればアラームを送信します。
多くのインテグレーションがビルドインされているので、導入も容易です。
Datadogの強み
●すばやいトラブルシューティング
ログを迅速に検索・分析して、トラブルの原因追求と解決が可能です。
●すべてのプラットフォーム、アプリケーションから収集したログを調査・分析
サーバーの稼働監視からアプリケーションの性能監視まで、一貫して監視し、フィルタを自動生成して、ただちにログを検索します。
1つのダッシュボード画面にすべてのログデータが可視化され、高度なアラートが作成されます。
●オブザーバビリティの三本柱を統合
ログ・メトリクス・リクエストトレースの間をナビゲートして、システム全体を把握します。
Datadogでできること
●すべてのログデータを集約
組込みインテグレーションにより、自動的にログを収集しタグ付けします。
●アプリケーション・サービス・クラウドプロバイダーのDatadogによる統合でログを送信。
アベイラビリティーゾーン、HTTPステータスコードなどのログにファセットを自動的に適用します。
サーバーやアプリケーションなどのレイヤーごとに別々のモニタリングシステムを使用する必要がないので、運用コストも運用工数も削減できます。
●ログを自動的に処理
・組込みパイプラインを複製・変更して、カスタムデータフィールドやファセットを取得します。
・新たなパイプラインを構築し、ログの形式に関わらずデータを抽出し強化します。
・ログ処理パイプラインの作成が簡単です。
【導入事例】
●3拠点のメトリクスを1ヶ所に集約、障害発生時も迅速な対応が可能に
(ゲーム機メーカー)
およそ9160万台の販売実績と月間9400万人以上のアクティブユーザーがいるネットワークをDatadogで可視化しています。
チームが3つの拠点に分かれており、今まではそれぞれがバラバラのツールを利用して分析を行っていましたが、Datadogを導入することにより、3拠点のメトリクスを一箇所に集約することが可能となりました。
東京、サンディエゴ、サンフランシスコと運用拠点が離れていても、タグによってどのチームのどのサービスがどれぐらいの台数で動いているかが一目で分かるようになりました。
マイクロサービスアーキテクチャを採用しており3拠点のサービスが複雑に連携をしているのですが、問題が発生した時でもフレームグラフからどこがボトルネックなのかを迅速に究明することができます。
一つのDatadogアカウントを3拠点で利用することにより、互いのサービスのステータスを容易に確認することができるようになりました。ネットワークに障害が発生したとき、今まではさまざまなツールを駆使して、時間をかけて究明していましたが、Datadogを導入することにより迅速に原因究明と復旧作業を行えるようになりました。