ログ分析とは?

ログ分析とは、IT エコシステムにおいて、ネットワーク、OS、コンピューターから取得されるイベントから収集される一連の情報のことです。

ログを分析することで、ユーザーの行動のパターンや例外を明らかにして、問題を特定し、セキュリティ上の問題を明らかにすることができます。

モニタリング

ログを分析することで、アプリケーションのパフォーマンス、動作、アプリケーション全体の中での例外を確認する能動的な監視を行えます。能動的監視によって、チームは、アラートをトリガーしなかった問題や特有の原因がある問題を特定することができます。アラートをトリガーするかどうかにかかわらず、ログデータには表示されます。

トラブルシューティング

集約され構造化されたデータにより、あらゆるレベルのトラブルシューティングを可能にします。ログ分析は、標準的なアクティビティのベースラインを提供し、何かがベースラインから逸脱した理由を特定するのに役立ちます。

レポーティング

IT チームは、分析しやすいように情報を統合的に表示するハイレベルなダッシュボードを使って、ログや指標を可視化することができます。ダッシュボードでは、ログ分析のデータを用いて、KPI や SLA などの必要な統計情報をハイライトして表示することができます。

傾向データ

ログ分析には、データの傾向や成長率を把握できるというメリットがあります。ヒストグラムは、ライフサイクル管理やキャパシティプランニングに役立つ成長率を視覚化するのに役立ちます。

ログ分析用のソフトウェアは、セキュリティ侵害、アプリケーションのインストール、システムのセットアップ/スタートアップ操作など、IT エコシステム全体のイベントから情報を収集します。

データのクレンジング

使用可能で正確なデータを使用することが重要です。以下のような場合には、データが破損する可能性があります。

  • ストレージディスクが破損している。
  • アプリケーションが正しく終了されていない。
  • ウイルスがシステムに感染している。
  • 入出力の設定に問題がある。

データの構造化

データはさまざまなソースから収集されるため、異なる命名規則が使用されがちです。分析時の混乱やエラーを減らすためには、さまざまなソースからのデータを相関させ、用語を標準化することが重要です。

データの分析

データの収集、クリーニング、整理が完了すると、データの検査が可能になります。分析の方法は、プロセス、データの使用目的、データセットのサイズなどによってさまざまなものがあります。以下はその選択肢の一部です。

  • 分類:データを様々なカテゴリに整理するキーワードタグでラベル付けすると、データのフィルタリングや調整がしやすくなります。
  • パターン認識:メッセージをフィルタリングしてパターンを検出することで、データのパターンを認識し、異常の検出に役立てることができます。
  • 人為的不検出:日々発生する大量のログメッセージのデータを厳密に調べるのは難しいものがあります。人為的不検出とは、機械学習システムの 1 つで、しきい値を超えるデータが発生しない限り、しきい値内の更新データを無視するというものです。
  • 相関関係の分析:単一のシステム全体のイベントが発生した場合にデータを比較する方法がなければ、サーバー、オペレーティングシステム、ネットワークデバイスから情報を収集しても効果がないことがあります。相関分析では、あるイベントに関連するすべてのコンポーネントからのメッセージを利用します。

これは、多次元異常検知とも呼ばれています。

DevOps

開発者は、遅延やパフォーマンスの問題を解決するために時間を費やすのではなく、機能性やアプリケーションの価値を高めるために時間を使うことができます。また、リリースが早まり、予期せぬ問題による遅延も少なくなります。

コンプライアンスの徹底

多くの企業は、社内のコンプライアンス要件に加えて、HIPAA、PCI DSS、GDPR などの規格や規制を遵守する必要があります。ログ分析を用いた監査が定期的に行われ、将来の監査が失敗しないようにしています。組織がコンプライアンスを遵守していない場合、高額な罰金が科せられる可能性があります。

セキュリティ脅威の検知

組織は、侵入者や DOS の脅威を含むセキュリティの脅威に、より迅速に対応し、効率的に根本原因を見つけることができます。根本原因が特定され、問題が解決されれば、将来のイベントを防ぐことができます。

運用

複数の部門が IT に依存して、業務と責任を遂行しています。ログ分析を使用すると、システムが機能停止する前にシステムエラーや問題を特定し、効率的かつ迅速に対処できます。ログ分析は、IT チーム、他の部門、およびお客様間のサービスレベルアグリーメントの維持にも含まれます。予防的分析により、収益の損失につながる可能性のあるサービスの中断や製品のダウンタイムを回避します。

インサイト

組織や個々のチームは、意思決定のプロセスを改善し、戦略を評価し、必要に応じて調整を行うことができますが、ログ分析はこれらすべてを可能にします。

より効果的な営業とマーケティング

ログにより、コンバージョン数、トラフィック量、訪問者がサイト内をどのように移動するかなどの情報を収集できます。これにより、お客様とのやり取りを分析し、カスタマーエクスペリエンスを改善できるかどうか、あるいは営業チームがメッセージを調整する必要があるかどうかを判断することができます。

トラブルシューティング

何か問題が発生したときは、できるだけ多くの情報にアクセスすることが重要です。モニタリングアプリケーションには 2 つのタイプがあります。

  • ルールベース:監視すべき対象が特定されている場合、ログ分析ツールを使ってエラーを特定し、アプリケーションの最適化を図ることができます。チームは独自のルールセットを作成し、一連の異なるチャネルを使用してアラートを生成することができます。ただし、ルールベースでは、対応する人が発生しうるすべての問題について事前に把握している必要があり、今日のデジタルサービス環境では拡張性に欠けます。
  • 機械学習によるログ分析:機械学習ツールは、問題を自動的に検出し、アプリケーションの動作を含む IT エコシステム全体の異常を特定することができます。このツールは、データをスキャンして、発生する可能性のある問題を分析します。

標準的なデータ分析ツールでは、急速に増殖するマシンデータからの多様なボリュームに対応できません。ログ分析とは、IT システムが生成するマシンデータを分析し、可視化して、インサイトを得ることです。

ServiceNow のログ分析

ITOM Predictive AIOps の一部である ServiceNow Health Log Analytics 機能は、潜在的な障害の早期シグナルに対してアラートを出します。

ServiceNow ITOM Health Log Analytics では、以下のことが可能です。

ビジネスに合わせて拡張できる機能

ServiceNow で、問題を発生前に予測しましょう。