オブザーバビリティの準備とは?

オブザーバビリティの準備とは、ビジネス目標にとって重要な主要パフォーマンス指標(KPI)を積極的に監視することです。 ビジネス目標を達成するには、アプリケーション監視の範囲と完全性のバランスが重要です。 最適なバランスを実現することで、組織はエンドユーザーのエクスペリエンスと需要に応じてプロセスフローを修正、最適化、強化することができ、投資収益率(ROI)が向上します。 New Relicプラットフォームは、企業の目標達成を完璧かつシームレスに支援します。

なぜ今なのか?

  • 競争の激しい市場で抜きん出るには、クライアントエクスペリエンスが最も重要です
  • アジャイル開発では、短期間に複数のリリース(場合によっては数百)が必要です
  • アプリケーションのモダン化における抽象化、インテグレーション、および複雑さのため

オブザーバビリティの準備は、リリースサイクルまたはスプリントの一部である必要があります。 これは次のことに役立ちます。

  • アプリケーションチームが動的なビジネス目標に合わせて調整する
  • DevOpsとサポートチームが問題の重大度と優先度を理解する
  • 企業が目的を達成するためにチームと効果的に協力する

対照的に、ピーク時に備えた準備(オブザーバビリティの準備のサブセット)は、リソースを垂直方向または水平方向にスケールアップするという点で重要です。

継続的なオブザーバビリティの利点

ビジネスには四半期ごとに、年間目標と一致する目標があります。オブザーバビリティはこれらの目標と一致し、企業が目標を達成できるように支援する必要があります。 以下にその例を挙げます。

  • 運用コストの削減:クラウドサービスとインフラストラクチャは企業に継続的なコストをもたらします。 システムのアップグレード、導入、変更を監視して、リソースの最適な利用を確保する必要があります
  • 顧客満足度:顧客がアプリケーションとどのようにやり取りするか、ボトルネックが何であるかを理解することで、顧客との信頼を築きます
  • 社員の生産性:チームがオブザーバビリティツール、オブザーバビリティの範囲、完全性、盲点について理解していることを確認します
  • ROI:最も重要なサーフェスビジネスKPIは、アプリケーションのパフォーマンスと相関している必要があります。 これにより、アプリケーションチームは重大な問題領域に集中することができます
  • サービスレベル:一定期間にわたって期待どおりにパフォーマンスが発揮されず、社員の生産性やビジネスKPIに影響を与えているサービスを追跡します

New Relicオブザーバビリティの準備プロセス

オブザーバビリティの準備ライフサイクルのステップを見てみましょう。

1

事業目標

今年または四半期の目標は何ですか?実行時間の改善、ダウンタイムの削減、可視性の向上、あるいはクラウドへの移行、ツールの統合、 OpenTelemetryの導入などの新しいビジネスイニシアチブを採用することですか?

2

オブザーバビリティアーキテクチャー

オブザーバビリティアーキテクチャーがビジネス目標と一致していることを確認することは重要なステップです。 New Relicプラットフォームを選択すると、ビジネス目標とアーキテクチャーの決定を自由に行うことができます。 New Relicプラットフォームは、機能インテグレーションの配列を備え、オープンソースを採用し、カスタムアプリケーションをサポートして、特定のビジネスニーズを満たします。

3

エンティティの監視

New Relicを使用してアプリケーションの監視を開始します。これにより、現在の資産全体のリアルタイムレポートが提供され、可用性の範囲とオブザーバビリティの完全性を可視化することもできます。

4

ギャップの特定

すべてのアプリケーション、サービス、インフラストラクチャなどを常に監視できるとは限りません。とにかく、ビジネスを繁栄させる必要があります。つまり、重要なアプリケーションに盲点、テレメトリーデータ、ビジネスデータポイントの欠落があってはいけません。創造力を発揮して、解決策を見つける機会です。この点については、後ほどブログ記事で説明します。

5

実装と導入

New Relicは継続的なインテグレーションおよび継続的なサービス(CI/CD)と統合し、実装を容易にします。 クライアントは、New Relic Terraformリソース、クラウド形成、規約などを使用してテンプレートを作成しました。 これで、導入に集中するための道が開かれます。 New Relicチームとエコシステムはお客様と提携して、このジャーニーをスムーズに進めます。

6

結果の測定

ユーザージャーニー、サービスレベル管理(SLM)、アラート品質管理(AQM)などのNew Relicの機能は、設定した目標に基づいて成果を測定するのに役立ちます。

7

反復サイクル

アプリケーションやビジネスのニーズに応じて、オブザーバビリティは継続的に向上する必要があります。

ギャップの特定:最も重要なことは何か

最も重要なギャップをどのように見つけますか?

「悪魔は細部に宿る」ということを忘れないでください。重要なアプリケーションやサービスなどを特定するのは簡単であり、良い出発点となります。

次のステップでは、何をすればよいでしょうか?

  • 開発者、ユーザー、顧客などのさまざまな人にインタビューする
  • フィードバックを集める
  • 過去nか月間に作成されたチケットに関するレポートを取得する
  • 既存のアプリケーションの監査を実行する
  • その他

上記の点は、証拠と経験に基づいて重要です。 どうすれば効率性を高め、ギャップを見つけることができるでしょうか?カオスエンジニアリングやGameDay、DiRTについて聞いたことがありますか?

ソフトウェアエンジニアリングのアプローチとして認識されている「カオスエンジニアリングは、本番環境の乱流条件に耐えるシステムの能力に対する信頼を築くために、システムを実験する学問です。」(ウィキペディア)

カオスエンジニアリングセッションの実行

カオスエンジニアリングのセッションからトラブルシューティングの欠点を見つけます。 カオスエンジニアリングはスイスアーミーナイフのようなもので、次のことに役立ちます。

  • NewRelicプラットフォームの機能の有効化と導入:これらのセッションに参加するチームメンバーは互いに学び合います。チームメンバーが結果を確認して共有できる、ストレスのない環境である必要があります。 彼らは、自分たちに何が期待されているか、誰に連絡すべきか、そしてインシデント管理プロセスの複雑さを理解しています
  • 盲点を明らかにする:盲点があると、平均解決時間(MTTR)が長くなり、トラブルシューティングセッションに特別な専門知識が必要になります
  • テレメトリーデータの最適化:チーム、ビジネスユニット、担当者間のコミュニケーションが重要です。 カオスセッションでは、必要なデータと情報ポイントがすべて揃っているかどうかを確認する機会が提供されます。 たとえば、企業は過去1時間で売上が減少した理由を尋ねる可能性があります。その原因としては、プロモーションの変更、ベンダーサービスの停止、パフォーマンスの低下、またはアプリケーション自体とは関係のないその他の理由が考えられます
  • パフォーマンスの連鎖効果を分析:カオスエンジニアリングセッションでは、オブザーバビリティの範囲と完全性を評価および理解できます。 適切なカバレッジがなければ、問題、優先順位、重大度を判断するのは面倒です
  • ボトルネック:2000年代初頭、問題が発生すると通常、その原因がデータベースまたはネットワークにあると考え、指摘し始めました。今日、クラウド、マイクロサービス、インフラストラクチャなど、抽象化のピークを実現しています。アプリケーションの相互依存性や内部依存性が高まっています

カオスエンジニアリングは、Gremlin、Chaos Monkey、Chaos Meshなどのツールを使用して実行することも、手動で実行することもできます。

カオスエンジニアリングセッションは、本番環境の乱流条件に耐えるために何が重要かを判断するのに役立ちます。 何が重要かが判ったら、New Relicプラットフォームでは、すぐに使用できるゼロタッチで、カバレッジギャップ、推奨事項、不足しているエンティティが提供されます。

New Relicプラットフォーム:ギャップを埋める

特定されるギャップはさまざまであり、広範囲にわたる可能性があります。 New Relicプラットフォームを使用すると、オブザーバビリティの準備に必要な機能を迅速かつ有機的に実装できます。 お好きなトラブルシューティングアプローチ(ログ優先またはメトリクス優先)に関係なく、次のようなNew Relic機能を活用できます。

  • Logs in context:Logs in context は、他のコンテキストテレメトリーのデータポイントとともにログの統合ビューを提供します。 これにより、ツールの切り替えや何百行ものログの精査が不要になり、根本原因の分析が迅速化されます
  • 分散トレーシング:トレースはユーザージャーニーの徹底的な分析を提供するため、ユーザージャーニーに関与する複数のサービスに関係なく、パフォーマンスのボトルネックを特定できます
  • 変更/デプロイメントトラッカー:変更/デプロイメントトラッカーを使用すると、ソフトウェア開発ライフサイクルの最も重要なイベントの1つである「デプロイメント」または「Go Live」の最中および後に問題を注意深く監視し、軽減することができます
  • Vulnerability Management(脆弱性管理):脆弱性管理は、資産全体の脆弱性を特定し修復するのに役立ち、攻撃のリスクを軽減できます
  • OpenTelemetry:OpenTelemetryは、テレメトリーデータを収集およびエクスポートするためのオープンスタンダードであるため、 New Relicを使用して任意のアプリケーションやインフラストラクチャからデータを収集できます
  • サービスレベル管理:SLA /SLMは、サービスレベル契約(SLA)とサービスレベル目標(SLO)の設定と追跡に役立ちます。 これにより、ビジネス目標を確実に達成できるようになります
  • ワークロード:ワークロードにより、サービスのグループのパフォーマンスを可視化できます。これにより、チームは集中力を維持し、業務を継続できるようになります

特定の環境に適用できる監視のベストプラクティスを実装します。 この結果、オブザーバビリティの適用範囲と完全性が最も重要な部分で確実に機能し、コスト管理に役立ちます。

まとめ

監視に対する積極的なアプローチを維持し、アプリケーションとインフラストラクチャを改善しようとしている組織にとって、オブザーバビリティの準備をしておくことは不可欠です。 オブザーバビリティの準備プロセスに従い、 New Relicプラットフォームの力を活用することで、企業は自社のシステムがあらゆる課題に備え、目標に沿った状態にあることを確認できます。 繁忙期や重要なイベントを待つ必要はありません。今すぐオブザーバビリティの準備に向けて取り組みを始めてください。