職人技と不眠不休によるエラー究明に終止符を!
クラウド化の過渡期に最適な提案が行える “クラウド・ソムリエ”へ
牧薗 考司(まきぞの・こうじ)氏
NTTデータ先端技術株式会社
基盤ソリューション事業本部マネージドサービス事業部
サービスデリバリ担当シニアスペシャリスト
■急成長企業のシステムを支えるため、「オブザーバビリティ」に着目
― いつごろ、どのようなきっかけでオブザーバビリティと出会われたのでしょうか。
2021年5月に、社内のスタッフから紹介されました。当社では業界内に幅広くアンテナを張り巡らせ、常に最新の製品やソリューションをキャッチアップしています。
当時、私が担当しているお客様の中に、200万会員を有するBtoCの定期購入サービスを運営されている企業がいらっしゃいました。お客様は、このサービスを新規事業としてスモールスタートで始められたという経緯もあり、1台のサーバーにアプリケーションやDBなど、すべてを押し込んで稼働させていました。それから間もなく、お客様のビジネスコンセプトが社会情勢とマッチしたことから事業は急成長し、会員数は一気に200万名を超えました。
この会員増と歩調を合わせ、不定期で発生するようになったのが、システムのスローダウンやスパイクです。多くは開発・運用チームの解析によって原因を突き止めて改善できたものの、原因不明で対応できないものもありました。そこですべてを改善するため、先進ソリューションに取り組む部門のスタッフと一緒に検討して注目したのが、New Relicでした。
■カルチャーショックと同時に、「あの時にこれがあれば・・・」との思い
― 注目されたNew Relicのポイントについて教えてください。
性能トラブルが発生すると、最初に疑うのは、リソースの枯渇やI/Oのボトルネックです。そのため原因究明は、リソースの使用状況やアプリケーションログを相互に照らし合わせて原因を類推するという、エンジニアの職人技に頼っていました。ところがNew Relicは、APMまで掘り下げて原因究明に貢献します。この機能を知ったときは、本当にカルチャーショックを受けました。そこで、先ほど紹介したお客様のシステムに導入してみたところ、特定の人が重たい帳票を10多重でリクエストしていることがスローダウンの原因になっていたと突き止めることができたのです。
これをきっかけにNew Relicへの興味が高まり、数々の機能を知るにつれ、私は過去携わった案件で起こった出来事を思い出しました。大手BtoCサイトを運営されているお客様が、大規模セールを実施されたときのことです。週末に開始されたセールで、私も一人の消費者として楽しみにしていたのですが、初日にいきなりECサイトがスローダウンを起こしてサイトを終日クローズさせることになり、ニュースにも取り上げられる事態に陥ってしまったのです。
私は当時、DBスペシャリストとしてお客様のシステムに関わっていたことから、各領域のスペシャリストと協力し、休日返上で解析に取り組みました。結果としてDBに問題はなかったのですが、アプリケーションに原因があることにたどり着くまで、3日も要してしまいました。もし、あのときNew Relicがあれば、保存された全てのテレメトリーデータを元に、より早く根本原因を特定できたでしょう。想像の範囲内ですが、3時間もあれば原因究明できたかもしれない、と思いました。
■システム再構築の品質向上や業務効率化、さらにはDX推進にも貢献
― その実績や想いを踏まえて、どのような展開を考えられたのでしょうか。
New Relicの機能を知ることで、様々な局面での活用イメージが湧いてきました。まずは、性能トラブルが発生したときの対応です。New Relicの導入で原因究明をAPMまで掘り下げ、原因となっているソースコードの特定が可能なことや、ログへのアクセスも簡単に行えることから、原因を突き止めるまでの工数がかなり削減でき、早期の対策実施が可能になります。
また、ハードウェア更改やオンプレミスからクラウドへのリフト&シフト、アプリケーションの書き換えといったシステムの再構築時にも、数々のメリットがあると考えられます。リソース使用状況の現新比較がNew Relicによって簡単に可視化できるため、少ない工数でシステムの品質向上や運用・維持が実現でき、業務の効率化を図ることもできます。これにより、広義でIT人材不足の解消にも寄与できると感じています。
そしてもうひとつイメージしたのが、DXの推進です。現在、一般的な企業ITの予算比率は、ラン・ザ・ビジネスが75%を超えていて、DXに十分な予算が確保できているとは言えません。この状況下でNew Relicを導入すれば、現行システムの運用最適化に必要な予算や人員の負荷が低減でき、DX推進を加速することが可能になります。これにより、「2025年の崖」にも対応できる環境が構築できると考えています。
■システム全体を俯瞰し最適な提案ができる“クラウド・ソムリエ”でありたい
― 今後のオブザーバビリティに対する展望を教えていただけますか。
エンジニアとして長く歩み続け、様々なポジションで幅広い技術に触れてきました。この経験を活かして、システム全体を俯瞰した最適な提案をしたいという想いが、私の根本にあります。こうしたなかで現在、オンプレミスからクラウドへのリフト&シフトが加速していることから、この領域で最適なサービスを選定してお客様に提案できる“クラウド・ソムリエ”という新しいエンジニア像を確立し、推進したいと思っています。
この実現に向けてオブザーバビリティは、絶対に外すことができないものです。具体的な取り組みとしては、私がマネージドサービスのデリバリを担当していることから、当社サービスに部品としてNew Relicを導入していこうと考えています。外形監視から取り組みたいというお客様が多くいらっしゃいますので、ここをファーストアプローチに利用範囲を広げていくことを検討しており、ログ収集などの煩わしい業務からの解放提案は、アドバンスドサポートの位置付けで有効に機能すると考えています。さらには、NTTデータのサービスにも導入を提案し、SIerとして提供するIT品質や効率の向上に寄与することも視野にあります。また、SREにおいてもオブザーバビリティの重要性に対する理解が進んでいる手応えがあるため、NTTデータ・グループの強みを活かして、幅広い分野への導入を促進していきたいと考えています。
こうした取り組みを推進していくため、New Relicにはコアウェブバイタル(Core Web Vitals)やSEO関連、さらにはビジネスにコミットした機能の強化を期待しています。
■お客様に価値ある未来をオブザーバビリティの視点から創造
― 最後に、読んでいただいた方へのメッセージをお願いします。
当社では2023年9月にブランドスローガンとして『人と技術で、まだ見ぬ未来へ』を制定しました。ますます高度化、複雑化する情報社会で、どこにゴールを設定し、どのように進んでいけばよいのか、とても重要な課題になっています。こうした社会状況を見据えて、その道標になれるよう、私はオブザーバビリティをひとつの切り口として、まだ見ぬ未来を創り出し、新しい価値を生み出して、お客様のビジネスが成功する力になれるよう努めていきます。