利用用途
民放公式テレビ配信サービス「TVer(ティーバー)」における、ユーザー体験の観測を通じた問題検知・解決の迅速化と、オンデマンド/リアルタイムでの動画コンテンツ配信の高品質化にNew Relicを活用
New Relicの選定理由と成果
- フロントエンドからバックエンド、インフラまでを一貫できるオブザーバビリティ環境の整備
- ユーザー体験に影響を及ぼすシステムの不具合と原因をいち早く検知・特定して解決
- 予測の難しいスパイクアクセスに適切に対処するために観測データを活用
- TVerのサービス品質向上に継続的に取り組むためにSLI/SLOの運用を目指す
- アプリケーションが使用するライブラリの脆弱性管理を強化
利用機能
- New Relic APM
- New Relic Alert
- New Relic Mobile(Video Monitoring)
- New Relic Browser(Video Monitoring)
- New Relic Dashboard
- New Relic Errors Inbox
- New Relic Infrastructure
- New Relic Logs
- New Relic Synthetics
- New Relic AWS Integration
- New Relic Vulnerability Management
2023年3月、TVerの月間動画再生数が遂に3億を突破した。TV番組の見逃し配信、リアルタイム配信、アーカイブ番組の配信など、多彩なTVコンテンツを提供するプラットフォーマーとして成長を加速させてきた株式会社TVerにとって、サービス開始から8年目の快挙となった。月間ユニークブラウザ数は2,739万を記録。4月にはスマートフォン/タブレットとコネクテッドTVを合わせたアプリのダウンロード数が6,000万を突破した。サービス事業本部 プロダクトタスク SRE リードエンジニアの加我貴志氏は次のように話す。
「TVerは、民放公式テレビ配信サービスならではの高品質なコンテンツを無料で楽しめるサービスとして、ユーザーの時間と場所を選ばない新しい視聴スタイルを提案しています。2022年4月には民放5系列揃って地上波との同時配信を開始するとともに、TVer IDによるマルチデバイスでのレジューム(視聴中の番組を続きから見る)やお気に入りの連携を可能にするなど、ユーザーの利便性を向上させました。その効果はすぐにあらわれ、動画再生数、ユニークブラウザ数、アプリダウンロード数を大きく押し上げました」
TVerでは、サービスリニューアルに先立って大きな決断をした。「バックエンドシステムの全面刷新と内製化」である。
「TVerが急成長する過程で顕在化してきた課題を一掃し、新しいビジネスチャレンジを支えるスピード感と柔軟性を備えたバックエンドシステムへの刷新です。コンテナベースのモダンなアーキテクチャーを採用すると同時に、フロントエンドからバックエンド、インフラまでを一貫するオブザーバビリティ環境を整えました」(加我氏)
TVerが導入したオブザーバビリティプラットフォームはNew Relicである。ユーザー体験の観測、動画プレイヤーへの対応、脆弱性管理などの先進機能は、国内屈指の動画配信プラットフォーマーであるTVerの要求に応えられる唯一のものだった。サービス事業本部 プロダクトタスクの丸山隆宏氏は次のように話す。
「動画を視聴するユーザーの体験を可視化できることが、New Relicの採用を決めた大きなポイントでした。細かな設定や作り込みをすることなく、New Relic Video Agentを適用するだけで観測できる範囲や粒度は私たちが期待した以上です」
動画配信プラットフォーマーに最適なオブザーバビリティ
最新化されたTVerのバックエンドシステムは、AWS Fargateによるコンテナ/サーバーレス環境と、Amazon DynamoDB、Amazon Aurora、Amazon ElastiCache、Amazon S3などのデータストア群により構成される。柔軟かつ迅速にリソースをスケーリングできるよう考慮された設計だ。
「システムを内製化することは、その安定稼働とサービスの信頼性の全責任を私たちが担うことを意味します。ユーザー体験に影響のあるトラブルが発生したとき、いち早くそれを検知し、原因と影響範囲を特定して解決できなければなりません。そのためにはフロントエンド、バックエンド、インフラのすべてを観測できる環境が必須であり、動画配信サービスを提供するTVerに最適なオブザーバビリティ製品としてNew Relicを選定しました」(加我氏)
New Relicは業界を代表するオブザーバビリティプラットフォームであり、国内では39%のトップシェアを獲得している。デジタルサービスにおけるあらゆる重要指標の「観測」を可能にし、アプリケーション、インフラ、ユーザー体験の観測を通して、障害やサービスレベルの低下、潜在的な問題・ボトルネックを可視化する。TVerにおいては、リソースの最適化とトラブルシューティングの迅速化にすぐに威力を発揮した。
「TVerでは、直前までのアクセスの10-20倍といったスパイクが発生することも珍しくありません。ゴールデンタイムの21時から始まる話題の新番組、スポーツ中継の延長放送、人気タレントが揃って出演する特番、といったリアルタイム配信でこの傾向が顕著に現れます。また見逃し配信では、放送された番組がSNSの影響で人気に火が点き、1話で582万再生に達したケースもあります」と話すのは、バックエンドシステムの開発・運用を担当するサービス事業本部 プロダクトタスク リードエンジニアの内海恵介氏である。
いかにピークを予測して事前にリソースを準備し、ピーク時でも安定的な動画配信を維持し、ピークを越えたタイミングでリソースを返却してコストを抑えるか、というのが運用上のポイントになる。
「最新化されたバックエンドシステムでは、テストを通じて限界性能・安全性能を正確に把握したうえで、コンテンツ編成チームと入念に情報共有を行うことで、理想に近いスケーリングが可能になりました。ここにNew Relicを活用してリクエスト数とリソース量の割り当ての妥当性を評価するなど、着実にスケーリングの精度を向上させています」(内海氏)
New Relic APM(Application Performance Monitoring)は、バックエンドのAPIサーバーへのリクエスト数、エラー率、レイテンシなどの情報を示し、サービスの安定性や性能の維持に役立てられる。New Relic Infrastructureによるリソース監視・分析機能と組み合わせることで、内海氏らがスパイクアクセスという難題に立ち向かうための強力な武器となった。
ユーザー体験を把握しトラブルシューティングを迅速化
加我氏は、SREとして活動する中で「TVerから見たサービスの健全性と、実際にユーザーが体験しているサービスの快適さに差があってはならない」と考えていた。
「だからこそ、New Relicによるユーザー体験の観測と可視化には大きな期待がありました。現在は、Webブラウザー、iOS/Androidのスマホアプリ、コネクテッドTVなど、多様なフロントエンドすべてにNew Relicを導入し懸案の解決に向けて取り組んでいます。効果の一例ですが、モバイルアプリのクラッシュが、どのバージョンで、どのような条件下で、どれだけの頻度で発生しているのかを把握できるようになったことで、トラブルシューティングが大幅に迅速化されました」と加我氏は話す。
New Relic Mobile、New Relic Browserでは、クライアント端末の情報(OS、デバイス、ネットワークなど)、画面遷移などのユーザー行動、ページのロード時間などが把握できる。New Relic APMと組み合わせることで、フロントエンドとバックエンドの処理時間の差異を可視化・比較することも可能だ。
「モバイルアプリ開発を委託しているパートナーとの連携にも、New Relicが示すメトリクスやスタックトレースが役立ちます。バックエンドのAPIサーバーの設計方針と、モバイルアプリの実装にズレがあるような状況も即座に把握でき、迅速なアプリ改修に役立てられます」(内海氏)
関係者全員に有益な情報を示すダッシュボードを開発
加我氏は、New Relicから得られる様々な観測データを全社で活用するために、独自にダッシュボードを開発し改善を続けている。
「TVerのサービス状況を俯瞰的に把握するためのサマリページを用意し、SREをはじめ、フロントエンド、バックエンド、インフラを担当する各エンジニア、外部パートナーと連携するディレクターが参照できるようにしています。連続ドラマの今週と前週の再生数の比較や、特番によるリクエスト数の増加傾向などをコンテンツ編成チームと共有することで、社内の共通認識も高まっていると感じています」(加我氏)
加我氏は、New Relicの機能単位で取得した観測データを目的ごとに整理・統合し、責任範囲の異なるエンジニアそれぞれが使いやすいようダッシュボードを工夫した。各エンジニアは、タブを遷移するような操作で複数の切り口から自分が欲しい情報を深掘りできる。
「APMエージェントを利用してライブラリの脆弱性を管理するNew Relic Vulnerability Managementをいち早く導入しました。手間のかかる脆弱性管理を容易にし、自社開発アプリケーションのセキュリティリスクを低減することができます。脆弱性情報もNew Relicのサマリダッシュボードに統合し、関係者で共有していきたいと思っています」と丸山氏は話す。
TVerでは、New Relic Vulnerability Managementの導入に際してData Plusオプションを採用し、観測データの保存期間を90日に延長した。
「New Relicの観測データに対する中長期でのトレンド分析に、効果的に活用できるものと期待しています。今後は、監視対象に制約のないNew Relicのユーザーライセンスのメリットを活かして、導入範囲を拡大していきます。フロントエンドのオブザーバビリティの更なる強化を図り、ユーザー体験をしっかりと把握しながら、プロアクティブな指向で運用を高度化していく考えです」(加我氏)
「New Relicはユーザー数とデータ量で課金が決まるため、スパイクアクセスに対応した一時的な監視対象の追加コストが不要だったり、新しい試みに対するログ量増加があってもホスト側でデータの取捨選択が可能なため、事業状況に合わせたコスト調整がしやすいので安心です」と丸山氏が続けた。
TVerではSLI/SLOの制定を進めるため、New Relic Service Level Managementによる実装に向けたユーザージャーニーの整理を行なっているという段階だ。加我氏は次のように結んだ。
「TVerが配信する動画コンテンツをユーザーが快適に視聴できているかを正確に把握し、できていない場合にその原因をNew Relicの観測データから即座に判断できるようにすること。さらに、ユーザー体験を定量的に把握しながら、継続的にサービス品質を向上させていくことが目標です。New Relicの技術チームには、導入段階からきめ細やかなサポートを提供してもらえました。TVerの快適さと高品質の追求に向けて、これからも適切なアドバイスを期待しています」