クラウドサービスの開発がサービス指向アーキテクチャの普及により進んでいますが、オフラインテストの難しさや問題の発見の遅れなどの課題が存在します。現在のモニタリング設定は試行錯誤と専門知識に依存しており、問題発生後の対応が主流ですが、AIの活用によりモニタリングの効果を向上させることが可能です。
モニタリングデータの構造化の課題に対して、データ駆動型アプローチによるオントロジー開発が提案されています。このアプローチにより、モニタリングデータのカテゴリや目標を定義し、特定のサービスに対するモニタリングを推奨するディープラーニングフレームワークが開発されています。
モニタリングの効果を評価し改善するためのプロジェクトが進行中であり、ベイジアン統計と時系列モデリングを組み合わせた効果推定が可能です。これに基づいて、モニタリングの推奨モデルの改善が期待されています。
ニュース解説
クラウドサービスの開発と運用において、サービス指向アーキテクチャという現代的なアプローチが広く採用されています。このアプローチでは、ソフトウェアを小さく独立して機能するサービスの集合として構築します。これにより、特にクラウドベースのソフトウェア開発において、従来の一枚岩のアーキテクチャよりもスケーラビリティと柔軟性が向上します。しかし、この方法はオフラインでのテストが難しく、問題が使用中にのみ発見されることがあり、修理費用の増加やユーザーの不満につながる可能性があります。これは、ソフトウェアをリリースする前にできるだけバグがないように慎重にデプロイする必要があることを強調しています。
現在、クラウドサービスのモニタリング設定は試行錯誤とサービスマネージャーの専門知識に大きく依存しています。問題が発生した後にモニタリング設定を調整する反応的なアプローチは、効率性を損ない、重要なモニタリングチェックを見逃すことがよくあります。また、最適化されていないモニタリングシステムは異常な振る舞いを誤検出することがあり、ユーザー体験に悪影響を及ぼすことがあります。
このような背景の中、Microsoft ResearchはAIを活用したモニタリングの向上に向けた取り組みを進めています。データ駆動型アプローチにより、モニタリングデータの構造化とオントロジー(概念体系)の開発を提案しています。これにより、特定のサービスに対してどのようなモニタリングが必要かを推奨するディープラーニングフレームワークが開発されました。このフレームワークは、サービスの特性に基づいて特定のモニターを推奨することができ、モニタリングの効率性と効果を高めることが期待されます。
さらに、モニタリングの効果を評価し改善するための「モニタースコアカード」というプロジェクトが進行中です。これは、ベイジアン統計と時系列モデリングを組み合わせてモニターの効果を推定し、推奨モデルのトレーニングフェーズを強化し、より良い推奨を行うことを目指しています。
この取り組みは、クラウドサービスのモニタリングにおける課題に対処し、より効率的で効果的なモニタリングシステムの構築を目指しています。AIの活用により、モニタリングの設定がより簡単になり、問題の早期発見と対応が可能になることで、サービスの信頼性とユーザー体験が向上することが期待されます。しかし、AIによるモニタリングの導入には、適切なデータの収集と分析、プライバシーの保護、誤検出の最小化など、様々な課題も伴います。これらの課題に対処しながら、AIを活用したモニタリングの可能性を最大限に引き出すことが、今後のクラウドサービスの開発と運用において重要な課題となるでしょう。
from Intelligent monitoring: Towards AI-assisted monitoring for cloud services.