Azure SRE Agent は運用作業を自動化し、作業の手間を軽減するため、開発者とオペレーターは価値の高いタスクに集中できます。
一般的な運用タスクには、多くの場合、オンプレミスおよび SaaS システムと共に複数の Azure リソースを管理することが含まれます。 多くの場合、これらのタスクは繰り返し行われるか、複数のツールを調整して必要な分析情報を提供する必要があります。 SRE Agent を使用すると、監視ツール、インシデント プラットフォーム、ソース コード リポジトリを接続し、ワークフローをエンドツーエンドで自動化するための AI 駆動型プラットフォームが提供されます。
その違い: SRE Agent は、環境に関する専門知識を継続的に構築します。 すべての調査を記憶し、チームのパターンを学習し、誰も質問していない場合でもバックグラウンド分析を実行します。 エージェントは、すべての操作によりスマートになります。
SRE エージェントとは
SRE エージェントは、サイトの信頼性エンジニアリング プラクティスに自動化とインテリジェンスをもたらすサービスです。 手動作業の削減、システムのアップタイムの向上、一貫した運用成果の実現に役立ちます。 エージェントは、Azure サービスと外部システムの両方と統合されると、人間の介入を最小限に抑えて運用タスクを実行します。
Azure サービス管理機能
SRE エージェントは、Azure CLI と REST API を使用して、すべての Azure サービスを管理できます。 この機能には、次の包括的なサポートが含まれています。
コンピューティング サービス: 仮想マシン、App Service、Container Apps、Azure Kubernetes Service (AKS)、Azure Functions など
ストレージ サービス: BLOB ストレージ、ファイル共有、マネージド ディスク、ストレージ アカウント
ネットワーク サービス: 仮想ネットワーク、ロード バランサー、アプリケーション ゲートウェイ、およびネットワーク セキュリティ グループ
データベース サービス: Azure SQL Database、Cosmos DB、PostgreSQL、MySQL、Redis
監視と管理: Azure Monitor、Log Analytics、Application Insights、Resource Manager
カスタム Runbook と サブエージェントを使用して、SRE エージェントを使用して Azure CLI を使用して実行する操作を自動化できます。
主なユース ケース
インシデントの自動化: インシデント管理プラットフォームに接続して、トリアージ、軽減、解決を自動化します。 この接続により、平均復旧時間 (MTTR) が短縮され、サービスの可用性が向上します。
スケジュールされたワークフローを自動化する: 事前アラートとアクションを設定して、定義されたスケジュールに従って実行される定期的な繰り返しのタスクを自動化します。
SRE エージェントの動作を確認するには、次のビデオをご覧ください。
SRE エージェントのしくみ
SRE エージェントは、微調整された Azure の専門知識と完全なカスタマイズ機能を組み合わせています。 SRE エージェントは、特定のサービスの Azure リソースをすぐに理解し、管理します。 一般的な運用タスクにインテリジェントな既定値が提供されます。 同時に、ドメイン固有の知識、カスタム Runbook、オブザーバビリティおよび監視プラットフォームなどのツールやデータソースとの統合を柔軟に組み込むことが可能です。
エージェントは、次のような複数の自動化メカニズムを介して動作します。
組み込みの Azure ナレッジ: 最適化された運用パターンを使用した Azure サービスの事前構成済み理解
カスタムランブック: Azure CLI コマンドや任意の Azure サービスに対する REST API 呼び出しを実行する
サブエージェントの拡張性: VM、データベース、ネットワーク コンポーネントなどの特定のサービスに特化したエージェントを構築する
外部統合: 監視、インシデント管理、ソース管理システムへの接続
この拡張性により、SRE エージェントは、Azure インフラストラクチャ全体の環境と運用要件に適応できます。
決して離れない知識
調査のたびに、エージェントに新しい内容が教えられます。 これは、根本原因、解決手順、チームの好み、運用パターンをキャプチャします。これにより、会話間で持続し、離れることのない制度的な知識が構築されます。 新しいチームメンバーはより迅速に業務に慣れ、ページングされるメンバーに関わらずオンコールの品質が一貫して保たれ、チーム全体の専門知識が自動的に向上します。
例: 新しいエンジニアがオンコールに加わるとき、エージェントとして、デプロイパターン、過去のインシデント、チームの手順をすでに把握しており、初日から一貫した品質を維持することができます。
Integrations
Azure SRE Agent は、次の方法で運用エコシステムと統合されます。
監視と可観測性:
- Azure Monitor (メトリック、ログ、アラート、ワークブック)
- Application Insights
- Log Analytics
- Grafana
インシデント管理:
- Azure Monitor アラート
- ページャーデューティ
- ServiceNow
ソース管理と CI/CD:
- GitHub (リポジトリ、問題)
- Azure DevOps (リポジトリ、作業項目)
データ ソース:
- Azure Data Explorer (Kusto) クラスター
- モデル コンテキスト プロトコル (MCP) サーバー
概要
タスクのスケジュール設定、インシデントの処理、またはカスタム エージェントの構築によって、Azure SRE エージェントの使用を開始します。
定義したスケジュールに従って実行するスケジュールされたタスクを作成します。
[ スケジュール タスク ] タブを選択します。
タスクの詳細を入力します。
タスクを実行するスケジュールを定義します。
タスクのカスタム エージェント命令を作成します。
[ スケジュールされたタスクの作成] を選択します。
エージェントがチームと共に成長する
SRE エージェントは、環境、チームのパターン、運用履歴を学習する際に、時間の経過と同時に進歩的な価値を提供します。
| マイルストーン | 何が起きるか |
|---|---|
| 1 日目 | ツールを接続し、最初のインシデントをトリアージし、組み込みの Azure ナレッジからすぐに診断値を取得します。 |
| 第 1 週 | エージェントは、環境トポロジ、一般的な障害パターン、チームのエスカレーション設定を学習します。 調査はより速く、より正確になります。 |
| 月 1 | 制度的知識は蓄積する。 エージェントは、リスクを事前に特定し、予防措置を提案し、最初のオンコール シフトから新しいチーム メンバーを立ち上げます。 |
Considerations
Azure SRE エージェントを使用するときは、次の考慮事項に注意してください。
- チャット インターフェイスでサポートされている唯一の言語は英語です。
- Azure SRE エージェントがデータを管理する方法の詳細については、 Microsoft のプライバシー ポリシーを参照してください。
- 可用性は、リージョンとテナントの構成によって異なります。
エージェントを作成すると、次のリソースも自動的に作成されます。
- Azure Application Insights
- Log Analytics ワークスペース
- マネージド ID
次のステップ
最初のエージェントを作成して設定します。
| 資源 | 説明 |
|---|---|
| 作業開始 | エージェントを作成し、Azure リソースに接続します。 |
| メモリと知識 | エージェントが過去の調査を記憶し、制度上の知識を構築する方法について説明します。 |