エージェントはスクリプトに従うのではなく、問題を論理的に解決します。 コードベース、過去のインシデント、インフラストラクチャに関するディープ コンテキストが構築されるため、一般的なシステムではなく、 システム に関する理由になります。 証拠を収集し、適切なツールを選択し、リスクによってアクションを分類し、その考え方を説明します。これらはすべてチャット インターフェイスに表示されます。
推論ループ
送信するすべてのメッセージは、同じループを通過します。
エージェントは最初 に要求を理解 し、必要なデータを識別します。 次に、データ ソース (ログ、メトリック、リソースの状態、デプロイ履歴、メモリ) に対してクエリを実行してコンテキストを収集します。 次に、収集されたデータをもとに推論を行い、パターンを特定し、結論を形成します。 最後に、安全なアクションの実行、危険なアクションの承認の要求、または調査結果の提示によって 、動作または応答 します。
問題にさらに多くの作業が必要な場合、ループはターンごとに最大 10 回繰り返されます。 その後、エージェントは続行するかどうかを確認します。
適応型思考
複雑な問題の場合、エージェントはチャットでその推論プロセスを表示します。 折りたたみ可能な [考える ] セクションが表示され、各ステップの説明タイトル ("Azure 正常性の問題の調査" や "アクティブなアラートの分析" など) と経過時間が表示されます。
エージェントは推論の深さを自動的に調整します。 状態チェックは、迅速な応答を取得します。 複数ステップの障害は、証拠の相関関係を活用して段階的に推論されます。
推論の深いコンテキスト
エージェントはゼロから始まるわけではありません。 推論ループの各段階でディープ コンテキストを利用します。 Deep Context には、エージェントの考え方を形成する 3 つの柱があります。
- コード分析: エージェントはリポジトリを既に読み取っているので、インシデントが発生すると、再試行ロジックが存在する場所と最近変更された内容が認識されます。
- 永続メモリ: 過去の調査、解決手順、およびアップロードしたRunbookが新しい会話に情報を提供します。
- バックグラウンド インテリジェンス: コードベース分析、Kusto スキーマ エンリッチメント、および分析情報の生成により、エージェントの理解が継続的に深まります。
メモリと知識
すべての会話の開始時に、エージェントは関連するコンテキストの メモリ を検索します。
| 何に基づいているのか | 推論を改善する方法 |
|---|---|
| セッションの分析情報 | インシデント調査、トラブルシューティング セッション、スケジュールされたタスクの結果など、過去のすべての会話から学習します |
| 同様の症状パターン | 繰り返されるパターンを認識し、迅速に考えられる原因にジャンプします。 |
| アップロードしたランブックとドキュメント | 一般的なアドバイスではなく、チームの手順に従います |
| ユーザー設定 | 環境コンテキストと応答の基本設定を記憶する |
Runbook、アーキテクチャ ドキュメント、チーム プロシージャなど、提供する知識が多いほど、エージェントの推論に関連性が高まります。 詳細については、「 メモリと知識」を参照してください。
ツールの選択
エージェントは、問題に基づいてツールを戦略的に選択します。 現在のカスタム エージェントに登録されているすべてのツールから始まり、接続されたインシデント プラットフォームのインシデント ツールのみを使用して、プラットフォームでフィルター処理します。 公開されたリストによってさらにフィルター処理し、利用可能なツールのみが含まれるようにし、会話中に新しい情報が登場すると、それに応じて調整します。
各カスタム エージェントには、独自のツール セットがあります。 エージェントが別のカスタム エージェントに委任されると、使用可能なツールが自動的に変更されます。
使用可能なツールの詳細については、「 ツール」を参照してください。
並列実行
エージェントは、互いの出力に依存しない独立した操作、アクションを識別すると、それらを一度に 1 つずつ実行するのではなく、1 ターンで同時に発行します。
たとえば、エージェントがポッドの状態、サービスの正常性、デプロイ履歴を確認する必要がある場合は、次のコマンドを開始する前に各コマンドが完了するのを待たずに、3 つのコマンドすべてを並列で実行します。 この方法により、推論ターンの数が減り、調査が高速化されます。
ツール レベルのプロンプトは、並列実行をガイドし、モデルに "コマンドが独立しており、並列で実行できる場合は、1 つのメッセージで複数のツール呼び出しを行う" ことを示します。
アクションの分類
エージェントは、実行する前にすべてのアクションを分類します。
| 分類 | 行動 | 例示 |
|---|---|---|
| 安全 | すぐに実行されます | ログのクエリ、リソースの状態の確認、デプロイの一覧表示 |
| 慎重 | 簡単な説明を使用して実行します | メールの送信、Teams メッセージの投稿 |
| 破壊的な | 確認が必要です | アプリの再起動、リソースのスケーリング、構成の変更 |
エージェントが各種類を処理する方法は 、実行モードによって異なります。
| 実行モード | Safe | 慎重 | 破壊的な |
|---|---|---|---|
| レビュー | 実行する | 実行する | 承認を求める |
| 自律 | 実行する | 実行する | 実行する |
会話管理
長い会話の生産性を維持するメカニズムがいくつかあります。
| メカニズム | 動作内容 |
|---|---|
| 圧縮 | 会話が長くなる場合、エージェントは主要な結果を保持しながら、以前のコンテキストを要約します。 このアクションは、 /compact コマンドを使用して手動でトリガーできます。 |
| 自動再試行 | 応答の途中でサービス中断が発生した場合、エージェントは透過的に再試行します。 |
| エラー処理 | モデルで一時的な問題が発生した場合、一般的な内部エラーではなく、わかりやすいメッセージ ("モデルは一時的に問題が発生しています") がエージェントに表示されます。 |
キャンセル
[停止] を選択すると、エージェントはすべての操作を直ちに停止し、取り消されたタスクの再試行を防ぎます。 取り消された要求を明示的に変更しない限り、次のメッセージは新たに開始されます。
Boundaries
次の表は、エージェントの推論が実行する内容と実行しない操作をまとめたものです。
| 推論とは何か | それが行わないこと |
|---|---|
| 複数のソースから証拠を並列に収集する | 根本原因を見つけることを保証する (証拠が不十分である可能性があります) |
| アクションを分類し、実行モードを尊重する | レビュー モードで確認なしで自動修復する |
| その思考を段階的に説明する | 個別のエージェント間で調査手法を共有する |
| 推論の深さを問題の複雑さに調整します | 重大な意思決定のための人間の判断を置き換える |