Microsoft Sentinel データレイクでノートブックを実行する

Jupyter ノートブックは、Microsoft Sentinel データレイクとフェデレーションテーブル内のデータを探索、分析、視覚化するための対話型環境を提供します。ノートブックを使用すると、コードの記述と実行、ワークフローの文書化、結果の表示を 1 か所で行うことができます。これにより、データ探索の実行、高度な分析ソリューションの構築、他のユーザーとの分析情報の共有が簡単になります。 Visual Studio Code 内で Python と Apache Spark を利用することで、ノートブックは生のセキュリティデータを実用的なインテリジェンスに変換するのに役立ちます。

この記事では、Visual Studio Code で Jupyter ノートブックを使用してデータレイクデータを探索して操作する方法について説明します。

前提条件

Microsoft Sentinel データレイクへのオンボード

Microsoft Sentinel データレイクでノートブックを使用するには、まずデータレイクにオンボードする必要があります。 Sentinel データレイクにオンボードしていない場合は、「Microsoft Sentinel Data Lake へのオンボード」を参照してください。データレイクに最近オンボードした場合は、ノートブックを使用して意味のある分析を作成できるようになるまで、十分な量のデータが取り込まれるまで時間がかかる場合があります。

アクセス許可

Microsoft Entra IDロールは、データレイク内のすべてのワークスペースに広範なアクセスを提供します。または、AZURE RBAC ロールを使用して個々のワークスペースへのアクセスを許可することもできます。 Azure RBAC アクセス許可を持つユーザーは、Microsoft Sentinelワークスペースに対して Data Lake レベルのワークスペースに対してノートブックを実行できます。詳細については、「Microsoft Sentinelのロールとアクセス許可」を参照してください。

必要に応じて、Microsoft Sentinelスコープまたは行レベルの RBAC を構成して、ワークスペース内のデータアクセスをさらに制限できます。有効にすると、行レベルのスコープによって、ユーザーの割り当てられたスコープに基づいてクエリによって返されるデータが制限されます。行レベルのスコープが構成されていない場合、既存のワークスペースレベルのアクセス許可モデルは変更されません。詳細については、「Microsoft Sentinelスコープの構成 (行レベルの RBAC) (プレビュー)」を参照してください。

分析レベルで新しいカスタムテーブルを作成するには、Data Lake マネージド ID に Log Analytics ワークスペースの Log Analytics 共同作成者 ロールを割り当てる必要があります。

ロールを割り当てるには、次の手順に従います。

Azure portalで、ロールを割り当てる Log Analytics ワークスペースに移動します。
左側のナビゲーションウィンドウで [ アクセス制御 (IAM)] を選択します。
[ ロールの割り当ての追加] を選択します。
[ロール] テーブルで [Log Analytics 共同作成者] を選択し、[次へ] を選択します。
[ マネージド ID] を選択し、[ メンバーの選択] を選択します。
Data Lake マネージド ID は、 msg-resources-<guid> という名前のシステム割り当てマネージド ID です。マネージド ID を選択し、[選択] を選択します。
[ 確認と割り当て] を選択します。

マネージド ID へのロールの割り当ての詳細については、「Azure portalを使用してAzureロールを割り当てる」を参照してください。

Visual Studio Code と Microsoft Sentinel 拡張機能をインストールする

Visual Studio Code をお持ちでない場合は、Visual Studio Code for Mac、Linux、または Windows をダウンロードしてインストールします。

Visual Studio Code (VS Code) のMicrosoft Sentinel拡張機能は、拡張機能マーケットプレースからインストールされます。拡張機能をインストールするには、次の手順に従います。

左側のツールバーで [拡張機能マーケットプレース] を選択します。
Sentinelを検索します。
Microsoft Sentinel拡張機能を選択し、[インストール] を選択します。
拡張機能がインストールされると、Microsoft Sentinelが左側のツールバーに表示されます。

Visual Studio Code のGitHub Copilot拡張機能をインストールして、ノートブックでコードの補完と提案を有効にします。

Extensions Marketplace でGitHub Copilotを検索してインストールします。
インストール後、GitHub アカウントを使用してGitHub Copilotにサインインします。

データレイク層テーブルを調べる

Microsoft Sentinel拡張機能をインストールしたら、データレイク層テーブルの探索と、データを分析するための Jupyter ノートブックの作成を開始できます。

左側のツールバーのを選択します。
ダイアログが表示され、次のテキストが表示されます。拡張機能 "Microsoft Sentinel" は Microsoft を使用してサインインする必要があります。 [ 許可] を選択します。
アカウント名を選択してサインインを完了します。

ログインに複数のゲストアカウントが関連付けられている場合は、アカウントをシームレスに切り替えることができます。アカウントを切り替えるには、Visual Studio Code ウィンドウの左下にあるアカウント名を選択します。一度に選択できるアカウントは 1 つだけです。

重要

アカウント間を切り替えると、アクティブな pyspark セッションが切断されます。

データレイクテーブルとジョブを表示する

サインインすると、Sentinel拡張機能の左側のウィンドウに Lake テーブルとジョブの一覧が表示されます。テーブルは、データベースとカテゴリによってグループ化されます。フェデレーションテーブルは、[システム テーブル] の [フェデレーションテーブル] カテゴリに表示されます。テーブルを選択すると、列の定義が表示されます。

ジョブの詳細については、「ジョブとスケジュール」を参照してください。フェデレーションテーブルの詳細については、「Microsoft Sentinel データレイクでのフェデレーションテーブルの使用」を参照してください。

新しいノートブックを作成する

新しいノートブックを作成するには、次のいずれかの方法を使用します。
検索ボックスに「>」と入力するか、Ctrl + Shift + P キーを押して、「新規作成Jupyter Notebook」と入力します。
[ファイル] > [新しいファイル] を選択し、ドロップダウンから [Jupyter Notebook] を選択します。

新しいノートブックで、次のコードを最初のセルに貼り付けます。

from sentinel_lake.providers import MicrosoftSentinelProvider
data_provider = MicrosoftSentinelProvider(spark)

table_name = "EntraGroups"  
df = data_provider.read_table(table_name)  
df_filtered = df.select("displayName", "groupTypes", "mail", "mailNickname", "description", "tenantId").show(100,   truncate=False)  

# Transform the dataframe
df_transformed = df.filter(df.mail.isNotNull()).select("displayName", "groupTypes", "mail", "mailNickname", "description", "tenantId")

write_options = {
     'mode': 'overwrite'
 }
# Save to a new table
data_provider.save_as_table(df_transformed, "EntraGroups_Processed_SPRK", write_options=write_options)

エディターは、 MicrosoftSentinelProvider クラスとデータレイク内のテーブル名の両方に対して intellisense コード補完を提供します。

[三角形の実行 ] を選択して、ノートブックでコードを実行します。結果は、コードセルの下の出力ウィンドウに表示されます。
ランタイムプールの一覧については、一覧から [Microsoft Sentinel] を選択します。
[中] を選択して、中規模のランタイムプールでノートブックを実行します。さまざまなランタイムの詳細については、「適切なMicrosoft Sentinel ランタイムの選択」を参照してください。

注:

カーネルを選択すると、Spark セッションが開始され、ノートブックでコードが実行されます。プールを選択した後、セッションが開始されるまでに 3 ~ 5 分かかることがあります。セッションが既にアクティブになっているので、後続の実行は高速になります。

セッションが開始されると、ノートブック内のコードが実行され、結果がコードセルの下の出力ウィンドウに表示されます。たとえば、

Microsoft Sentinel データレイクと対話する方法を示すサンプルノートブックについては、「Microsoft Sentinel Data Lake のサンプルノートブック」を参照してください。

ステータスバー

ノートブックの下部にあるステータスバーには、ノートブックと Spark セッションの現在の状態に関する情報が表示されます。ステータスバーには、次の情報が含まれます。

選択した Spark プールの仮想コア使用率。割合にカーソルを合わせると、使用されている仮想コアの数と、プールで使用可能な仮想コアの合計数が表示されます。パーセンテージは、ログインしたアカウントの対話型ワークロードとジョブワークロード全体の現在の使用状況を表します。
Spark セッションの接続状態 ( Connecting、 Connected、 Not Connectedなど)。

セッションタイムアウトを設定する

対話型ノートブックのセッションタイムアウトとタイムアウト警告を設定できます。これらの設定は拡張機能の設定に保持されるため、セッション間で保持されます。

タイムアウトを変更するには、ノートブックの下部にあるステータスバーで接続状態を選択します。次のオプションから選択します。

セッションタイムアウト期間の設定: セッションがタイムアウトするまでの時間を分単位で設定します。既定値は 30 分です。
セッションタイムアウト期間のリセット: セッションタイムアウトを既定値の 30 分にリセットします。
セッションタイムアウト警告期間の設定: セッションがタイムアウトしようとしているという警告が表示されるタイムアウトまでの時間を分単位で設定します。既定値は 5 分です。
セッションタイムアウト警告期間をリセットする: セッションタイムアウト警告を既定値の 5 分にリセットします。

ノートブックでGitHub Copilotを使用する

ノートブックでコードを記述するには、GitHub Copilotを使用します。 GitHub Copilotは、コードのコンテキストに基づいてコードの提案とオートコンプリートを提供します。 GitHub Copilotを使用するには、GitHub Copilot拡張機能が Visual Studio Code にインストールされていることを確認します。

data lake 用のサンプルノートブックからコード Microsoft Sentinelをコピーし、ノートブックフォルダーに保存して、GitHub Copilotのコンテキストを提供します。 GitHub Copilotは、ノートブックのコンテキストに基づいてコード補完を提案できるようになります。

次の例は、コードレビューの生成GitHub Copilot示しています。

Microsoft Sentinel Provider クラス

Microsoft Sentinel データレイクに接続するには、SentinelLakeProvider クラスを使用します。このクラスは、 access_module.data_loader モジュールの一部であり、データレイクと対話するためのメソッドを提供します。このクラスを使用するには、それをインポートし、 spark セッションを使用してクラスのインスタンスを作成します。

from sentinel_lake.providers import MicrosoftSentinelProvider
data_provider = MicrosoftSentinelProvider(spark)

使用可能なメソッドの詳細については、「Microsoft Sentinel プロバイダークラスリファレンス」を参照してください。

適切なランタイムプールを選択する

Microsoft Sentinel拡張機能で Jupyter ノートブックを実行するには、3 つのランタイムプールを使用できます。各プールは、さまざまなワークロードとパフォーマンス要件に合わせて設計されています。ランタイムプールの選択は、Spark ジョブのパフォーマンス、コスト、実行時間に影響します。

ランタイムプール	推奨されるユースケース	特性
Small	開発、テスト、軽量の探索的分析。単純な変換を備えた小規模なワークロード。コスト効率が優先されます。	小規模ワークロードに適しています単純な変換。コストを削減し、実行時間を長くします。
Medium	結合、集計、ML モデルトレーニングを含む ETL ジョブ。複雑な変換を使用してワークロードをモデレートします。	Small よりもパフォーマンスが向上しました。並列処理と中程度のメモリ集中型操作を処理します。
Large	ディープラーニングと ML ワークロード。広範なデータシャッフル、大規模な結合、またはリアルタイム処理。重要な実行時間。	高いメモリとコンピューティング能力。最小遅延。大規模、複雑、または時間に依存するワークロードに最適です。

注:

最初にアクセスすると、カーネルオプションの読み込みに約 30 秒かかることがあります。
ランタイムプールを選択した後、セッションが開始されるまでに 3 ~ 5 分かかることがあります。

メッセージ、ログ、エラーを表示する

メッセージログとエラーメッセージは、Visual Studio Code の 3 つの領域に表示されます。

[出力] ウィンドウ。
1. [出力] ウィンドウで、ドロップダウンから [Microsoft Sentinel] を選択します。
2. [ デバッグ] を選択して、詳細なログエントリを含めます。
ノートブックのインラインメッセージは、コードセルの実行に関するフィードバックと情報を提供します。これらのメッセージには、前のセルのコードに関連する実行状態の更新、進行状況インジケーター、エラー通知が含まれます
Visual Studio Code の右下隅にある通知ポップアップは、トーストメッセージとしても知られ、ノートブックと Spark セッション内の操作の状態に関するリアルタイムのアラートと更新を提供します。これらの通知には、メッセージ、警告、およびエラーアラート (Spark セッションへの正常な接続、タイムアウト警告など) が含まれます。

ジョブとスケジュール

Visual Studio Code のMicrosoft Sentinel拡張機能を使用して、ジョブを特定の時間または間隔で実行するようにスケジュールできます。ジョブを使用すると、データ処理タスクを自動化して、Microsoft Sentinel データレイク内のデータを集計、変換、または分析できます。ジョブは、データを処理し、データレイク層または分析層のカスタムテーブルに結果を書き込むにも使用されます。ジョブの作成と管理の詳細については、「 Jupyter ノートブックジョブの作成と管理」を参照してください。

VS Code Notebook のサービスパラメーターと制限

次のセクションでは、VS Code Notebooks を使用する場合のMicrosoft Sentinelデータレイクのサービスパラメーターと制限の一覧を示します。

カテゴリ	パラメーター/制限
分析レベルのカスタムテーブル	分析レベルのカスタムテーブルをノートブックから削除することはできません。Log Analytics を使用してこれらのテーブルを削除します。詳細については、「Azure Monitor ログのテーブルと列を追加または削除する」を参照してください。
ゲートウェイ Web ソケットのタイムアウト	2 時間
対話型クエリのタイムアウト	2 時間
対話型セッションの非アクティブタイムアウト	20 分
言語	Python
グラフクエリのタイムアウト	7.5 分
ノートブックジョブのタイムアウト	8 時間
同時実行ノートブックジョブの最大数	3、後続のジョブはキューに入れられます
対話型クエリでの同時ユーザーの最大数	8-10 大きなプール
セッションの起動時間	Spark コンピューティングセッションの開始には約 5 ~ 6 分かかります。 VS Code Notebook の下部にあるセッションの状態を表示できます。
サポートされているライブラリ	Azure Synapse ライブラリ 3.4 と抽象関数のMicrosoft Sentinel プロバイダーライブラリのみが、データレイクのクエリでサポートされます。 Pip のインストールまたはカスタムライブラリはサポートされていません。
レコードを表示するための VS Code UX 制限	100,000 行

トラブルシューティング

ノートブックを操作するときの一般的なエラーと解決策については、「Microsoft Sentinel データレイクのノートブックのトラブルシューティング」を参照してください。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-05-01

Microsoft Sentinel データ レイクでノートブックを実行する

前提条件

Microsoft Sentinel データ レイクへのオンボード

アクセス許可

Visual Studio Code と Microsoft Sentinel 拡張機能をインストールする

データ レイク層テーブルを調べる

Microsoft Sentinel拡張機能にサインインする

データ レイク テーブルとジョブを表示する