Fabric Spark のベスト プラクティスの概要

この一連の記事では、Microsoft Fabric で Spark Notebook と Spark ジョブ定義 (SSD) を実行するときの Spark ジョブのパフォーマンス、セキュリティ、コストを最適化するためのベスト プラクティスについて説明します。 Fabric の基本的なデータ エンジニアリングの概念を理解している必要があります。 Fabric を初めて使用する場合は、 Fabric データ エンジニアリングのドキュメントを参照してください。

このシリーズの記事

ヒント

Spark を初めて使用する場合は、Spark の 基本 に関する記事から始めます。

頭字語

Fabric Spark のベスト プラクティスに関する記事全体で使用される一般的な頭字語の一覧を次に示します。

アクロニム 意味
AKV Azure Key Vault
AQE アダプティブ クエリの実行
CDC 変更データ キャプチャ
CU 容量ユニット
DAG 有向非循環グラフ
HC 高並行性
JVM Java 仮想マシン
MLV レンダリングされたレイク ビュー
MPE マネージド プライベート エンドポイント
NEE ネイティブ実行エンジン
OOM メモリ不足
損益 Private Link
ORC 最適化された行の縦棒
RDD 回復性のある分散データセット
SJDs Spark ジョブ定義
SPN サービス プリンシパル名
SRE サイト信頼性エンジニア
ユニバーサルディスクフォーマット (UDF) ユーザー定義関数
UI ユーザーインターフェース
VM 仮想マシン
VNet Virtual Network
WS OAP ワークスペースのアウトバウンド通信保護