この一連の記事では、Microsoft Fabric で Spark Notebook と Spark ジョブ定義 (SSD) を実行するときの Spark ジョブのパフォーマンス、セキュリティ、コストを最適化するためのベスト プラクティスについて説明します。 Fabric の基本的なデータ エンジニアリングの概念を理解している必要があります。 Fabric を初めて使用する場合は、 Fabric データ エンジニアリングのドキュメントを参照してください。
このシリーズの記事
ヒント
Spark を初めて使用する場合は、Spark の 基本 に関する記事から始めます。
頭字語
Fabric Spark のベスト プラクティスに関する記事全体で使用される一般的な頭字語の一覧を次に示します。
| アクロニム | 意味 |
|---|---|
| AKV | Azure Key Vault |
| AQE | アダプティブ クエリの実行 |
| CDC | 変更データ キャプチャ |
| CU | 容量ユニット |
| DAG | 有向非循環グラフ |
| HC | 高並行性 |
| JVM | Java 仮想マシン |
| MLV | レンダリングされたレイク ビュー |
| MPE | マネージド プライベート エンドポイント |
| NEE | ネイティブ実行エンジン |
| OOM | メモリ不足 |
| 損益 | Private Link |
| ORC | 最適化された行の縦棒 |
| RDD | 回復性のある分散データセット |
| SJDs | Spark ジョブ定義 |
| SPN | サービス プリンシパル名 |
| SRE | サイト信頼性エンジニア |
| ユニバーサルディスクフォーマット (UDF) | ユーザー定義関数 |
| UI | ユーザーインターフェース |
| VM | 仮想マシン |
| VNet | Virtual Network |
| WS OAP | ワークスペースのアウトバウンド通信保護 |