次の方法で共有


Azure Databricks テーブル

Azure Databricksでは、さまざまなデータ管理ニーズを満たすために、複数のテーブルの種類とストレージ形式がサポートされています。 テーブルの種類、ストレージ形式、Unity カタログの統合の概要については、Azure Databricks テーブルの概念を参照してください。

テーブルの種類

さまざまなデータ管理シナリオのさまざまなテーブルの種類とその機能について説明します。

テーブルの種類 Description
Azure DatabricksのUnityカタログ管理テーブル(Delta LakeとApache Iceberg向け) Azure Databricksは、最適化されたパフォーマンスを必要とする新しいテーブルのメタデータとデータ ファイルを管理します。
一時テーブル 中間データ用のセッション スコープの Unity カタログ マネージド テーブル。 SQL ウェアハウスのみ。
外部テーブルの扱い 外部システムに格納されているデータ。 Unity カタログはメタデータのみを管理します。
外部テーブルの操作 Lakehouse フェデレーションを介して接続された外部システムのデータへの読み取り専用アクセス。

ストレージ形式

高度なデータ管理機能をサポートするオープン テーブル形式を操作します。

Format Description
Delta Lake マネージド テーブルと外部テーブルに対する ACID トランザクション、タイム トラベル、スキーマの適用を含む既定のストレージ形式。
Apache Iceberg 高度なメタデータ管理をサポートする Iceberg エコシステムと統合するためのオープン テーブル形式。

テーブル管理

テーブルの動作、構造、およびパフォーマンスを構成して最適化します。

特徴 Description
テーブル制約 null 制約ではなく CHECK 制約を使用して、データ品質規則を定義して適用します。
スキーマの適用 書き込み中Azure Databricksスキーマの変更とデータ型の適用を処理する方法を制御します。
テーブルのパーティション分割 パーティション キーでデータを整理して、クエリのパフォーマンスとデータ管理を向上させます。
テーブル サイズの監視 テーブル ストレージの使用状況と増加パターンを監視および分析します。
外部からマネージドへの変換 パフォーマンスと管理を向上させるために、外部テーブルをマネージド テーブルに移行します。
外部パーティションの検出 クラウド ストレージに格納されている外部テーブルのパーティションを自動的に検出して登録します。