次の方法で共有


クエリ パフォーマンスの分析情報

Important

この機能は、プライベート プレビューにあります。 試すには、Azure Databricks の連絡先にお問い合わせください。

クエリが実行されると、Databricks はパフォーマンスを向上させる機会を特定する分析情報を返す場合があります。 このページには、サポートされている分析情報とその意味が一覧表示されます。

パフォーマンスのベスト プラクティスのより広範な概要については、 Databricks、Spark、Delta Lake ワークロードを最適化するための包括的なガイドを参照してください。

同時書き込み (CONCURRENT_WRITE)

  • テーブルに同時書き込みを行うと、自動的に解決または失敗する 競合 が発生します。
  • 推奨事項: 差分履歴 を確認して同時書き込みを特定し、競合を回避するために別のスケジュールを検討します。

カバレッジ_フィルター_キー_クラスタリング

  • テーブルは、テーブル スキャン中にフィルター処理に使用されない 1 つ以上のキーによって クラスター化 されます。
  • 推奨事項: 目的の結果に必要なデータ サブセットを決定し、一致するクラスタリング キーにフィルターを追加して、読み取ったバイト数を減らします。

COVERAGE_FILTER_KEYS_PARTITIONING

  • テーブルは、テーブル スキャン中にフィルター処理に使用されない 1 つ以上のキーによって パーティション分割 されます。
  • 推奨事項: 目的の結果に必要なデータ サブセットを決定し、一致するパーティション キーにフィルターを追加して、読み取ったバイト数を減らします。

COVERAGE_PHOTON

  • Photon は操作を高速化できないため、標準ランタイム エンジンが使用されました。
  • 推奨事項: Photon の制限事項を確認し、サポートされている実行戦略を使用して実行時間を短縮するようにクエリを調整することを検討してください。

COVERAGE_STATS_DELTA

  • デルタデータスキップの統計がテーブルスキャンファイルフィルターに対して見つからないか不完全であるため、クエリはファイル内フィルター処理を使用します。 次の統計状態が可能です。
    • 完全: 統計はすべてのフィルターで使用できます。
    • 部分的: 統計情報はフィルターのサブセットで使用できます。
    • 使用不可: 統計情報はどのフィルターでも使用できません。
    • 未使用: データ型を変換するフィルターで統計を使用できませんでした。
  • 推奨事項: デルタ統計を収集 して、読み取られたバイト数を減らします。

COVERAGE_STATS_OPTIMIZER

  • コストベースのオプティマイザー 統計が見つからないか不完全であるため、標準のヒューリスティックを使用してクエリ プランを生成しました。
  • 推奨事項: 統計を収集 して、オプティマイザーがより適切なプランを生成できるようにします。

DATA_SKEW(データの偏り)

  • データは、使用可能なコンピューティング リソースによって不均一に処理されます
  • 推奨事項: データの分布を確認してから、キーをソルトするか、データを事前に集計します。

爆発的結合

  • 結合 により、読み取 りよりも大幅に多くの行が生成 されます。
  • 推奨事項: 必要な結果サブセットを決定し、結合を更新するか、両方のリレーションからの入力行数を減らします。

I/O スロットリング

  • クラウド ストレージ リクエストは、クラウド プロバイダーによって制限されました。
  • 推奨事項: クラウド プロバイダーでクラウド ストレージ要求の制限を引き上げるには、管理者に問い合わせてください。