Databricks SQL は、Lakehouse アーキテクチャ上に構築されたクラウド データ ウェアハウスです。 データ レイク上で直接実行され、Delta Lake 拡張機能を備えた ANSI SQL がサポートされ、データを移動することなく高パフォーマンスでコスト効率の高いデータ ウェアハウスを構築するためのツールが提供されます。
インターフェイスとツール
Databricks SQL は SQL ウェアハウス 上で実行され、クエリ、視覚化、パイプライン管理、自動化のために複数のインターフェイスからアクセスできます。
| インターフェイス | 説明 |
|---|---|
| SQL エディター | 統合された AI アシスタンス、コード コメント、バージョン履歴を使用して SQL クエリを記述して実行します。 |
| ノートブック | ノートブックを SQL ウェアハウスにアタッチして、Python、Scala、または R と共に SQL を実行します。 |
| AI/BI | セルフサービスデータ分析と会話型データ探索のための AI を利用したダッシュボードと Genie スペースを作成します。 |
| 指標表示 | セマンティック レイヤーを使用して、一貫した計算を使用して再利用可能なビジネス メトリックを定義します。 |
| アラート | クエリ結果を監視し、条件を評価し、通知を自動的に配信します。 |
| 仕事 | 自動データ処理およびレポート ワークフロー用に SQL クエリをスケジュールします。 |
| Etl | 増分 ETL パイプライン用の Databricks SQL でストリーミング テーブルと具体化されたビューを直接定義および更新します。 |
| REST API | Databricks SQL オブジェクトをプログラムで自動化および管理します。 |
監視と最適化
| Resource | 説明 |
|---|---|
| クエリ履歴 | 過去のクエリ実行、実行時間、およびウェアハウス全体のリソース使用量を確認します。 |
| クエリ プロファイル | クエリの実行プランを調べて、ボトルネックと最適化の機会を特定します。 |
| パフォーマンスに関する分析情報のクエリ | クエリが非効率的に実行されたときに、自動分析情報と推奨事項を取得します。 |
概要
Databricks SQL を初めて使用する場合は、概念から始めて、実践的なチュートリアルに従ってください。
| Resource | 説明 |
|---|---|
| Databricks SQL の概念 | クエリ、SQL ウェアハウス、ダッシュボード、データ管理などの主要な概念について説明します。 |
| データ ウェアハウス アーキテクチャ | Databricks SQL のレイクハウス アーキテクチャ、medallion レイヤー、およびデータ モデリングアプローチについて説明します。 |
| データウェアハウスを始める | サンプル ダッシュボード、ノートブック、ジョブ、データ インジェスト、SQL ウェアハウスのセットアップに関する完全なチュートリアルに従います。 |
| Unity カタログのメトリック ビュー | クエリとダッシュボード全体で使用するセマンティック レイヤーを使用して、一貫性のある再利用可能なビジネス メトリックを定義します。 |
| AI/BI ダッシュボードを作成する | AI 支援による作成を使用して、データセット、視覚化、フィルターを使用して、最初のダッシュボードを構築して発行します。 |