このチュートリアルでは、Azure SQL Database のデータを Lakehouse に移動するパイプラインを構築します。 このエクスペリエンスでは、パイプライン コピー アクティビティを使用する方法と、Lakehouse にデータを読み込む方法に関する簡単なデモを示します。
前提条件
開始するには、次の前提条件を満たしている必要があります。
- アクティブなサブスクリプションを持つ Microsoft Fabric テナント アカウント。 無料でアカウントを作成できます。
- Microsoft Fabric 対応ワークスペースがあることを確認します: ワークスペースの作成。
パイプラインを作成する
Power BI に移動します。
画面の左下にある Power BI アイコンを選択し、[ ファブリック ] を選択して Data Factory のホームページを開きます。
Microsoft Fabric ワークスペースに移動します。 前の「前提条件」セクションで新しいワークスペースを作成した場合は、それを使用します。
+ 新規アイテム を選択します。
パイプラインを検索して選択し、 パイプライン 名を入力して新しいパイプラインを作成します。 新しいパイプラインを作成するために。
パイプラインを使用してデータをコピーする
このセッションでは、Azure SQL Database から Lakehouse へのデータのコピーに関する以下の手順に従って、パイプラインの構築を開始します。
Copy アクティビティを追加する
既存のパイプラインを開くか、新しいパイプラインを作成します。
[パイプライン アクティビティの追加]>[Copy アクティビティ] を選ぶか、[アクティビティ] タブにある >[キャンバスに追加] を選んで、Copy アクティビティを追加します。
[ソース] タブでソースを構成する
[ 接続] で、既存の接続を選択するか、[ その他 ] を選択して新しい接続を作成します。
ポップアップ ウィンドウからデータ ソースの種類を選びます。 例として Azure SQL Database を使用します。 [Azure SQL Database] を選び、 [続行] を選びます。
接続の作成ページに移動します。 パネルで必要な接続情報を入力して、[作成] を選びます。 データ ソースの種類ごとの接続の作成の詳細については、各コネクタに関する記事をご覧ください。
接続が正常に作成されると、パイプライン ページに戻ります。 次に、[更新] を選んで、作成した接続をドロップダウン リストからフェッチします。 以前に作成した場合は、ドロップダウンから既存の Azure SQL Database 接続を直接選ぶこともできます。 [テスト接続] と [編集] の機能は、選んだ各接続で使用できます。 次に、[接続の種類] で [Azure SQL Database] を選びます。
コピーするテーブルを指定します。 [データのプレビュー] を選んで、ソース テーブルをプレビューします。 [クエリ] と [ストアド プロシージャ] を使用して、ソースからデータを読み取ることもできます。
[詳細設定] を展開して、より高度な設定を行います。
[コピー先] タブでコピー先を構成する
[ 接続] で既存の接続を選択するか、[ その他 ] を選択してレイクハウスを検索します。
接続が正常に作成されると、パイプライン ページに戻ります。 次に、[更新] を選んで、作成した接続をドロップダウン リストからフェッチします。 以前に作成した場合は、ドロップダウンから既存のレイクハウス接続を直接選ぶこともできます。
テーブルを指定するか、ファイル パスを設定して、ファイルまたはフォルダーをコピー先として定義します。 ここで [テーブル] を選び、データを書き込むテーブルを指定します。
[詳細設定] を展開して、より高度な設定を行います。
これで、この 1 つのコピー アクティビティでパイプラインを保存するか、パイプラインの設計を続けることができます。
パイプラインの実行とスケジュール設定
パイプラインの構成が完了したら、パイプラインを実行してコピー アクティビティをトリガーします。 必要に応じて、パイプラインの実行をスケジュールすることもできます。
[ホーム] タブに切り替えて、[実行] を選択します。 確認ダイアログが表示されます。 次に、[保存および実行] を選択してアクティビティを開始します。
実行中のプロセスを監視し、パイプライン キャンバスの下にある [出力 ] タブで結果を確認できます。 実行の詳細を表示するには、[実行の詳細] ボタン (眼鏡のアイコンが強調表示されています) を選択します。
実行の詳細には、読み取りと書き込みが行われたデータの量と、実行に関するその他のさまざまな詳細が表示されます。
必要に応じて、特定の頻度で実行するようにパイプラインをスケジュールすることもできます。 15 分ごとに実行するようにパイプラインをスケジュールする例を次に示します。 スケジュールの開始時刻と終了時刻を指定することもできます。 開始時刻を指定しない場合、開始時刻はスケジュールが適用される時刻になります。 終了時刻を指定しない場合、パイプラインの実行は 15 分ごとに繰り返し実行されます。