次の方法で共有


Azure Data Factoryを使用してMicrosoft 365 (Office 365) からデータを読み込む

適用対象: Azure Data Factory Azure Synapse Analytics

ヒント

Data Factory in Microsoft Fabric は、よりシンプルなアーキテクチャ、組み込みの AI、および新機能を備えた次世代のAzure Data Factoryです。 データ統合を初めて使用する場合は、Fabric Data Factory から始めます。 既存の ADF ワークロードをFabricにアップグレードして、データ サイエンス、リアルタイム分析、レポートの新機能にアクセスできます。

この記事では、Data Factory Microsoft 365 (Office 365) から Azure BLOB ストレージにデータを読み込む方法について説明します。 同様の手順に従って、データを Azure Data Lake Gen1 または Gen2 にコピーできます。 一般的なMicrosoft 365 (Office 365) からのデータのコピーについては、Microsoft 365 (Office 365) コネクタに関する記事を参照してください。

Data Factory の作成

  1. まだデータ ファクトリを作成していない場合は、「クイックスタート: Azure ポータルと Azure Data Factory Studio を使用してデータ ファクトリを作成する」 の手順に従って作成してください。 作成した後、Azure ポータルでデータ ファクトリを参照します。

    Azure Data Factoryのホームページで、Azure Data Factory Studioを開くタイルがあります。

  2. Open Azure Data Factory Studio タイルで Open を選択して、別のタブでデータ統合アプリケーションを起動します。

パイプラインを作成する

  1. ホーム ページで [調整] を選択します。

    ADF のホーム ページを示すスクリーンショット。

  2. パイプラインの [全般] タブで、パイプラインの名前として「CopyPipeline」と入力します。

  3. [アクティビティ] ツール ボックスの >[Move & Transform]\(移動と変換)> で、ツール ボックスからパイプライン デザイナー画面に [コピー アクティビティ] をドラッグ アンド ドロップします。 アクティビティ名として "CopyFromOffice365ToBlob" を指定します。

Note

ソースおよびシンクの両方のリンクされたサービスでAzure統合ランタイムを使用してください。 セルフホステッド統合ランタイムとマネージド仮想ネットワーク統合ランタイムはサポートされていません。

ソースの構成

  1. パイプライン >[ソース] タブに移動し、[+ 新規] を選択してソース データセットを作成します。

  2. [新しいデータセット] ウィンドウで、Microsoft 365 (Office 365) を選択し、Continue を選択します。

  3. これで、コピー アクティビティの構成タブが表示されます。Microsoft 365 (Office 365) データセットの横にある Edit ボタンを選択して、データ構成を続行します。

    Microsoft 365 (Office 365) データセットを一般に構成します。

  4. Microsoft 365 (Office 365) データセットの新しいタブが開きます。 プロパティ ウィンドウの下部にある [General] タブで、[名前] に「SourceOffice365Dataset」と入力します。

  5. プロパティ ウィンドウの Connection タブに移動します。 [リンクされたサービス] ボックスの横にある [+ 新規] を選択します。

  6. [New Linked Service]\(新しいリンクされたサービス) ウィンドウで、名前として「Office365LinkedService」と入力し、サービス プリンシパル ID とサービス プリンシパル キーを入力したら、接続をテストし、 [作成] を選択して、リンクされたサービスをデプロイします。

    新しいMicrosoft 365 (Office 365) リンクされたサービス。

  7. リンクされたサービスが作成されると、データセットの設定に戻ります。 Table の横にある下矢印を選択して、使用可能なMicrosoft 365 (Office 365) データセットの一覧を展開し、[BasicDataSet_v0] を選択します。ドロップダウン リストから "Message_v0" を選択します。

    Microsoft 365 (Office 365) のデータセットテーブルを設定します。

  8. 次に、pipeline>Source タブに戻り、Microsoft 365 (Office 365) データ抽出の追加プロパティの構成を続行します。 ユーザー スコープとユーザー スコープ フィルターは省略可能な述語であり、Microsoft 365から抽出するデータを制限するために定義できます (Office 365)。 これらの設定の構成方法については、「Microsoft 365 (Office 365) データセットのプロパティ」セクションを参照してください。

  9. 日付フィルターの 1 つを選択し、開始時刻と終了時刻の値を指定する必要があります。

  10. [インポート スキーマ] タブを選択して、メッセージ データセットのスキーマをインポートします。

    Config Microsoft 365 (Office 365) データセット スキーマ.

シンクの構成

  1. パイプライン >[シンク] タブに移動し、[+ 新規] を選んでシンク データセットを作成します。

  2. [新しいデータセット] ウィンドウで、Microsoft 365 (Office 365) からコピーするときに、サポートされているコピー先のみが選択されていることに注意してください。 Azure Blob Storageを選択し、[バイナリ形式] を選択し、[Continue を選択します。 このチュートリアルでは、Microsoft 365 (Office 365) データをAzure Blob Storageにコピーします。

  3. Azure Blob Storage データセットの横にある Edit ボタンを選択して、データ構成を続行します。

  4. プロパティ ウィンドウのGeneral タブの「名前」に「OutputBlobDataset」と入力します。

  5. プロパティ ウィンドウの Connection タブに移動します。 [リンクされたサービス] ボックスの横にある [+ 新規] を選択します。

  6. [New Linked Service]\(新しいリンクされたサービス) ウィンドウで、名前として「AzureStorageLinkedService」と入力し、認証方法のドロップダウン リストから [サービス プリンシパル] を選択します。サービス エンドポイント、テナント、サービス プリンシパル ID、およびサービス プリンシパル キーを入力したら、[保存] を選択し、リンクされたサービスをデプロイします。 Azure Blob Storageのサービス プリンシパル認証を設定する方法についてはこちらを参照してください。

    BLOB の新しいリンクされたサービス

パイプラインを検証する

パイプラインを検証するには、ツール バーから [検証] を選択します。

右上隅にある [コード] をクリックすると、パイプラインに関連付けられている JSON コードを参照することもできます。

パイプラインを公開する

上部ツールバーの [すべて発行] を選択します。 これにより、作成したエンティティ (データセットとパイプライン) が Data Factory に発行されます。

変更を発行する

パイプラインを手動でトリガーする

ツール バーの [トリガーの追加] を選択し、 [Trigger Now](今すぐトリガー) を選択します。 [Pipeline Run](パイプラインの実行) ページで [完了] を選択します。

パイプラインの監視

左側の [監視] タブに移動します。 手動トリガーによってトリガーされたパイプラインの実行が表示されます。 [アクション] 列のリンクを使用して、アクティビティの詳細を表示したりパイプラインを再実行したりできます。

パイプラインを監視する

パイプラインの実行に関連付けられているアクティビティの実行を表示するには、[アクション] 列の [View Activity Runs](アクティビティの実行の表示) リンクを選択します。 この例では、アクティビティが 1 つだけなので、一覧に表示されるエントリは 1 つのみです。 コピー操作の詳細を確認するには、[アクション] 列の [詳細] リンク (眼鏡アイコン) を選択します。

アクティビティを監視する

このコンテキスト (アクセス先のデータ テーブル、データを読み込む先のアカウント、データ アクセス要求を行っているユーザー ID の組み合わせ) に対して初めてデータを要求する場合、Copy アクティビティの状態は [進行中] と表示され、[アクション] の下にある [詳細] リンクを選んだときにのみ、[RequestingConsent] という状態が表示されます。 データの抽出を進めるには、データ アクセス承認者グループのメンバーが、Privileged Access Management で要求を承認する必要があります。

同意を要求しているときの状態:アクティビティ実行の詳細 - 同意の要求

データを抽出しているときの状態:

アクティビティの実行の詳細 - データの抽出

同意が得られると、データの抽出が続行されて、しばらくするとパイプラインの実行が正常終了として表示されます。

パイプラインの監視 - 成功

次に、変換先のAzure Blob Storageに移動し、Microsoft 365 (Office 365) データがバイナリ形式で抽出されていることを確認します。

次の記事に進み、Azure Synapse Analyticsサポートについて学習してください。