Microsoft Fabric Microsoftの分析ツールを単一の SaaS プラットフォームに統合し、ワークフロー オーケストレーション、データ移動、レプリケーション、および大規模な変換のための堅牢な機能を提供します。 Fabric Data Factory は Azure Data Factory (ADF) を基に構築されているため、データ統合ソリューションの最新化に最適です。
このガイドでは、Azure Data Factory から Fabric Data Factory へのアップグレードに役立つ移行戦略、考慮事項、およびアプローチについて説明します。
移行前の考慮事項
移行する前に、再利用する内容、翻訳する内容、または再設計する内容を評価します。 スムーズな移行を実現するには、次の手順に従います。
- マネージド ID やキーベースの認証などの認証パターンを識別します。
- プライベート エンドポイントやゲートウェイなど、ネットワーク要件を確認します。
- スケジュール設定とトリガー セマンティクスをマップし、監視とアラートの設定を調整します。
- ADF の機能と対応するFabricを比較し、SSIS やデータ フローなどのギャップに気を付けます。
- SLA、スループット、コスト制限、可観測性などの非機能ターゲットを定義します。
- ADF とFabricの実行を客観的に比較するために、サンプル データセットと予想される出力を含むテスト シナリオを構築します。
- 現在のデータ統合戦略を再現するだけでなく、移行が改善されるように、シークレットのローテーション、名前付け規則、ワークスペースの分類を計画します。
サイド バイ サイドの検証とロールバック計画を使用した段階的なアプローチでは、リスクを最小限に抑えながら、実行の高速化、一元化された監視、Microsoft Fabricとのより深い統合が可能になります。
大規模な移行の場合は、認定されたMicrosoft パートナーまたはMicrosoft account チームと協力してガイダンスを受け取ってください。
接続、リンクされたサービス、データセット
Azure Data Factory (ADF) では、リンクされたサービスとデータセットによって接続とデータ構造が定義されます。 Fabricでは、これらのマップは connections と activity settings にマップされ、ワークスペース レベルの再利用とマネージド ID に重点を置きます。 ADF 資産を調整する方法を次に示します。
- Azure Data FactoryとFabricの
コネクタの継続性を確認して 、データソースとシンクのサポートを確認します。 - 冗長接続を統合して管理を効率化します。
- セキュリティで保護された一貫性のある認証のためにマネージド ID を採用します。
-
conn-sql-warehouse-salesやds-lh-raw-ordersなど、明確な名前付け規則を使用してフォルダーとテーブルのパラメーター化を標準化します。
一貫性とスケーラビリティを確保するには、各ソースと宛先を次の内容で完全に文書化します。
- 所有者
- 感度レベル
- 再試行の設定
このドキュメントは、パイプライン全体の操作をテンプレート化し、ガバナンスを向上させるのに役立ちます。
統合ランタイム、OPDG、仮想ネットワークゲートウェイ
Azure Data Factory (ADF) は、Integration Runtimes (XR) を使用して、データ処理用のコンピューティング リソースを定義します。 これらには次のものが含まれます。
- Cloud IR Azure ホスト型コンピューティング用。
- オンプレミスまたはプライベート ネットワークのソース用のセルフホステッド IR (SHIR)。
- SQL Server Integration ServicesのSSIS IRs。
- セキュリティで保護されたネットワーク接続のための VNet 対応の IR。
Fabricでは、これらのマップは cloud execution、On-premises Data Gateway (OPDG)、および Virtual Network Data Gateway オプションにマップされます。 移行を計画する方法を次に示します。
- SHIR に依存するパイプラインを特定し、ゲートウェイ マッピングとスループットのサイズ設定を計画します。
- 各コネクタの DNS、エグレス、ファイアウォール規則、認証を検証します。
- 信頼性を確保するためにフェールオーバー シナリオをリハーサルします。
- 可能であれば、プライベート エンドポイントまたは仮想ネットワーク データ ゲートウェイに移行して、セキュリティ レビューを簡素化し、運用オーバーヘッドを軽減します。
Fabricでは、Fabric容量内のクラウドベースのリソースを使用してコンピューティング管理を簡略化します。 SSIS の IR は、Fabricでは使用できません。 オンプレミス接続の場合は、 オンプレミス データ ゲートウェイ (OPDG) を使用します。 セキュリティで保護されたネットワーク接続を実現するには、Virtual Network Data Gateway を使用します。
移行時:
- パブリック ネットワークAzure XR を移動する必要はありません。
- SHIR を OPDG として再作成します。
- VNet 対応の Azure IR を Virtual Network Data Gateway に置き換えます。
パイプライン アクティビティの違い
Azure Data Factory (ADF) のすべてのコア アクティビティ (コピー、参照、ストアド プロシージャ/SQL スクリプト、Web、制御フローなど) には、Fabricで直接同等のものがあります。 ただし、プロパティ、式の構文、および制限にはいくつかの違いがあります。 移行する場合は、次の内容を確認します。
- 再試行ポリシーとタイムアウト。
- REST ソースの改ページ設定。
- バイナリと表形式のコピーの構成。
- Foreachパターンとフィルターパターン。
- 動的コンテンツで使用されるシステム変数。
Fabricでは、多くの場合、特定のタスクに対してより多くのネイティブ オプションが提供されます。 たとえば、系列と監視を向上するために、汎用ストアド プロシージャ呼び出しの代わりに、ウェアハウスで SQL スクリプトを使用します。 移行を効率化するには、パス、日付、テナント固有の URI などの一般的な式をパイプライン パラメーターに一元化します。 これにより、ドリフトが減少し、テストが高速化されます。
詳細については、「Azure Data Factory と Fabric のアクティビティの継続性」を参照してください。
データフローの違い
Azure Data Factory (ADF) データ フローのマッピングはFabricに直接マップされません。 代わりに、通常、次のいずれかのオプションを使用して、それらを再作業します。
- 行セット変換と、管理された低コード変換用のデータフロー Gen2。
- Fabric Warehouse SQL は、データに近い MERGE 操作や ELT 操作などのセット ベースの ELT タスク用です。
- 高度な変換、複雑なロジック、または大規模な処理のための Spark ノートブック。
移行時に、次の内容を検証します。
- データ型と null 処理。
- サロゲート キーと緩やかに変化するディメンション。
- 予測可能な再実行を確保するために、べき等性を備えた ELT パターンとしてステージングや MERGE を利用します。
移行シナリオについては、「 Dataflow Gen1 から Dataflow Gen2 への移行」を参照してください。
Azure Data Factoryのグローバル パラメーター
Fabricでは、ワークスペース レベルの Variable Libraries を使用して、Fabric項目間で定数を定義します。 Microsoft Fabric Data Factory に移行する場合は、Azure Data Factoryグローバル パラメーターを変数ライブラリに変換する必要があります。
完全な変換の手引きについては、「ADF グローバル パラメーターからFabric 変数ライブラリへの変換」を参照。
Azure Marketplace パートナー提供
Bitwise Global などの信頼できる移行パートナーには、移行に役立つツールが用意されています。 これらのツールは次のことができます。
- Azure Data Factory (ADF) 環境をスキャンします。
- Fabricのターゲット成果物を生成します。
- 影響分析と系列追跡を実行します。
- 自動テスト計画を作成します。
これらのソリューションは、次のような場合に特に役立ちます。
- 数百のパイプライン。
- 多様なコネクタ。
- 厳密なダウンタイム要件。
パートナー ツールは、マッピング ルールを標準化し、変換レポートを生成し、並列検証テストを実行します。 これにより、古い環境と新しい環境の間で行数、チェックサム、パフォーマンスを比較できます。 移行全体にパートナーを使用しない場合でも、その検出と評価モジュールは、内部計画を開始し、不確実性を軽減するのに役立ちます。
AI ツールを使用する
Microsoft Copilot、ChatGPT、Claude などの大規模な言語モデル (LLM) を使用すると、移行タスクを高速化できます。 これらのツールは、次の場合に役立ちます。
- 式のリファクタリング。
- Azure Data Factory (ADF) JSON をFabric構文に変換する。
- MERGE ステートメントの記述。
- 接続テンプレートの生成。
- 検証スクリプトの下書き。
また、Runbook、データ ディクショナリ、移行チェックリストなどのドキュメントを作成して、エンジニアとオペレーターの連携を維持することもできます。 ただし、これらのツール は、担当ではなくループ内に置きます。
- 機密情報を AI ツールに貼り付けないようにします。
- 開発環境のすべての項目を検証します。
- 行数、スキーマ比較、ビジネス ルール チェックなどの自動テストを使用して、型の不一致やロケール固有の日付解析などの微妙な問題をキャッチします。
詳細については、「Data Factory での Copilot の使用」および「Microsoft Fabric の AI」を参照してください。
移行パス
移行パスは、ADF 資産とその機能パリティによって異なります。 オプションは次のとおりです。
- Fabricで ADF 項目をマウントして継続性を確保します。
- 組み込みのアップグレード エクスペリエンスを使用して、パイプラインを段階的に評価、移行、検証します。 - ガイド付き UX を使用して、Azure Data Factoryでパイプラインの準備状況を直接評価し、互換性の結果を確認し、サポートされているパイプラインをFabric ワークスペースに移行します。
- スクリプトまたは一括移行に PowerShell 変換ツールを使用する。 - スクリプト駆動型の自動化されたシナリオの代替手段。
- ネイティブFabricパターンを導入するためのプラットフォーム移行。