Azure Data Factory または Synapse Analytics を使用して MongoDB との間でデータをコピーする

適用対象: Azure Data Factory Azure Synapse Analytics

ヒント

Data Factory in Microsoft Fabric は、よりシンプルなアーキテクチャ、組み込みの AI、および新機能を備えた次世代のAzure Data Factoryです。データ統合を初めて使用する場合は、Fabric Data Factory から始めます。既存の ADF ワークロードをFabricにアップグレードして、データサイエンス、リアルタイム分析、レポートの新機能にアクセスできます。

Fabric無料試用版を開始します。
Azure Data Factory から Microsoft Fabric の Data Factory へのアップグレード

この記事では、Azure Data Factory Synapse Analytics パイプラインでコピーアクティビティを使用して、MongoDB データベースとの間でデータをコピーする方法について説明します。この記事は、コピーアクティビティの概要を示しているコピーアクティビティの概要に関する記事に基づいています。

重要

新しい MongoDB コネクタでは、ネイティブ MongoDB サポートが強化されています。下位互換性のためにのみ現状のままサポートされているレガシ MongoDB コネクタをソリューションで使用している場合は、MongoDB コネクタ (レガシ)に関するページを参照してください。

サポートされる機能

この MongoDB コネクタでは、次の機能がサポートされます。

サポートされる機能	IR
Copy アクティビティ (ソース/シンク)	(1) (2)

(1) Azure統合ランタイム (2) セルフホステッド統合ランタイム

ソースおよびシンクとしてサポートされているデータストアの一覧については、「サポートされているデータストア」の表を参照してください。

具体的には、この MongoDB コネクタでは 4.2 までのバージョンがサポートされます。 4.2 より新しいバージョンが必要な作業の場合は、さらに包括的なサポートと機能を提供する MongoDB Atlas と MongoDB Atlas コネクタの使用を検討してください。

前提条件

データストアがオンプレミスネットワーク、Azure仮想ネットワーク、または Amazon Virtual Private Cloud 内にある場合は、自身がホストする統合ランタイムを構成して接続する必要があります。

データストアがマネージドクラウドデータサービスの場合は、Azure Integration Runtimeを使用できます。アクセスがファイアウォール規則で承認されている IP に制限されている場合は、許可リストに Azure Integration Runtime IP を追加できます。

Azure Data Factoryの管理された仮想ネットワーク統合ランタイム機能を使用して、セルフホステッド統合ランタイムをインストールして構成することなく、オンプレミスネットワークにアクセスすることもできます。

Data Factory によってサポートされるネットワークセキュリティメカニズムやオプションの詳細については、「データアクセス戦略」を参照してください。

作業の開始

パイプラインでコピーアクティビティを実行するには、次のいずれかのツールまたは SDK を使用します。

UI を使用して MongoDB のリンクサービスを作成する

Azure ポータル UI で MongoDB へのリンクされたサービスを作成するには、次の手順に従います。

Azure Data Factoryまたは Synapse ワークスペースの [管理] タブを参照し、[リンクされたサービス] を選択し、[新規] をクリックします。
- Azure Data Factory
- Azure Synapse
MongoDB を検索し、MongoDB コネクタを選択します。
サービスの詳細を構成し、接続をテストして、新しいリンクサービスを作成します。

コネクタの構成の詳細

次のセクションでは、MongoDB コネクタに固有の Data Factory エンティティを定義するために使用されるプロパティについて詳しく説明します。

リンクされたサービスのプロパティ

MongoDB のリンクされたサービスでは、次のプロパティがサポートされます。

プロパティ	説明	必須
型	type プロパティは、次のように設定する必要があります: MongoDbV2	はい
connectionString	MongoDB 接続文字列 (例: `mongodb://[username:password@]host[:port][/[database][?options]]`) を指定します。詳細については、接続文字列の MongoDB のマニュアルを参照してください。 Azure Key Vaultに接続文字列を配置することもできます。詳細については、「store credentials in Azure Key Vaultを参照してください。	はい
データベース	アクセスするデータベースの名前。	はい
connectVia	データストアへの接続に使用するIntegration Runtime。詳細については、「前提条件」セクションを参照してください。指定しない場合は、既定のAzure Integration Runtimeが使用されます。	いいえ

例:

{
    "name": "MongoDBLinkedService",
    "properties": {
        "type": "MongoDbV2",
        "typeProperties": {
            "connectionString": "mongodb://[username:password@]host[:port][/[database][?options]]",
            "database": "myDatabase"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

データセットのプロパティ

データセットの定義に使用できるセクションとプロパティの完全な一覧については、「データセットとリンクされたサービス」を参照してください。 MongoDB データセットでは、次のプロパティがサポートされます。

プロパティ	説明	必須
型	データセットの type プロパティは、次のように設定する必要があります: MongoDbV2Collection	はい
collectionName	MongoDB データベースのコレクション名前。	はい

例:

{
    "name": "MongoDbDataset",
    "properties": {
        "type": "MongoDbV2Collection",
        "typeProperties": {
            "collectionName": "<Collection name>"
        },
        "schema": [],
        "linkedServiceName": {
            "referenceName": "<MongoDB linked service name>",
            "type": "LinkedServiceReference"
        }
    }
}

Copy アクティビティのプロパティ

アクティビティの定義に利用できるセクションとプロパティの完全な一覧については、パイプラインに関する記事を参照してください。このセクションでは、MongoDB ソースとシンクでサポートされるプロパティの一覧を示します。

ソースとしての MongoDB

コピーアクティビティの source セクションでは、次のプロパティがサポートされます。

プロパティ	説明	必須
型	コピーアクティビティのソースの type プロパティは、次のように設定する必要があります: MongoDbV2Source	はい
フィルタ	クエリ演算子を使用して選択フィルターを指定します。コレクション内のすべてのドキュメントを返すには、このパラメーターを省略するか、空のドキュメント ({}) を渡します。	いいえ
cursorMethods.project	プロジェクションのドキュメントで返されるフィールドを指定します。一致するドキュメント内のすべてのフィールドを返すには、このパラメーターを省略します。	いいえ
cursorMethods.sort	一致するドキュメントがクエリによって返される順序を指定します。「cursor.sort()」を参照してください。	いいえ
cursorMethods.limit	サーバーが返すドキュメントの最大数を指定します。「cursor.limit()」を参照してください。	いいえ
cursorMethods.skip	スキップするドキュメントの数と、MongoDB が結果を返すときの開始位置を指定します。「cursor.skip()」を参照してください。	いいえ
batchSize	MongoDB インスタンスからの応答の各バッチで返されるドキュメントの数を指定します。ほとんどの場合、バッチサイズを変更しても、ユーザーまたはアプリケーションへの影響はありません。 Azure Cosmos DBでは、各バッチのサイズが 40 MB を超えることはできません。これは、ドキュメントのサイズの batchSize 数の合計であるため、ドキュメントのサイズが大きい場合は、この値を小さくします。	いいえ (既定値は 100)

ヒント

このサービスは、厳格モードでの BSON ドキュメントの利用をサポートしています。フィルタークエリがシェルモードではなく厳格モードであることを確認してください。詳細については、MongoDB のマニュアルを参照してください。

例:

"activities":[
    {
        "name": "CopyFromMongoDB",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<MongoDB input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "MongoDbV2Source",
                "filter": "{datetimeData: {$gte: ISODate(\"2018-12-11T00:00:00.000Z\"),$lt: ISODate(\"2018-12-12T00:00:00.000Z\")}, _id: ObjectId(\"5acd7c3d0000000000000000\") }",
                "cursorMethods": {
                    "project": "{ _id : 1, name : 1, age: 1, datetimeData: 1 }",
                    "sort": "{ age : 1 }",
                    "skip": 3,
                    "limit": 3
                }
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

シンクとしての MongoDB

コピーアクティビティの sink セクションでは、次のプロパティがサポートされます。

プロパティ	説明	必須
型	Copy アクティビティのシンクの type プロパティには MongoDbV2Sink を設定する必要があります。	はい
writeBehavior	MongoDB データを書き込む方法について説明します。使用可能な値は、Insert、Upsert です。 upsert の動作は、同じ `_id` を持つドキュメントが既に存在する場合、そのドキュメントを置き換えます。それ以外の場合は、ドキュメントを挿入します。注: 元のドキュメントまたは列マッピングで `_id` が指定されていない場合は、サービスによってドキュメントの `_id` が自動的に生成されます。つまり、upsert が期待どおりに動作するには、ドキュメントに ID があることを確認する必要があります。	いいえ (既定値は insert です)
writeBatchSize	writeBatchSize プロパティにより、各バッチで書き込むドキュメントのサイズが制御されます。パフォーマンスを向上させるには writeBatchSize の値を大きくしてみて、ドキュメントのサイズが大きい場合は値を小さくしてみます。	いいえ (既定値は 10,000)
writeBatchTimeout	タイムアウトするまでに一括挿入操作の完了を待つ時間です。許容される値は期間です。	いいえ (既定値は 00:30:00 - 30 分)

ヒント

JSON ドキュメントをそのままインポートするには、「JSON ドキュメントをインポートまたはエクスポートする」セクションを参照してください。表形式のデータからコピーするには、「スキーママッピング」を参照してください。

例

"activities":[
    {
        "name": "CopyToMongoDB",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<Document DB output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "<source type>"
            },
            "sink": {
                "type": "MongoDbV2Sink",
                "writeBehavior": "upsert"
            }
        }
    }
]

JSON ドキュメントのインポートとエクスポート

この MongoDB コネクタを使用すると、簡単に次を実行できます。

2 つの MongoDB コレクション間でドキュメントをそのままコピーします。
Azure Cosmos DB、Azure Blob Storage、Azure Data Lake ストア、サポートされているその他のファイルベースのストアなど、さまざまなソースから MongoDB に JSON ドキュメントをインポートします。
JSON ドキュメントを MongoDB コレクションからさまざまなファイルベースのストアにエクスポートします。

このようなスキーマに依存しないコピーを実現するには、データセットの "構造" ("スキーマ" とも呼ばれる) のセクションと、コピーアクティビティでのスキーママッピングをスキップします。

MongoDB のデータ型マッピング

MongoDB からデータをコピーする場合、MongoDB データ型からサービスによって内部的に使用される中間データ型への次のマッピングが使用されます。コピーアクティビティでソースのスキーマとデータ型がシンクにマッピングされるしくみについては、スキーマとデータ型のマッピングに関する記事を参照してください。

MongoDB のデータ型	中間サービスデータ型
日付	Int64
オブジェクト識別子	String
Decimal128	String
タイムスタンプ	最も重要な 32 ビット -> Int64 最下位の 32 ビット -> Int64
String	String
Double	String
Int32	Int64
Int64	Int64
ブール値	ブール値
Null	Null
JavaScript	String
正規表現	String
最小キー	Int64
最大キー	Int64
Binary	String

MongoDB コネクタのライフサイクルとアップグレード

次の表は、MongoDB コネクタのさまざまなバージョンのリリースステージと変更ログを示しています。

Version	リリース段階	変更ログ
MongoDB (レガシ)	Removed	適用されません。
MongoDB	GA バージョンあり	• 同等の MongoDB クエリのみをサポートします。 • Double は文字列データ型として読み取られます。

MongoDB リンクサービスをアップグレードする

新しい MongoDB リンクサービスを作成し、リンクサービスプロパティを参照してそれを構成します。

Copy アクティビティでソースおよびシンクとしてサポートされるデータストアの一覧については、サポートされるデータストアに関するセクションを参照してください。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-01-26