Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
APLICA-SE A:
Azure Data Factory
Azure Synapse Analytics
Tip
Data Factory em Microsoft Fabric é a próxima geração de Azure Data Factory, com uma arquitetura mais simples, IA incorporada e novas funcionalidades. Se és novo na integração de dados, começa pelo Fabric Data Factory. As cargas de trabalho existentes do ADF podem atualizar para o Fabric para aceder a novas capacidades em ciência de dados, análise em tempo real e relatórios.
O formato binário é suportado para os seguintes conectores: Amazon S3, Armazenamento Compatível com Amazon S3, Azure Blob, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Ficheiros do Azure, Sistema de Ficheiros, FTP, Google Cloud Storage, HDFS, HTTP, Oracle Cloud Storage e SFTP.
Pode usar o conjunto de dados binário em atividade Copy, GetMetadata activity, ou Delete activity. Ao usar um conjunto de dados binário, o serviço não analisa o conteúdo dos ficheiros, mas trata-o as-is.
Nota
Ao usar conjunto de dados binário na atividade de cópia, só pode copiar de conjunto de dados binário para conjunto de dados binário.
Propriedades do conjunto de dados
Para obter uma lista completa de seções e propriedades disponíveis para definir conjuntos de dados, consulte o artigo Conjuntos de dados. Esta secção fornece uma lista de propriedades suportadas pelo conjunto de dados binário.
| Propriedade | Descrição | Obrigatório |
|---|---|---|
| tipo | A propriedade de tipo do conjunto de dados deve ser definida como Binário. | Yes |
| localização | Configurações de localização do(s) arquivo(s). Cada conector com base em ficheiro tem o seu próprio tipo de localização e propriedades suportadas em location.
Consulte os detalhes no artigo sobre o conector -> seção propriedades do conjunto de dados. |
Yes |
| compressão | Grupo de propriedades para configurar a compactação de arquivos. Configure esta seção quando quiser fazer compressão/descompactação durante a execução da atividade. | Não |
| tipo | O codec de compressão usado para ler/escrever ficheiros binários. Os valores permitidos são bzip2, gzip, deflate, ZipDeflate, Tar ou TarGzip. Note que, ao usar a atividade de cópia para descompactar arquivos ZipDeflate/ arquivos TarGzip/ e arquivos Tar e gravar no repositório de dados baseado em arquivos, por padrão, os arquivos são extraídos para a pasta: <path specified in dataset>/<folder named as source compressed file>/, use preserveZipFileNameAsFolder/preserveCompressionFileNameAsFolder na origem da atividade de cópia para controlar se o nome do(s) arquivo(s) compactado(s) deve ser preservado como estrutura de pasta. |
Não |
| nível | A taxa de compressão. Aplicar quando o conjunto de dados for usado no destino da atividade de cópia. Os valores permitidos são Ótimo ou Mais Rápido. - Mais rápido: A operação de compressão deve ser concluída o mais rapidamente possível, mesmo que o ficheiro resultante não esteja comprimido da melhor forma. - Ideal: A operação de compressão deve ser compactada de forma ideal, mesmo que a operação demore mais tempo para ser concluída. Para obter mais informações, consulte o tópico Nível de compactação. |
Não |
Abaixo está um exemplo de conjunto de dados binário no Armazenamento de Blobs do Azure:
{
"name": "BinaryDataset",
"properties": {
"type": "Binary",
"linkedServiceName": {
"referenceName": "<Azure Blob Storage linked service name>",
"type": "LinkedServiceReference"
},
"typeProperties": {
"location": {
"type": "AzureBlobStorageLocation",
"container": "containername",
"folderPath": "folder/subfolder",
},
"compression": {
"type": "ZipDeflate"
}
}
}
}
Propriedades da atividade de cópia
Para uma lista completa de secções e propriedades disponíveis para definir atividades, consulte o artigo Pipelines. Esta secção fornece uma lista de propriedades suportadas pela fonte e pelo sumidouro binário.
Nota
Ao usar conjunto de dados binário na atividade de cópia, só pode copiar de conjunto de dados binário para conjunto de dados binário.
Binário como fonte
As propriedades a seguir são suportadas na seção copy activity *source* .
| Propriedade | Descrição | Necessário |
|---|---|---|
| tipo | A propriedade de tipo da fonte da atividade de cópia deve ser definida como BinarySource. | Yes |
| configurações de formato | Um grupo de propriedades. Consulte a tabela de definições de leitura binária abaixo. | Não |
| configurações da loja | Um grupo de propriedades sobre como ler dados de um armazenamento de dados. Cada conector baseado em arquivo tem as suas próprias configurações de leitura suportadas em storeSettings.
Veja os detalhes no artigo do conector - seção de propriedades da atividade de cópia>. |
Não |
Definições de leitura binária suportadas em:formatSettings
| Propriedade | Descrição | Obrigatório |
|---|---|---|
| tipo | O tipo de formatSettings deve ser definido como BinaryReadSettings. | Yes |
| compressionProperties | Um grupo de propriedades sobre como descompactar dados para um determinado codec de compactação. | Não |
| preserveZipFileNameAsFolder (em compressionProperties->type como ZipDeflateReadSettings) |
Aplica-se quando o conjunto de dados de entrada está configurado com a ZipDeflate compactação. Indica se o nome do arquivo zip de origem deve ser preservado como estrutura de pastas durante a cópia. - Quando definido para true (default), o serviço escreve ficheiros descomprimidos em <path specified in dataset>/<folder named as source zip file>/.- Quando definido como false, o serviço grava arquivos descompactados diretamente no <path specified in dataset>. Certifique-se de que não tem nomes de ficheiros duplicados em ficheiros zip de origem diferentes para evitar corridas ou comportamentos inesperados. |
Não |
| preservarNomeDeFicheiroDeCompressãoComoPasta (em compressionProperties->type como TarGZipReadSettings ou TarReadSettings) |
Aplicável quando o conjunto de dados de entrada está configurado com TarGzip/Tar para compactação. Indica se o nome do arquivo compactado de origem deve ser preservado como estrutura de pasta durante a cópia. - Quando definido como true (padrão), o serviço grava arquivos descompactados em <path specified in dataset>/<folder named as source compressed file>/. - Quando definido como false, o serviço grava arquivos descompactados diretamente no <path specified in dataset>. Certifique-se de que não tem nomes de ficheiro duplicados em ficheiros de origem diferentes para evitar corridas ou comportamentos inesperados. |
Não |
"activities": [
{
"name": "CopyFromBinary",
"type": "Copy",
"typeProperties": {
"source": {
"type": "BinarySource",
"storeSettings": {
"type": "AzureBlobStorageReadSettings",
"recursive": true,
"deleteFilesAfterCompletion": true
},
"formatSettings": {
"type": "BinaryReadSettings",
"compressionProperties": {
"type": "ZipDeflateReadSettings",
"preserveZipFileNameAsFolder": false
}
}
},
...
}
...
}
]
Binário como sumidouro
As propriedades a seguir são suportadas na seção de atividade de cópia *sink* .
| Propriedade | Descrição | Obrigatório |
|---|---|---|
| tipo | A propriedade type da fonte de atividade de cópia deve ser definida como BinarySink. | Yes |
| guardarConfigurações | Um grupo de propriedades sobre como gravar dados em um armazenamento de dados. Cada conector baseado em arquivo tem as suas próprias configurações de gravação suportadas em storeSettings.
Veja os detalhes no artigo do conector - seção de propriedades da atividade de cópia>. |
Não |