Formato binário no Data Factory no Microsoft Fabric

O formato binário copia arquivos as-is sem análise, o que é útil para mover arquivos entre locais de armazenamento sem transformação. Este artigo descreve como configurar o formato Binário em um pipeline de atividade de cópia no Data Factory em Microsoft Fabric.

Funcionalidades com suporte

O formato binário tem suporte para as seguintes atividades e conectores como origem e destino.

Categoria Conector/Atividade
Conector suportado Amazônia S3
Compatível com o Amazon S3
Armazenamento de Blobs do Azure
Azure Data Lake Storage Gen2
Arquivos do Azure
Sistema de arquivos
FTP
Google Cloud Storage
HTTP
Arquivos do Lakehouse
Armazenamento em Nuvem Oracle
SFTP
Atividade com suporte Atividade de cópia (fonte/destino)
Atividade GetMetadata
Excluir atividade

Formato binário na atividade de cópia

Para configurar o formato Binário, escolha sua conexão na origem ou no destino da atividade de cópia do pipeline e selecione Binário na lista suspensa de Formato de Arquivo. Selecione Configurações para ver mais configurações desse formato.

Captura de tela mostrando o botão de configurações de arquivo.

Observação

Ao usar o formato Binário em uma atividade de cópia, a origem e o destino devem usar o formato Binário.

Binário como fonte

Depois de selecionar Configurações na seção Formato de arquivo na guia Origem, as propriedades a seguir são exibidas na caixa de diálogo pop-up configurações de formato de arquivo.

Captura de tela mostrando as configurações de formato de arquivo.

  • Tipo de compactação: o codec de compactação usado para ler arquivos binários. Você pode escolher entre os tipos None, bzip2, gzip, deflate, ZipDeflate, TarGzip ou tar na lista suspensa.

    Se você selecionar ZipDeflate como tipo de compactação, Preservar o nome do arquivo zip como pasta aparecerá em Configurações avançadas na guia Origem.

    • Preservar o nome do arquivo zip como pasta: indica se o nome do arquivo zip de origem deve ser preservado como estrutura de pasta durante a cópia.
      • Se essa caixa estiver marcada (padrão), o serviço gravará arquivos descompactados em <specified file path>/<folder named as source zip file>/.
      • Se essa caixa estiver desmarcada, o serviço registrará arquivos descompactados diretamente em <specified file path>. Verifique se não há nomes de arquivo duplicados nos arquivos zip de origem diferentes para evitar a corrida ou comportamento inesperado.

    Se você selecionar TarGzip/tar como tipo de compactação, Preservar o nome do arquivo compactado como pasta será exibido em Configurações avançadas na guia Origem.

    • Preservar o nome do arquivo compactado como pasta: indica se o nome do arquivo compactado de origem deve ser preservado como estrutura de pasta durante a cópia.
      • Se essa caixa estiver marcada (padrão), o serviço gravará arquivos descompactados em <specified file path>/<folder named as source compressed file>/.
      • Se essa caixa estiver desmarcada, o serviço gravará arquivos descompactados diretamente em <specified file path>. Verifique se não há nomes de arquivo duplicados nos arquivos zip de origem diferentes para evitar a corrida ou comportamento inesperado.
  • Nível de compactação: a taxa de compactação. Você pode escolher entre Ideal ou Mais Rápido.

    • Mais rápida: a operação de compactação deve ser concluída o mais rápido possível, mesmo se o arquivo resultante não for compactado da maneira ideal.
    • Ideal: a operação de compactação deve ser concluída da maneira ideal, mesmo se a operação demorar mais tempo para ser concluída. Para obter mais informações, acesse o artigoNível de Compactação .

Em Configurações avançadas na guia Origem , outra propriedade relacionada ao formato binário é exibida.

  • Excluir arquivos após a conclusão: se essa caixa de seleção estiver selecionada, os arquivos binários serão excluídos do repositório de origem após a migração com êxito para o repositório de destino. A exclusão de arquivo é por arquivo. Quando uma atividade de cópia falha, alguns arquivos já foram copiados para o destino e excluídos da origem, enquanto outros ainda permanecem no local de origem.

Binário como destino

Depois de selecionar Configurações na seção Formato de arquivo na guia Origem, as propriedades a seguir são exibidas na caixa de diálogo pop-up configurações de formato de arquivo.

Captura de tela mostrando a seleção do formato de arquivo.

  • Tipo de compactação: o codec de compactação usado para escrever arquivos binários. Você pode escolher entre os tipos None, bzip2, gzip, deflate, ZipDeflate, TarGzip ou tar na lista suspensa.

  • Nível de compactação: a taxa de compactação. Você pode escolher entre Ideal ou Mais Rápido.

    • Mais rápida: a operação de compactação deve ser concluída o mais rápido possível, mesmo se o arquivo resultante não for compactado da maneira ideal.
    • Ideal: a operação de compactação deve ser concluída da maneira ideal, mesmo se a operação demorar mais tempo para ser concluída. Para obter mais informações, acesse o artigoNível de Compactação .

Propriedades da atividade de cópia binária

Binário como fonte

As propriedades a seguir têm suporte na seção Source da atividade de cópia ao usar o formato binário.

Nome Descrição Valor Obrigatório Propriedade de script JSON
Formato de arquivo O formato de arquivo que você deseja usar. Binário Sim tipo (em datasetSettings):
Binário
Tipo de compactação codec de compressão usado para ler arquivos binários. Escolha uma destas opções:
Nenhuma
bzip2
gzip
deflate
ZipDeflate
TarGzip
tar
Não tipo (em compression):

bzip2
gzip
deflate
ZipDeflate
TarGzip
tar
Nível de compactação A taxa de compactação. Os valores permitidos são Ideal ou Mais rápida. Ideal ou mais rápido Não nível (em compression):
Mais rápido
Ótimo
Preservar o nome do arquivo zip como pasta Indica se o nome do arquivo zip de origem deve ser preservado como estrutura de pastas durante a cópia. Selecionado ou não selecionado Não preserveZipFileNameAsFolder
(em compressionProperties->type como ZipDeflateReadSettings)
Preservar o nome do arquivo de compactação como pasta Indica se o nome do arquivo compactado de origem deve ser preservado como estrutura de pastas durante a cópia. Selecionado ou não selecionado Não preservarNomeArquivoCompressaoComoPasta
(em compressionProperties->type como TarGZipReadSettings ou TarReadSettings)
Excluir arquivos após a conclusão Indica se os arquivos binários serão excluídos do armazenamento de origem após serem movidos com êxito para o armazenamento de destino. Selecionado ou não selecionado Não deleteFilesAfterCompletion:
verdadeiro ou falso

Binário como destino

As propriedades a seguir têm suporte na seção Destino da atividade de cópia ao usar o formato binário.

Nome Descrição Valor Obrigatório Propriedade de script JSON
Formato de arquivo O formato de arquivo que você deseja usar. Binário Sim tipo (em datasetSettings):
Binário
Tipo de compactação O codec de compactação usado para ler/gravar arquivos binários. Escolha uma destas opções:
Nenhuma
bzip2
gzip
deflate
ZipDeflate
TarGzip
tar
Não tipo (em compression):

bzip2
gzip
deflate
ZipDeflate
TarGzip
tar
Nível de compactação A taxa de compactação. Os valores permitidos são Ideal ou Mais rápida. Ideal ou mais rápido Não nível (em compression):
Mais rápido
Ótimo