Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
APLICA-SE A:
Azure Data Factory
Azure Synapse Analytics
Dica
Data Factory no Microsoft Fabric é a próxima geração de Azure Data Factory, com uma arquitetura mais simples, IA interna e novos recursos. Se você não estiver familiarizado com a integração de dados, comece com Fabric Data Factory. As cargas de trabalho existentes do ADF podem ser atualizadas para Fabric para acessar novos recursos em ciência de dados, análise em tempo real e relatórios.
Você pode usar a atividade Obter Metadados para recuperar os metadados de qualquer dado no Azure Data Factory ou em um pipeline do Synapse. Você pode usar a saída da atividade de obtenção de metadados em expressões condicionais para executar a validação ou consumir os metadados nas atividades subsequentes.
Criar uma atividade de obtenção de metadados com a interface do usuário
Para usar uma atividade de obtenção de metadados em um pipeline, conclua as seguintes etapas:
Pesquise por Obter Metadados no painel Atividades do pipeline e arraste a atividade Obter Metadados para o canvas do pipeline.
Selecione a nova atividade Get Metadata na tela, se ainda não estiver selecionada, e a guia Configurações, para editar os detalhes.
Escolha um conjunto de dados ou crie um novo com o botão Novo. Em seguida, você pode especificar opções de filtro e adicionar colunas dos metadados disponíveis para o conjunto de dados.
Use a saída da atividade como uma entrada para outra atividade, como uma atividade Switch neste exemplo. Você pode fazer referência à saída da atividade de metadados em qualquer lugar que o conteúdo dinâmico tenha suporte na outra atividade.
No editor de conteúdo dinâmico, selecione a saída Get Metadata para fazer referência a ela na outra atividade.
Funcionalidades com suporte
A atividade de obtenção de metadados usa um conjunto de dados como uma entrada e retorna informações de metadados como saída. Atualmente, os seguintes conectores e metadados recuperáveis correspondentes são suportados. O tamanho máximo dos metadados retornados é de 4 MB.
Conectores com suporte
Armazenamento de arquivos
| Conector/metadados | nomeDoItem (arquivo/pasta) |
tipoDeItem (arquivo/pasta) |
tamanho (arquivo) |
criado (arquivo/pasta) |
últimaModificação1 (arquivo/pasta) |
childItems (pasta) |
contentMD5 (arquivo) |
structure2 (arquivo) |
columnCount2 (arquivo) |
exists3 (arquivo/pasta) |
|---|---|---|---|---|---|---|---|---|---|---|
| Amazon S3 | √/√ | √/√ | √ | x/x | √/√ | √ | x | √ | √ | √/√ |
| Armazenamento compatível com Amazon S3 | √/√ | √/√ | √ | x/x | √/√ | √ | x | √ | √ | √/√ |
| Google Cloud Storage | √/√ | √/√ | √ | x/x | √/√ | √ | x | √ | √ | √/√ |
| Armazenamento em Nuvem Oracle | √/√ | √/√ | √ | x/x | √/√ | √ | x | √ | √ | √/√ |
| Armazenamento de Blobs do Azure | √/√ | √/√ | √ | x/x | √/√ | √ | √ | √ | √ | √/√ |
| Azure Data Lake Storage Gen1 | √/√ | √/√ | √ | x/x | √/√ | √ | x | √ | √ | √/√ |
| Azure Data Lake Storage Gen2 | √/√ | √/√ | √ | x/x | √/√ | √ | √ | √ | √ | √/√ |
| Arquivos do Azure | √/√ | √/√ | √ | √/√ | √/√ | √ | x | √ | √ | √/√ |
| Microsoft Fabric Lakehouse | √/√ | √/√ | √ | x/x | √/√ | √ | √ | √ | √ | √/√ |
| Sistema de Arquivos | √/√ | √/√ | √ | √/√ | √/√ | √ | x | √ | √ | √/√ |
| SFTP | √/√ | √/√ | √ | x/x | √/√ | √ | x | √ | √ | √/√ |
| FTP | √/√ | √/√ | √ | x/x | x/x | √ | x | √ | √ | √/√ |
1 Metadados lastModified:
- Para o Amazon S3, o Amazon S3 Compatible Storage, o Google Cloud Storage e o Oracle Cloud Storage,
lastModifiedaplica-se ao bucket e à chave, mas não à pasta virtual, eexistsaplica-se ao bucket e à chave, mas não ao prefixo ou à pasta virtual. - Para Azure Armazenamento de Blobs,
lastModifiedse aplica ao contêiner e ao blob, mas não à pasta virtual.
2 Não há suporte para os metadados structure e columnCount ao obter metadados de arquivos binários, JSON ou XML.
3 Metadados exists: para o Amazon S3, o Amazon S3 Compatible Storage, o Google Cloud Storage e o Oracle Cloud Storage, exists aplica-se ao bucket e à chave, mas não ao prefixo ou à pasta virtual.
Observe os seguintes pontos:
Ao usar a atividade obtenção de metadados em uma pasta, verifique se você tem a permissão LISTAR/EXECUTAR na pasta especificada.
O filtro de caracteres curingas em pastas/arquivos não é suportado na atividade Get Metadata.
Conjunto de filtros
modifiedDatetimeStartemodifiedDatetimeEndno conector:- Essas duas propriedades são usadas para filtrar os itens filho ao obter metadados de uma pasta. Ele não se aplica ao obter metadados de um arquivo.
- Quando esse filtro é usado, o
childItemsna saída inclui apenas os arquivos que são modificados dentro do intervalo especificado, mas não as pastas. - Para aplicar esse filtro, a atividade GetMetadata enumera todos os arquivos na pasta especificada e verifica a hora modificada. Evite apontar para uma pasta com um grande número de arquivos, mesmo se a contagem de arquivos qualificados esperada for pequena.
Banco de dados relacional
| Conector/metadados | estrutura | contagemDeColunas | existe |
|---|---|---|---|
| Amazon RDS para SQL Server | √ | √ | √ |
| Banco de Dados SQL do Azure | √ | √ | √ |
| Instância Gerenciada de SQL do Azure | √ | √ | √ |
| Azure Synapse Analytics | √ | √ | √ |
| SQL Server | √ | √ | √ |
Opções de metadados
Você pode especificar os seguintes tipos de metadados na lista de campos de atividade de obtenção de metadados para recuperar as informações correspondentes:
| Tipo de Metadados | Descrição |
|---|---|
| nomeDoItem | Nome do arquivo ou pasta. |
| tipoDeItem | Tipo do arquivo ou pasta. O valor retornado é File ou Folder. |
| tamanho | Tamanho do arquivo, em bytes. Aplicável somente nos arquivos. |
| criado | Data e hora de criação do arquivo ou da pasta. |
| últimaModificação | A data e hora da última modificação do arquivo ou da pasta. |
| childItems | Lista de subpastas e arquivos na pasta determinada. Aplicável somente nas pastas. O valor de saída é uma lista do nome e tipo de cada item filho. |
| contentMD5 | MD5 do arquivo. Aplicável somente nos arquivos. |
| estrutura | Estrutura de dados do arquivo ou tabela de banco de dados relacional. O valor retornado é uma lista de nomes de coluna e tipos de coluna. |
| contagemDeColunas | Número de colunas no arquivo ou tabela relacional. |
| existe | Se existe um arquivo, uma pasta ou uma tabela. Se exists for especificado na lista de campos de Get Metadata, não ocorrerá uma falha na atividade mesmo que o arquivo, a pasta ou a tabela não existam. Em vez disso, exists: false é retornado na saída. |
Dica
Quando desejar validar se um arquivo, pasta ou tabela existe, especifique exists na lista de campos da atividade de Obtenção de Metadados. Em seguida, você pode verificar o resultado exists: true/false na saída da atividade. Se exists não for especificado na lista de campos, a atividade Get Metadata falhará caso o objeto não seja encontrado.
Observação
Quando você recebe metadados dos armazenamentos de arquivos e configura modifiedDatetimeStart ou modifiedDatetimeEnd, os childItems na saída incluem apenas os arquivos no caminho especificado que têm a hora da última modificação dentro do intervalo especificado. Os itens presentes em subpastas não são incluídos.
Observação
Para a lista de campos Structure para fornecer a estrutura de dados real para conjuntos de dados de formato Excel e texto delimitado, você deve habilitar a propriedade First Row as Header, que tem suporte apenas para essas fontes de dados.
Sintaxe
Atividade de obtenção de metadados
{
"name":"MyActivity",
"type":"GetMetadata",
"dependsOn":[
],
"policy":{
"timeout":"7.00:00:00",
"retry":0,
"retryIntervalInSeconds":30,
"secureOutput":false,
"secureInput":false
},
"userProperties":[
],
"typeProperties":{
"dataset":{
"referenceName":"MyDataset",
"type":"DatasetReference"
},
"fieldList":[
"size",
"lastModified",
"structure"
],
"storeSettings":{
"type":"AzureBlobStorageReadSettings"
},
"formatSettings":{
"type":"JsonReadSettings"
}
}
}
Conjunto de dados
{
"name":"MyDataset",
"properties":{
"linkedServiceName":{
"referenceName":"AzureStorageLinkedService",
"type":"LinkedServiceReference"
},
"annotations":[
],
"type":"Json",
"typeProperties":{
"location":{
"type":"AzureBlobStorageLocation",
"fileName":"file.json",
"folderPath":"folder",
"container":"container"
}
}
}
}
Propriedades de tipo
Atualmente, a atividade de Obtenção de Metadados pode devolver os seguintes tipos de informações de metadados:
| Propriedade | Descrição | Obrigatório |
|---|---|---|
| lista de campos | Os tipos de informações de metadados necessárias. Para saber mais detalhes sobre metadados com suporte, consulte a seção Opções de metadados deste artigo. | Sim |
| conjunto de dados | O conjunto de dados de referência cujos metadados devem ser recuperados pela atividade de obtenção de metadados. Consulte a seção de Recursos para obter informações sobre os conectores com suporte. Consulte os artigos específicos sobre o conector para obter detalhes sobre a sintaxe do dataset. | Sim |
| configuraçõesDeFormato | Aplicar ao usar o tipo de formato do conjuntos de dados. | Não |
| configurações da loja | Aplicar ao usar o tipo de formato do conjuntos de dados. | Não |
Saída de exemplo
Os resultados de obter metadados são mostrados no resultado da atividade. A seguir temos dois exemplos que mostram opções extensivas de metadados. Para usar os resultados em uma atividade subsequente, use este padrão: @{activity('MyGetMetadataActivity').output.itemName}.
Obter metadados de um arquivo
{
"exists": true,
"itemName": "test.csv",
"itemType": "File",
"size": 104857600,
"lastModified": "2017-02-23T06:17:09Z",
"created": "2017-02-23T06:17:09Z",
"contentMD5": "cMauY+Kz5zDm3eWa9VpoyQ==",
"structure": [
{
"name": "id",
"type": "Int64"
},
{
"name": "name",
"type": "String"
}
],
"columnCount": 2
}
Obter metadados de uma pasta
{
"exists": true,
"itemName": "testFolder",
"itemType": "Folder",
"lastModified": "2017-02-23T06:17:09Z",
"created": "2017-02-23T06:17:09Z",
"childItems": [
{
"name": "test.avro",
"type": "File"
},
{
"name": "folder hello",
"type": "Folder"
}
]
}
Conteúdo relacionado
Saiba sobre outras atividades de fluxo de controle compatíveis: