Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
APLICA-SE A:
Azure Data Factory
Azure Synapse Analytics
Dica
Data Factory no Microsoft Fabric é a próxima geração de Azure Data Factory, com uma arquitetura mais simples, IA interna e novos recursos. Se você não estiver familiarizado com a integração de dados, comece com Fabric Data Factory. As cargas de trabalho existentes do ADF podem ser atualizadas para Fabric para acessar novos recursos em ciência de dados, análise em tempo real e relatórios.
Este artigo descreve como usar a atividade de cópia em pipelines do Azure Data Factory e do Synapse Analytics para copiar dados de ou para Azure Data Explorer. Ele é baseado no artigo Visão geral da atividade Copy, que apresenta uma visão geral ampla da atividade Copy.
Dica
Para saber mais sobre Azure Data Explorer integração com o serviço, leia Integrate Azure Data Explorer.
Funcionalidades com suporte
Esse conector Azure Data Explorer tem suporte para os seguintes recursos:
| Funcionalidades com suporte | IR |
|---|---|
| Atividade Copy (origem/coletor) | (1) (2) |
| Fluxo de dados de mapeamento (origem/coletor) | ① |
| Atividade de pesquisa | (1) (2) |
① Runtime de integração do Azure ② Runtime de integração auto-hospedado
Você pode copiar dados de qualquer armazenamento de dados de origem com suporte para Azure Data Explorer. Você também pode copiar dados do Azure Data Explorer para qualquer armazenamento de dados de coletor com suporte. Para ver uma lista de armazenamentos de dados com suporte da atividade Copy como origens ou coletores, confira a tabela Armazenamentos de dados com suporte.
Observação
A cópia de dados do Azure Data Explorer ou para ele por meio de um armazenamento de dados local usando o runtime de integração auto-hospedada tem suporte na versão 3.14 e posteriores.
Com o conector Azure Data Explorer, você pode fazer o seguinte:
- Copiar dados usando a autenticação de token de aplicativo do Microsoft Entra com uma entidade de serviço.
- Como uma fonte, recupere dados usando uma consulta KQL (Kusto).
- Como um coletor, acrescente dados a uma tabela de destino.
Introdução
Dica
Para obter um passo a passo do conector Azure Data Explorer, consulte Copiar dados de/para Azure Data Explorer e Cópia em massa de um banco de dados para Azure Data Explorer.
Para executar a atividade de cópia com um pipeline, você pode usar uma das seguintes ferramentas ou SDKs:
- Ferramenta Copiar Dados
- Azure portal
- .NET SDK
- SDK Python
- Azure PowerShell
- REST API
- modelo Azure Resource Manager
Criar um serviço vinculado para Azure Data Explorer usando a interface do usuário
Use as etapas a seguir para criar um serviço vinculado para Azure Data Explorer na interface do usuário do portal Azure.
Navegue até a guia Gerenciar no workspace do Azure Data Factory ou do Synapse e selecione Serviços Vinculados e clique em Novo:
Pesquise pelo Explorer e selecione o conector do Azure Data Explorer (Kusto).
Configure os detalhes do serviço, teste a conexão e crie o novo serviço vinculado.
Detalhes da configuração do conector
As seções a seguir fornecem detalhes sobre as propriedades usadas para definir entidades específicas para Azure Data Explorer conector.
Propriedades do serviço vinculado
O conector Azure Data Explorer dá suporte aos seguintes tipos de autenticação. Consulte as seções correspondentes para obter detalhes:
- Autenticação de entidade de serviço
- Autenticação de identidade gerenciada atribuída pelo sistema
- Autenticação de identidade gerenciada atribuída pelo usuário
Autenticação de entidade de serviço
Para usar a autenticação da entidade de serviço, siga estas etapas para obter uma entidade de serviço e conceder permissões:
Registre um aplicativo com o plataforma de identidade da Microsoft. Para saber como, consulte Quickstart: Registrar um aplicativo com o plataforma de identidade da Microsoft. Anote estes valores; ele são usados para definir o serviço vinculado:
- ID do aplicativo
- Chave do aplicativo
- ID do locatário
Conceda à entidade de serviço as permissões corretas no Azure Data Explorer. Consulte Manage Azure Data Explorer permissões de banco de dados para obter informações detalhadas sobre funções e permissões e sobre o gerenciamento de permissões. Em geral, você precisa:
- Como fonte, conceder pelo menos a função Visualizador de banco de dados ao banco de dados
- Como um coletor, conceder pelo menos a função de Usuário de banco de dados ao banco de dados
Observação
Quando você usa a interface do usuário para criar, por padrão, sua conta de usuário de login é utilizada para listar clusters, bancos de dados e tabelas do Azure Data Explorer. Você pode optar por listar os objetos que estão usando a entidade de serviço clicando no menu suspenso ao lado do botão Atualizar ou por inserir manualmente o nome caso não tenha permissão para essas operações.
As propriedades a seguir têm suporte para o serviço vinculado Azure Data Explorer:
| Propriedade | Descrição | Obrigatório |
|---|---|---|
| tipo | A propriedade type deve ser definida como AzureDataExplorer. | Sim |
| ponto de extremidade | URL do ponto de extremidade do cluster Azure Data Explorer, no formato https://<clusterName>.<regionName>.kusto.windows.net. |
Sim |
| banco de dados | Nome do banco de dados. | Sim |
| locatário | Especifique as informações de locatário (domínio nome ou ID do Locatário) em que o aplicativo reside. Isso é conhecido como "ID de autoridade" em Kusto cadeia de conexão. Recupere-o focalizando o ponteiro do mouse no canto superior direito do portal Azure. | Sim |
| servicePrincipalId | Especifique a ID do cliente do aplicativo. Isso é conhecido como "ID do cliente do aplicativo Microsoft Entra" em Kusto cadeia de conexão. | Sim |
| servicePrincipalKey | Especifique a chave do aplicativo. Isso é conhecido como "chave do aplicativo do Microsoft Entra" na cadeia de conexão Kusto. Marque esse campo como um SecureString para armazená-lo com segurança ou dados seguros referência armazenados em Azure Key Vault. | Sim |
| connectVia | O runtime de integração a ser usado para se conectar ao armazenamento de dados. Você pode usar o Azure integration runtime ou um runtime de integração auto-hospedada se o armazenamento de dados estiver em uma rede privada. Se não for especificado, o runtime de integração de Azure padrão será usado. | Não |
Exemplo: usar a autenticação de chave de entidade de serviço
{
"name": "AzureDataExplorerLinkedService",
"properties": {
"type": "AzureDataExplorer",
"typeProperties": {
"endpoint": "https://<clusterName>.<regionName>.kusto.windows.net ",
"database": "<database name>",
"tenant": "<tenant name/id e.g. microsoft.onmicrosoft.com>",
"servicePrincipalId": "<service principal id>",
"servicePrincipalKey": {
"type": "SecureString",
"value": "<service principal key>"
}
}
}
}
Autenticação de identidade gerenciada atribuída pelo sistema
Para saber mais sobre identidades gerenciadas para recursos do Azure, consulte Identidades Gerenciadas para Recursos do Azure.
Para usar a autenticação de identidade gerenciada atribuída pelo sistema, siga estas etapas para conceder permissões:
Recuperar as informações de identidade gerenciada copiando o valor de ID do objeto de identidade gerenciada gerado junto com seu alocador ou no Synapse Workspace.
Conceda à identidade gerenciada as permissões corretas no Azure Data Explorer. Consulte Manage Azure Data Explorer permissões de banco de dados para obter informações detalhadas sobre funções e permissões e sobre o gerenciamento de permissões. Em geral, você precisa:
- Como fonte, conceda a função Visualizador de banco de dados ao banco de dados.
- Como coletor, conceda as funções Ingestor de banco de dados e Visualizador de banco de dados ao banco de dados.
Observação
Quando você usa a interface do usuário para desenvolver, sua conta de login do usuário é usada para listar clusters do Azure Data Explorer, bancos de dados e tabelas. Insira o nome manualmente se você não tiver permissão para essas operações.
As propriedades a seguir têm suporte para o serviço vinculado Azure Data Explorer:
| Propriedade | Descrição | Obrigatório |
|---|---|---|
| tipo | A propriedade type deve ser definida como AzureDataExplorer. | Sim |
| ponto de extremidade | URL do ponto de extremidade do cluster Azure Data Explorer, no formato https://<clusterName>.<regionName>.kusto.windows.net. |
Sim |
| banco de dados | Nome do banco de dados. | Sim |
| connectVia | O runtime de integração a ser usado para se conectar ao armazenamento de dados. Você pode usar o Azure integration runtime ou um runtime de integração auto-hospedada se o armazenamento de dados estiver em uma rede privada. Se não for especificado, o runtime de integração de Azure padrão será usado. | Não |
Exemplo: usar a autenticação de identidade gerenciada atribuída pelo sistema
{
"name": "AzureDataExplorerLinkedService",
"properties": {
"type": "AzureDataExplorer",
"typeProperties": {
"endpoint": "https://<clusterName>.<regionName>.kusto.windows.net ",
"database": "<database name>",
}
}
}
Autenticação de identidade gerenciada atribuída pelo usuário
Para saber mais sobre identidades gerenciadas para recursos do Azure, consulte Identidades gerenciadas para recursos do Azure
Para usar a autenticação de identidade gerenciada atribuída pelo usuário, siga estas etapas:
Criar uma ou várias identidades gerenciadas atribuídas pelo usuário e conceder permissão no Azure Data Explorer. Consulte Manage Azure Data Explorer permissões de banco de dados para obter informações detalhadas sobre funções e permissões e sobre o gerenciamento de permissões. Em geral, você precisa:
- Como fonte, conceder pelo menos a função Visualizador de banco de dados ao banco de dados
- Como coletor, conceder pelo menos a função Ingestor de banco de dados ao banco de dados
Atribua uma ou várias identidades gerenciadas atribuídas pelo usuário ao data factory ou Synapse Workspace e crie credenciais para cada identidade gerenciada atribuída pelo usuário.
As propriedades a seguir têm suporte para o serviço vinculado Azure Data Explorer:
| Propriedade | Descrição | Obrigatório |
|---|---|---|
| tipo | A propriedade type deve ser definida como AzureDataExplorer. | Sim |
| ponto de extremidade | URL do ponto de extremidade do cluster Azure Data Explorer, no formato https://<clusterName>.<regionName>.kusto.windows.net. |
Sim |
| banco de dados | Nome do banco de dados. | Sim |
| credenciais | Especifique a identidade gerenciada atribuída pelo usuário como o objeto da credencial. | Sim |
| connectVia | O runtime de integração a ser usado para se conectar ao armazenamento de dados. Você pode usar o Azure integration runtime ou um runtime de integração auto-hospedada se o armazenamento de dados estiver em uma rede privada. Se não for especificado, o runtime de integração de Azure padrão será usado. | Não |
Exemplo: usar a autenticação de identidade gerenciada atribuída pelo usuário
{
"name": "AzureDataExplorerLinkedService",
"properties": {
"type": "AzureDataExplorer",
"typeProperties": {
"endpoint": "https://<clusterName>.<regionName>.kusto.windows.net ",
"database": "<database name>",
"credential": {
"referenceName": "credential1",
"type": "CredentialReference"
}
}
}
}
Propriedades do conjunto de dados
Para obter uma lista completa das seções e propriedades disponíveis para definir os conjuntos de dados, confira Conjuntos de dados. Esta seção lista as propriedades compatíveis com o conjunto de dados Azure Data Explorer.
Para copiar dados para Azure Data Explorer, defina a propriedade type do conjunto de dados como AzureDataExplorerTable.
Há suporte para as seguintes propriedades:
| Propriedade | Descrição | Obrigatório |
|---|---|---|
| tipo | A propriedade type deve ser definida como AzureDataExplorerTable. | Sim |
| tabela | O nome da tabela à qual o serviço vinculado se refere. | Não para coletor; não para fonte |
Exemplo de propriedades do conjunto de dados:
{
"name": "AzureDataExplorerDataset",
"properties": {
"type": "AzureDataExplorerTable",
"typeProperties": {
"table": "<table name>"
},
"schema": [],
"linkedServiceName": {
"referenceName": "<Azure Data Explorer linked service name>",
"type": "LinkedServiceReference"
}
}
}
Propriedades da atividade de cópia
Para obter uma lista completa das seções e propriedades disponíveis para definir as atividades, confira Pipelines e atividades. Esta seção fornece uma lista de propriedades que o Azure Data Explorer suporta em origens e destinos.
Azure Data Explorer como origem
Para copiar dados de Azure Data Explorer, defina a propriedade type na fonte atividade Copy como AzureDataExplorerSource. As propriedades a seguir têm suporte na seção source da atividade de cópia:
| Propriedade | Descrição | Obrigatório |
|---|---|---|
| tipo | A propriedade type da fonte da atividade Copy deve ser definida como: AzureDataExplorerSource | Sim |
| consulta | Uma solicitação somente leitura fornecida em um formato KQL. Use a consulta KQL personalizada como referência. | Sim |
| queryTimeout | O tempo de espera antes que a solicitação de consulta atinja o tempo limite. O valor padrão é 10 min (00:10:00); o valor máximo permitido é 1 hora (01:00:00). | Não |
| noTruncation | Indica se o conjunto de resultados retornado deve ser truncado. Por padrão, o resultado é truncado após 500.000 registros ou 64 megabytes (MB). O truncamento é altamente recomendável para garantir o comportamento correto da atividade. | Não |
Observação
Por padrão, Azure Data Explorer fonte tem um limite de tamanho de 500.000 registros ou 64 MB. Para recuperar todos os registros sem truncamento, você pode especificar set notruncation; no início da consulta. Para saber mais, confira Limites de consulta.
Exemplo:
"activities":[
{
"name": "CopyFromAzureDataExplorer",
"type": "Copy",
"typeProperties": {
"source": {
"type": "AzureDataExplorerSource",
"query": "TestTable1 | take 10",
"queryTimeout": "00:10:00"
},
"sink": {
"type": "<sink type>"
}
},
"inputs": [
{
"referenceName": "<Azure Data Explorer input dataset name>",
"type": "DatasetReference"
}
],
"outputs": [
{
"referenceName": "<output dataset name>",
"type": "DatasetReference"
}
]
}
]
Azure Data Explorer como coletor
Para copiar dados do Azure Data Explorer, defina a propriedade type no coletor da atividade de cópia como AzureDataExplorerSink. As propriedades a seguir têm suporte na seção sink da atividade de cópia:
| Propriedade | Descrição | Obrigatório |
|---|---|---|
| tipo | A propriedade type do coletor da atividade Copy deve ser definida como: AzureDataExplorerSink. | Sim |
| ingestionMappingName | Nome de um mapeamento pré-criado em uma tabela do Kusto. Para mapear as colunas de origem para o Azure Data Explorer (que se aplica a todos os armazenamentos e formatos de origem com suporte, incluindo os formatos CSV/JSON/Avro), você pode usar o mapeamento de colunas da atividade de cópia (implicitamente por nome ou explicitamente como configurado) e/ou mapeamentos do Azure Data Explorer. | Não |
| additionalProperties | Um recipiente de propriedades que pode ser usado para especificar qualquer uma das propriedades de ingestão que não estão sendo definidas pelo coletor do Azure Data Explorer. Especificamente, pode ser útil para especificar marcas de ingestão. Saiba mais no Azure Data Explore data ingestion doc. | Não |
Exemplo:
"activities":[
{
"name": "CopyToAzureDataExplorer",
"type": "Copy",
"typeProperties": {
"source": {
"type": "<source type>"
},
"sink": {
"type": "AzureDataExplorerSink",
"ingestionMappingName": "<optional Azure Data Explorer mapping name>",
"additionalProperties": {<additional settings for data ingestion>}
}
},
"inputs": [
{
"referenceName": "<input dataset name>",
"type": "DatasetReference"
}
],
"outputs": [
{
"referenceName": "<Azure Data Explorer output dataset name>",
"type": "DatasetReference"
}
]
}
]
Propriedades do fluxo de dados de mapeamento
Ao transformar dados no fluxo de dados de mapeamento, você pode ler e gravar em tabelas em Azure Data Explorer. Para obter mais informações, confira transformação de origem e transformação do coletor nos fluxos de dados de mapeamento. Você pode optar por usar um conjunto de dados Azure Data Explorer ou um conjunto de dados inline como tipo de origem e coletor.
Transformação de origem
A tabela abaixo lista as propriedades compatíveis na fonte do Azure Data Explorer. Você pode editar essas propriedades na guia Opções de origem.
| Nome | Descrição | Obrigatório | Valores permitidos | Propriedade do script do fluxo de dados |
|---|---|---|---|---|
| Tabela | Se você selecionar Tabela como entrada, o fluxo de dados buscará todos os dados da tabela especificada no conjunto de dados Azure Data Explorer ou nas opções de origem ao usar o conjunto de dados embutido. | Não | fio |
(somente para conjuntos de dados embutidos) nome da tabela |
| Consulta | Uma solicitação somente leitura fornecida em um formato KQL. Use a consulta KQL personalizada como referência. | Não | fio | consulta |
| Tempo limite | O tempo de espera antes da expiração da solicitação de consulta. O padrão é “172.000” (2 dias) | Não | Número Inteiro | tempo limite |
Exemplos de scripts de origem do Azure Data Explorer
Quando você usa Azure Data Explorer conjunto de dados como tipo de origem, o script de fluxo de dados associado é:
source(allowSchemaDrift: true,
validateSchema: false,
query: 'table | take 10',
format: 'query') ~> AzureDataExplorerSource
Se você usar um conjuntos de dados embutido, o script de fluxo de dados associado será:
source(allowSchemaDrift: true,
validateSchema: false,
format: 'query',
query: 'table | take 10',
store: 'azuredataexplorer') ~> AzureDataExplorerSource
Transformação de coletor
A tabela abaixo lista as propriedades compatíveis com o coletor do Azure Data Explorer. Você pode editar essas propriedades na guia Configurações. Ao usar o conjunto de dados embutido, será possível ver configurações de arquivo adicionais, que são as mesmas das propriedades descritas na seção Propriedades do conjunto de dados.
| Nome | Descrição | Obrigatório | Valores permitidos | Propriedade do script do fluxo de dados |
|---|---|---|---|---|
| Ação tabela | determina se deve-se recriar ou remover todas as linhas da tabela de destino antes da gravação. - Nenhum: nenhuma ação será realizada na tabela. - Recriar: a tabela será removida e recriada. Necessário ao criar uma tabela dinamicamente. - Truncar: todas as linhas da tabela de destino serão removidas. |
Não |
true ou false |
recreate truncar |
| Pré-scripts e Pós-scripts SQL | Especifique vários scripts de comandos de controle Kusto que serão executados antes (pré-processamento) e após (pós-processamento) que os dados sejam gravados no banco de dados do coletor. | Não | fio | comandos SQL pré-execução; comandos SQL pós-execução |
| Tempo limite | O tempo de espera antes da expiração da solicitação de consulta. O padrão é “172.000” (2 dias) | Não | Número Inteiro | tempo limite |
exemplos de script para destino de dados do Azure Data Explorer
Quando você usa um conjunto de dados do Azure Data Explorer como tipo de destino, o script de fluxo de dados associado é:
IncomingStream sink(allowSchemaDrift: true,
validateSchema: false,
format: 'table',
preSQLs:['pre SQL scripts'],
postSQLs:['post SQL script'],
skipDuplicateMapInputs: true,
skipDuplicateMapOutputs: true) ~> AzureDataExplorerSink
Se você usar um conjuntos de dados embutido, o script de fluxo de dados associado será:
IncomingStream sink(allowSchemaDrift: true,
validateSchema: false,
format: 'table',
store: 'azuredataexplorer',
skipDuplicateMapInputs: true,
skipDuplicateMapOutputs: true) ~> AzureDataExplorerSink
Pesquisar propriedades de atividade
Para obter mais informações sobre as propriedades, confira Atividade de pesquisa.
Conteúdo relacionado
Para obter uma lista de armazenamentos de dados que a atividade Copy suporta, como fontes e coletores, consulte Armazenamentos de dados compatíveis.
Saiba mais sobre como copiar dados do Azure Data Factory e do Synapse Analytics para Azure Data Explorer.