O que é disputa de dados?

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Gorjeta

Data Factory em Microsoft Fabric é a próxima geração de Azure Data Factory, com uma arquitetura mais simples, IA incorporada e novas funcionalidades. Se és novo na integração de dados, começa pelo Fabric Data Factory. As cargas de trabalho existentes do ADF podem atualizar para o Fabric para aceder a novas capacidades em ciência de dados, análise em tempo real e relatórios.

Preparação de dados envolve a transformação e reformatação de dados de sua fonte original para torná-los mais adequados e úteis para várias aplicações subsequentes.

As organizações precisam ter a capacidade de explorar seus dados de negócios críticos para preparação e disputa de dados, a fim de fornecer uma análise precisa de dados complexos que continuam a crescer a cada dia. A preparação de dados é necessária para que as organizações possam usá-los em vários processos de negócios e reduzir o tempo de valorização.

A Data Factory capacita-o com a preparação de dados sem código à escala da cloud de forma iterativa usando o Power Query. Data Factory integra-se com Power Query Online e disponibiliza as funções M do Power Query como uma atividade de pipeline.

O Data Factory traduz o M gerado pelo Power Query Online Mashup Editor em código Spark para execução em escala na cloud, traduzindo o M em Azure Data Factory Data Flows. Gerir dados com Power Query e fluxos de dados é especialmente útil para engenheiros de dados ou 'integradores de dados cidadãos'.

Casos de utilização

Rápida exploração e preparação interativa de dados

Vários engenheiros de dados e integradores de dados cidadãos podem explorar e preparar conjuntos de dados interativamente em escala de nuvem. Com o aumento do volume, variedade e velocidade dos dados em data lakes, os usuários precisam de uma maneira eficaz de explorar e preparar conjuntos de dados. Por exemplo, pode ser necessário criar um conjunto de dados que "tenha todas as informações demográficas do cliente para novos clientes desde 2017". Você não está mapeando para um destino conhecido. Você está explorando, disputando e preparando conjuntos de dados para atender a um requisito antes de publicá-lo no lago. A disputa é frequentemente usada para cenários de análise menos formais. Os conjuntos de dados preparados podem ser usados para fazer transformações e operações de aprendizado de máquina a jusante.

Preparação ágil de dados sem código

Os integradores de dados dos cidadãos passam mais de 60% do seu tempo a procurar e a preparar dados. Eles estão procurando fazer isso de uma maneira livre de código para melhorar a produtividade operacional. Permitir que os integradores de dados cidadãos enriquecam, moldem e publiquem dados usando ferramentas conhecidas como o Power Query Online de forma escalável melhora drasticamente a sua produtividade. O Wrangling no Azure Data Factory permite que o familiar editor de mashup Power Query Online permita aos integradores de dados cidadãos corrigir erros rapidamente, padronizar dados e produzir dados de alta qualidade para apoiar decisões empresariais.

Validação e exploração de dados

Analise visualmente seus dados de maneira livre de código para remover quaisquer discrepâncias, anomalias e adaptá-los a uma forma para análises rápidas.

Origens suportadas

Conector	Formato dos dados	Tipo de autenticação
Armazenamento de Blobs do Azure	CSV, Parquet, Excel	Chave de Conta, Entidade de Serviço, MSI
Azure Data Lake Storage Gen1	CSV, Parquet, Excel	Principal de Serviço, MSI
Azure Data Lake Storage Gen2	CSV, Parquet, Excel	Chave de Conta, Entidade de Serviço, MSI
Base de Dados SQL do Azure	-	Autenticação SQL, MSI, Service Principal
Azure Synapse Analytics	-	Autenticação SQL, MSI, Service Principal

O editor de mashup

Quando cria uma atividade Power Query, todos os conjuntos de dados de origem tornam-se consultas de conjunto de dados e são colocados na pasta ADFResource. Por padrão, o UserQuery apontará para a primeira consulta de conjunto de dados. Todas as transformações devem ser feitas no UserQuery, pois as alterações nas consultas do conjunto de dados não são suportadas nem serão persistentes. Atualmente, não há suporte para renomear, adicionar e excluir consultas.

Disputa

Atualmente, nem todas as funções do Power Query M são suportadas para manipulação de dados, apesar de estarem disponíveis durante a autoria. Ao construir as suas atividades do Power Query, será notificado com a seguinte mensagem de erro caso uma função não seja suportada:

The Power Query Spark Runtime does not support the function

Para mais informações sobre transformações suportadas, consulte Power Query funções de preparação de dados.

Aprenda a criar uma gestão de dados Power Query mash-up.

Comentários

Esta página foi útil?

Last updated on 2026-04-07