Compartilhar via


Funções de agregação em fluxos de dados de mapeamento

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Dica

Data Factory no Microsoft Fabric é a próxima geração de Azure Data Factory, com uma arquitetura mais simples, IA interna e novos recursos. Se você não estiver familiarizado com a integração de dados, comece com Fabric Data Factory. As cargas de trabalho existentes do ADF podem ser atualizadas para Fabric para acessar novos recursos em ciência de dados, análise em tempo real e relatórios.

Os fluxos de dados estão disponíveis em os pipelines do Azure Data Factory e os pipelines do Azure Synapse Analytics. Este artigo se aplica ao fluxo de dados de mapeamento. Se você for novo em transformações, consulte o artigo introdutório Transformar dados usando fluxos de dados de mapeamento.

Este artigo fornece detalhes sobre as funções de agregação suportadas por Azure Data Factory e Azure Synapse Analytics nos fluxos de dados de mapeamento.

Somente lista de funções

As funções a seguir estão disponíveis somente em transformações agregadas, dinâmicas, não dinâmicas e de janela.

Função de agregação Tarefa
approxDistinctCount Obtém a contagem de agregação aproximada de valores distintos para uma coluna. O segundo parâmetro opcional é controlar o erro de estimativa.
avg Obtém a média dos valores de uma coluna.
avgIf Obtém a média de valores de uma coluna, com base em critérios.
collect Coleta todos os valores da expressão no grupo agregado em uma matriz. Durante esse processo, você pode coletar e transformar estruturas em estruturas alternativas. O número de itens é igual ao número de linhas nesse grupo e pode conter valores nulos. O número de itens coletados deve ser pequeno.
collectUnique Coleta todos os valores da expressão no grupo agregado em uma matriz exclusiva. Durante esse processo, você pode coletar e transformar estruturas em estruturas alternativas. O número de itens é menor ou igual ao número de linhas nesse grupo e pode conter valores nulos. O número de itens coletados deve ser pequeno.
contagem Obtém a contagem agregada de valores. Se as colunas opcionais forem especificadas, ignorará NULL valores na contagem.
countAll Obtém a contagem agregada de valores, incluindo NULL.
countDistinct Obtém a contagem agregada de valores distintos de um conjunto de colunas.
countAllDistinct Obtém a contagem agregada de valores distintos de um conjunto de colunas, incluindo os valores NULL.
countIf Obtém a contagem agregada de valores, com base nos critérios. Se a coluna opcional for especificada, valores NULL serão ignorados na contagem.
covariancePopulation Obtém a covariância de população entre duas colunas.
covariancePopulationIf Obtém a covariância populacional de duas colunas, com base em critérios.
covarianceSample Obtém a covariância de amostra de duas colunas.
covarianceSampleIf Obtém a covariância amostral de duas colunas, com base em critérios.
first Obtém o primeiro valor de um grupo de colunas. Se o segundo parâmetro ignoreNulls for omitido, assume-se "falso".
isDistinct Localiza se uma coluna ou conjunto de colunas for diferente. Ele não conta nulo como um valor distinto.
kurtosis Obtém a curtose de uma coluna.
kurtosisIf Obtém a curtose de uma coluna com base em critérios.
last Obtém o último valor de um grupo de colunas. Se o segundo parâmetro ignoreNulls for omitido, assume-se "falso".
max Obtém o valor máximo de uma coluna.
maxIf Obtém o valor máximo de uma coluna, com base nos critérios.
média Obtém a média dos valores de uma coluna. O mesmo que AVG.
meanIf Obtém a média dos valores de uma coluna, com base em critérios. O mesmo que avgIf.
min Obtém o valor mínimo de uma coluna.
minIf Obtém o valor mínimo de uma coluna, com base nos critérios.
skewness Obtém a distorção de uma coluna.
skewnessIf Obtém a distorção de uma coluna, com base em critérios.
stddev Obtém o desvio padrão de uma coluna.
stddevIf Obtém o desvio padrão de uma coluna, com base em critérios.
stddevPopulation Obtém o desvio padrão de população de uma coluna.
stddevPopulationIf Obtém o desvio padrão de população de uma coluna, com base em critérios.
stddevSample Obtém o desvio padrão de amostra de uma coluna.
stddevSampleIf Obtém o desvio padrão de exemplo de uma coluna, com base nos critérios.
sum Obtém a soma agregada de uma coluna numérica.
sumDistinct Obtém a soma agregada de valores distintos de uma coluna numérica.
sumDistinctIf Obtém a soma agregada de uma coluna numérica, com base nos critérios. A condição pode ser baseada em qualquer coluna.
sumIf Obtém a soma agregada de uma coluna numérica, com base nos critérios. A condição pode ser baseada em qualquer coluna.
topN Obtém os principais N valores desta coluna.
variance Obtém a variação de uma coluna.
varianceIf Obtém a variação de uma coluna, com base em critérios.
variancePopulation Obtém a variação de população de uma coluna.
variancePopulationIf Obtém a variação da população de uma coluna, com base em critérios.
varianceSample Obtém a variação não polarizada de uma coluna.
varianceSampleIf Obtém a variação imparcial de uma coluna, com base em critérios.