Compartilhar via


Transformação de classificação em fluxo de dados de mapeamento

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Dica

Data Factory no Microsoft Fabric é a próxima geração de Azure Data Factory, com uma arquitetura mais simples, IA interna e novos recursos. Se você não estiver familiarizado com a integração de dados, comece com Fabric Data Factory. As cargas de trabalho existentes do ADF podem ser atualizadas para Fabric para acessar novos recursos em ciência de dados, análise em tempo real e relatórios.

Os fluxos de dados estão disponíveis em os pipelines do Azure Data Factory e os pipelines do Azure Synapse Analytics. Este artigo se aplica ao fluxo de dados de mapeamento. Se você for novo em transformações, consulte o artigo introdutório Transformar dados usando fluxos de dados de mapeamento.

Use a transformação de classificação para gerar uma classificação ordenada com base nas condições de classificação especificadas pelo usuário.

Configuração

Configurações de classificação

Não diferenciar maiúsculas de minúsculas: se uma coluna classificada for do tipo de cadeia de caracteres, as maiúsculas e minúsculas serão fatoradas na classificação.

Denso: se habilitado, a coluna de classificação será classificada como densa. Cada contagem de classificação será um número consecutivo e os valores de classificação não serão ignorados após um empate.

Coluna de classificação: o nome da coluna de classificação gerada. Esta coluna será do tipo longo.

Condições de classificação: escolha quais colunas você está classificando e em qual ordem a classificação acontece. A ordem determina a prioridade de classificação.

A configuração acima usa dados de basquete de entrada e cria uma coluna de classificação chamada 'pointsRanking'. A linha com o valor mais alto da coluna PTS terá um valor pointsRanking de 1.

Script de fluxo de dados

Sintaxe

<incomingStream>
    rank(
        desc(<sortColumn1>),
        asc(<sortColumn2>),
        ...,
        caseInsensitive: { true | false }
        dense: { true | false }
        output(<rankColumn> as long)
    ) ~> <sortTransformationName<>

Exemplo

Configurações de classificação

O script de fluxo de dados para a configuração de classificação acima está no trecho de código a seguir.

PruneColumns
    rank(
        desc(PTS, true),
        caseInsensitive: false,
        output(pointsRanking as long),
        dense: false
    ) ~> RankByPoints

Filtrar linhas com base nos valores de classificação usando a transformação de filtro.