Compartilhar via


Início rápido: Crie seu primeiro fluxo de dados para obter e transformar dados

Os fluxos de dados são uma tecnologia de preparação de dados de autoatendimento baseada em nuvem. Neste artigo, você criará seu primeiro fluxo de dados, obterá dados para seu fluxo de dados, transformará os dados e publicará o fluxo de dados.

Pré-requisitos

Os seguintes pré-requisitos são necessários antes de começar:

Criação de um fluxo de dados

Nesta seção, você criará seu primeiro fluxo de dados.

Observação

A partir de abril de 2026, todos os novos itens do Dataflow Gen2 são criados com suporte de integração de CI/CD e Git por padrão. A opção de criar itens do Dataflow Gen2 sem suporte a CI/CD não está mais disponível. Fluxos de dados não CI/CD existentes continuam funcionando.

  1. Navegue até seu workspace Microsoft Fabric navegando até o Microsoft Fabric portal, selecione Workspaces no painel de navegação esquerdo e selecione seu workspace na lista.

  2. Selecione +Novo item e selecione Dataflow Gen2.

    Captura de tela com a seleção do Dataflow Gen2 enfatizada.

Obter dados

Vamos obter alguns dados! Nesse exemplo, você obterá dados de um serviço OData. Use as etapas a seguir para obter dados em seu fluxo de dados.

  1. No editor de fluxo de dados, selecione Obter dados e, em seguida, selecione Mais.

    Captura de tela com a opção Obter Dados selecionada e Mais em destaque na caixa suspensa.

  2. Em Escolher a fonte de dados, selecione Exibir mais.

    Captura de tela de Obter fonte de dados com o Modo de exibição mais enfatizado.

  3. Em Nova fonte, selecione Outro>OData como a fonte de dados.

    Captura de tela de Obter fonte de dados com a categoria Outra e o conector OData enfatizados.

  4. Insira o URL https://services.odata.org/v4/northwind/northwind.svc/ e, em seguida, selecione Avançar.

    Captura de tela da fonte de dados OData onde você insere o URL de dados.

  5. Selecione as tabelas Ordens e Clientes e, em seguida, selecione Criar.

    Captura de tela do navegador do Power Query com as tabelas Clientes e Pedidos destacadas.

Você pode saber mais sobre a experiência e a funcionalidade de obter dados na visão geral de obter dados.

Aplicar transformações e publicar

Você carregou seus dados em seu primeiro fluxo de dados. Parabéns! Agora é hora de aplicar algumas transformações para trazer esses dados para a forma de que precisamos.

Você transforma os dados no editor de Power Query. Você pode encontrar uma visão geral detalhada do editor de Power Query em A Power Query interface do usuário mas esta seção o levará pelas etapas básicas:

  1. Verifique se as ferramentas de Criação de Perfil de Dados estão ativadas. Vá para Home>Opções>Opções Globais, então selecione todas as opções em perfil de coluna.

    Captura de tela das opções globais com as seleções de perfil de coluna enfatizadas.

    Além disso, habilite a exibição diagrama usando as configurações de Layout na guia View na faixa de opções do editor Power Query ou selecionando o ícone de exibição de diagrama no lado inferior direito da janela Power Query.

    Captura de tela da aparência geral da visualização de diagrama do Power Query.

  2. Na tabela Pedidos, calcule o número total de pedidos por cliente: selecione a coluna CustomerID na visualização de dados e selecione Agrupar Por na guia Transformar na faixa de opções.

    Captura de tela mostrando a tabela Pedidos selecionada e Agrupar por destacado na guia Transformar.

  3. Você realizará uma contagem de linhas como a agregação em Agrupar por. Você pode aprender mais sobre as funcionalidades de Agrupar por em Agrupamento ou resumir linhas.

    Captura de tela de

  4. Após o agrupamento dos dados na tabela Pedidos, obteremos uma tabela de duas colunas com CustomerID e Contagem como colunas.

    Captura de tela da tabela de duas colunas.

  5. Em seguida, você deseja combinar os dados da tabela Clientes com a contagem de pedidos por cliente: selecione a consulta Clientes no Modo de Exibição de Diagrama e use o menu "⋮" para acessar a transformação Mesclar consultas como nova.

    Captura de tela do editor de fluxo de dados, com as reticências verticais da tabela Clientes e Mesclar consultas como novas enfatizadas.

  6. Configure a operação de mesclagem selecionando CustomerID como a coluna correspondente em ambas as tabelas. Depois, selecione Ok.

    Captura de tela da janela Mesclar.

    Captura de tela da janela Mesclar, com a tabela esquerda para mesclagem definida como a tabela Clientes e a tabela direita para mesclagem definida como a tabela Ordens. A coluna CustomerID é selecionada para as tabelas Clientes e Ordens. Além disso, o Tipo de Junção é definido como Esquerda Externa. Todas as outras seleções são definidas com seu valor padrão.

  7. Agora há uma nova consulta com todas as colunas da tabela Clientes e uma coluna com dados aninhados da tabela Pedidos.

    Captura de tela do editor de fluxo de dados com a nova consulta Merge adicionada à direita das tabelas Clientes e Pedidos.

  8. Vamos nos concentrar em apenas algumas colunas da tabela Clientes. Para fazer isso, ative o modo de exibição de esquema selecionando o botão de exibição de esquema no canto inferior direito do editor de fluxo de dados.

    Captura de tela do editor de fluxo de dados com o botão de exibição de esquema enfatizado no canto inferior direito.

  9. No modo de exibição de esquema, você verá todas as colunas em sua tabela. Selecione CustomerID, CompanyName e Orders (2). Em seguida, vá para a guia Ferramentas de esquema , selecione Remover colunas e escolha Remover outras colunas. Isso mantém apenas as colunas que você deseja.

    Captura de tela da exibição do esquema mostrando todos os nomes de coluna disponíveis, com as colunas CustomerID, CompanyName e Ordens (2) enfatizadas.

    Captura de tela do menu de ferramentas de esquema com Remover outras colunas enfatizado.

  10. A coluna Pedidos (2) contém detalhes extras da etapa de mesclagem. Para ver e usar esses dados, selecione o botão Mostrar exibição de dados no canto inferior direito, ao lado de Mostrar exibição de esquema. Em seguida, no cabeçalho da coluna Pedidos (2), selecione o ícone Expandir Coluna e escolha a coluna Contagem. Isso adiciona a contagem de pedidos para cada cliente à sua tabela.

    Captura de tela para usar a exibição de dados.

  11. Agora, vamos classificar seus clientes por quantos pedidos eles fizeram. Selecione a coluna Contagem e, em seguida, vá para a guia Adicionar Coluna e selecione a coluna Classificação. Isso adiciona uma nova coluna mostrando a classificação de cada cliente com base na contagem de pedidos.

    Captura de tela do editor de fluxo de dados com a coluna Contagem selecionada.

  12. Mantenha as configurações padrão em Coluna de Classificação. Em seguida, selecione OK para aplicar essa transformação.

    Captura de tela da janela Classificar com todas as configurações padrão exibidas.

  13. Agora renomeie a consulta resultante como Clientes classificados usando o painel Configurações da consulta no lado direito da tela.

    Captura de tela do editor de fluxo de dados com o nome Clientes Classificados enfatizado nas propriedades de configurações de consulta.

  14. Você está pronto para definir para onde seus dados vão. No painel Configurações de Consulta , role até a parte inferior e selecione Escolher destino de dados.

    Captura de tela do editor de fluxo de dados com a localização da seleção de destino de dados enfatizada.

  15. Você pode enviar seus resultados para um armazenamento de dados do tipo lakehouse se tiver um, ou ignorar esta etapa se não o fizer. Aqui, você pode escolher qual lakehouse e tabela usar para seus dados e escolher se deseja adicionar novos dados (Acrescentar) ou substituir o que está lá (Substituir).

    Captura de tela da janela Conectar ao destino de dados com o lakehouse selecionado.

    Captura de tela da janela Escolher configurações de destino.

  16. Seu fluxo de dados agora está pronto para ser publicado. Revise as consultas na exibição do diagrama e selecione Publicar.

    Captura de tela do editor de fluxo de dados com o botão Publicar no lado inferior direito enfatizado.

    Selecione Publicar no canto inferior direito para salvar o fluxo de dados. Você voltará ao seu workspace, onde um ícone de rotador ao lado do nome do fluxo de dados mostra que ele está publicando. Quando o spinner desaparecer, o fluxo de dados estará pronto para atualização!

    Importante

    Na primeira vez que você cria um Dataflow Gen2 em um workspace, o Fabric configura alguns componentes de suporte (Lakehouse e Warehouse) que ajudam na execução do Dataflow. Esses itens são compartilhados por todos os fluxos de dados no workspace e você não deve excluí-los. Eles não devem ser usados diretamente e geralmente não estão visíveis em seu workspace, mas você pode vê-los em outros lugares, como Notebooks ou análise de SQL. Procure nomes que começam com DataflowStaging para localizá-los.

  17. Em sua área de trabalho, selecione o ícone de Agendar Atualização.

    Captura de tela da área de trabalho com o ícone de atualização de agendamento enfatizado.

  18. Ative a atualização agendada, selecione Adicionar outro horário e configure a atualização conforme mostrado na captura de tela a seguir.

    Captura de tela mostrando como selecionar outro horário.

    Captura de tela das opções de atualização agendada, com a atualização agendada ativada, a frequência de atualização definida como Diária, o fuso horário definido como Horário Universal Coordenado (UTC) e a hora definida como às 4h. O botão Ativar, a seleção Adicionar outro horário, o proprietário do fluxo de dados e o botão Aplicar são enfatizados.

Limpar os recursos

Se você não pretende continuar usando esse fluxo de dados, exclua o fluxo de dados usando as etapas a seguir:

  1. Navegue até o espaço de trabalho do Microsoft Fabric.

  2. Selecione as reticências verticais ao lado do nome do fluxo de dados e selecione Excluir.

    Captura de tela com os três pontos verticais e a opção de exclusão no menu suspenso enfatizados.

  3. Selecione Excluir para confirmar a exclusão do seu fluxo de dados.

    Captura de tela da janela Excluir fluxo de dados, com o botão Excluir enfatizado.

O fluxo de dados neste exemplo mostra como carregar e transformar dados no Dataflow Gen2. Você aprendeu a:

  • Criar um Dataflow Gen2.
  • Transformar dados.
  • Defina as configurações de destino para dados transformados.
  • Execute e agende seu pipeline.

Avance para o próximo artigo para saber como criar seu primeiro pipeline.