Partilhar via


Guia de início rápido: crie seu primeiro fluxo de dados para obter e transformar dados

Os fluxos de dados são uma tecnologia de preparação de dados self-service, baseada na nuvem. Neste artigo, você cria seu primeiro fluxo de dados, obtém dados para seu fluxo de dados e, em seguida, transforma os dados e publica o fluxo de dados.

Pré-requisitos

Os seguintes pré-requisitos são necessários antes de começar:

Criar um fluxo de dados

Nesta seção, você está criando seu primeiro fluxo de dados.

Observação

Desde abril de 2026, todos os novos itens Dataflow Gen2 são criados com suporte de integração CI/CD e Git por padrão. A opção de criar itens Dataflow Gen2 sem suporte a CI/CD já não está disponível. Os fluxos de dados existentes que não são CI/CD continuam a funcionar.

  1. Navegue até ao seu espaço de trabalho Microsoft Fabric navegando até ao portal Microsoft Fabric, selecione Espaços de Trabalho no painel de navegação esquerdo e depois selecione o seu espaço de trabalho na lista.

  2. Selecione +Novo item e, em seguida, selecione Dataflow Gen2.

    Captura de tela com a seleção Dataflow Gen2 enfatizada.

Obter Dados

Vamos obter alguns dados! Neste exemplo, você está obtendo dados de um serviço OData. Use as etapas a seguir para obter dados em seu fluxo de dados.

  1. No editor de fluxo de dados, selecione Obter dados e, em seguida, selecione Mais.

    Captura de tela com a opção Obter dados selecionada e Mais enfatizada na caixa suspensa.

  2. Em Escolher fonte de dados, selecione Exibir mais.

    Captura de ecrã da função Obter fonte de dados com Ver mais enfatizado.

  3. Em Nova fonte, selecione Outra>OData como a fonte de dados.

    Captura de ecrã de Obter fonte de dados com a categoria Outro e o conector OData enfatizado.

  4. Introduza o URL https://services.odata.org/v4/northwind/northwind.svc/e, em seguida, selecione Seguinte.

    Captura de tela da fonte de dados OData onde você insere a URL de dados.

  5. Selecione as tabelas Pedidos e Clientes e, em seguida, selecione Criar.

    Captura de ecrã do navegador de Power Query com as tabelas de Clientes e Encomendas enfatizadas.

Pode saber mais sobre a experiência e funcionalidade de obtenção de dados na visão geral de obtenção de dados.

Aplicar transformações e publicar

Você carregou seus dados em seu primeiro fluxo de dados. Parabéns;! Agora é hora de aplicar algumas transformações para trazer esses dados para a forma que precisamos.

Transformas os dados no editor Power Query. Pode encontrar uma visão detalhada do editor de Power Query em A interface de utilizador do Power Query, mas esta secção leva-o através dos passos básicos:

  1. Verifique se as ferramentas de Criação de Perfil de Dados estão ativadas. Aceda Início>Opções>Opções Globais, e, em seguida, selecione todas as opções em Perfil de coluna.

    Captura de tela das opções globais com as seleções de perfil de coluna enfatizadas.

    Certifica-te também de ativar a vista diagrama usando as configurações de Layout no separador View na fita do editor de Power Query, ou selecionando o ícone da vista diagrama no canto inferior direito da janela Power Query.

    Captura de ecrã do aspeto geral da vista de diagrama Power Query.

  2. Na tabela Pedidos, calcule o número total de pedidos por cliente: selecione a coluna ID do Cliente na visualização de dados e, em seguida, selecione Agrupar por na guia Transformar na faixa de opções.

    Captura de ecrã que mostra a tabela Pedidos selecionada e Agrupar por destacada na guia Transformar.

  3. Você executa uma contagem de linhas como a agregação dentro de Group By. Você pode saber mais sobre os recursos Agrupar por em Agrupar ou resumir linhas.

    Captura de ecrã de Agrupar por, com a operação Contar linhas selecionada.

  4. Depois de agrupar os dados na tabela Pedidos, obteremos uma tabela de duas colunas com CustomerID e Count como as colunas.

    Captura de ecrã da tabela de duas colunas.

  5. Em seguida, pretende-se combinar os dados da tabela Clientes com a Contagem de pedidos por cliente: Selecione a consulta Clientes na Vista de Diagrama e use o menu "⋮" para acessar a transformação Mesclar consultas como nova.

    Captura de tela do editor de fluxo de dados, com as reticências verticais da tabela Clientes e as consultas Mesclar como novas enfatizadas.

  6. Configure a operação Mesclar selecionando CustomerID como a coluna correspondente em ambas as tabelas. Em seguida, selecione Ok.

    Captura de ecrã da janela Mesclar.

    Captura de ecrã da janela de Mesclagem, com a tabela Esquerda para mesclagem definida como a tabela Clientes e a tabela Direita para mesclagem definida como a tabela Pedidos. A coluna CustomerID é selecionada para as tabelas Clientes e Pedidos. Além disso, o tipo de junção está definido como Left outer. Todas as outras seleções são definidas com seu valor padrão.

  7. Agora há uma nova consulta com todas as colunas da tabela Clientes e uma coluna com dados aninhados da tabela Pedidos.

    Captura de tela do editor de fluxo de dados com a nova consulta Mesclar adicionada à direita das tabelas Clientes e Pedidos.

  8. Vamos nos concentrar em apenas algumas colunas da tabela Clientes. Para fazer isso, ative a exibição de esquema selecionando o botão de exibição de esquema no canto inferior direito do editor de fluxo de dados.

    Captura de tela do editor de fluxo de dados com o botão de exibição de esquema enfatizado no canto inferior direito.

  9. No modo de exibição de esquema, você verá todas as colunas da tabela. Selecione CustomerID, CompanyName e Orders (2). Em seguida, vá para a guia Ferramentas de esquema , selecione Remover colunas e escolha Remover outras colunas. Isso mantém apenas as colunas desejadas.

    Captura de tela da exibição de esquema mostrando todos os nomes de colunas disponíveis, com as colunas CustomerID, CompanyName e Orders (2) enfatizadas.

    Captura de ecrã do menu de ferramentas de esquema com

  10. A coluna Pedidos (2) contém detalhes adicionais da etapa de mesclagem. Para ver e usar esses dados, selecione o botão Mostrar exibição de dados no canto inferior direito, ao lado de Mostrar exibição de esquema. Em seguida, no cabeçalho da coluna Pedidos (2), selecione o ícone Expandir coluna e escolha a coluna Contagem . Isso adiciona o número de pedidos de cada cliente à sua tabela.

    Captura de ecrã para utilizar a vista de dados.

  11. Agora vamos classificar seus clientes por quantos pedidos eles fizeram. Selecione a coluna Contagem , vá para a guia Adicionar coluna e selecione Coluna de classificação. Isso adiciona uma nova coluna mostrando a classificação de cada cliente com base na contagem de pedidos.

    Captura de tela do editor de fluxo de dados com a coluna Contagem selecionada.

  12. Mantenha as configurações padrão na Coluna de Classificação. Em seguida, selecione OK para aplicar essa transformação.

    Captura de tela da janela Classificação com todas as configurações padrão exibidas.

  13. Agora, renomeie a consulta resultante como Clientes Classificados usando o painel de Configurações de Consulta no lado direito da tela.

    Captura de tela do editor de fluxo de dados com o nome Clientes classificados enfatizado nas propriedades de configurações de consulta.

  14. Você está pronto para definir para onde seus dados vão. No painel Configurações de consulta , role até a parte inferior e selecione Escolher destino dos dados.

    Captura de tela do editor de fluxo de dados com o local da seleção de destino de dados enfatizado.

  15. Você pode enviar seus resultados para uma casa do lago, se tiver um, ou pular esta etapa se não tiver. Aqui, você pode escolher qual lakehouse e tabela usar para seus dados e escolher se deseja adicionar novos dados (Acrescentar) ou substituir o que está lá (Substituir).

    Captura de tela da janela Conectar ao destino de dados com lakehouse selecionada.

    Captura de ecrã da janela Escolher definições de destino.

  16. Seu fluxo de dados agora está pronto para ser publicado. Reveja as consultas na vista de diagrama e, em seguida, selecione Publicar.

    Captura de tela do editor de fluxo de dados com o botão Publicar no lado inferior direito enfatizado.

    Selecione Publicar no canto inferior direito para salvar seu fluxo de dados. Você voltará ao seu espaço de trabalho, onde um ícone giratório ao lado do nome do fluxo de dados mostra que ele está sendo publicado. Quando o girador desaparece, seu fluxo de dados está pronto para ser atualizado!

    Importante

    Na primeira vez que crias um Dataflow Gen2 num espaço de trabalho, o Fabric configura alguns itens em segundo plano (Lakehouse e Warehouse) que ajudam o teu fluxo de dados a funcionar. Esses itens são compartilhados por todos os fluxos de dados no espaço de trabalho e você não deve excluí-los. Eles não devem ser usados diretamente e geralmente não são visíveis em seu espaço de trabalho, mas você pode vê-los em outros lugares, como Blocos de Anotações ou análise SQL. Procure nomes que comecem por DataflowStaging para identificá-los.

  17. No espaço de trabalho, selecione o ícone Agendar atualização .

    Captura de tela do espaço de trabalho com o ícone de atualização de agenda enfatizado.

  18. Ative a atualização agendada, selecione Adicionar outra hora e configure a atualização conforme mostrado na captura de tela a seguir.

    Captura de ecrã a mostrar como selecionar outra hora.

    Captura de ecrã das opções de atualização agendada, com a atualização agendada ativada, a frequência de atualização definida como Diária, o Fuso horário definido como hora universal coordenada e a Hora definida como 4:00 AM. O botão ativado, a seleção Adicionar outra hora, o proprietário do fluxo de dados e o botão aplicar são enfatizados.

Limpar recursos

Se você não vai continuar a usar esse fluxo de dados, exclua o fluxo de dados usando as seguintes etapas:

  1. Navegue até ao seu espaço de trabalho Microsoft Fabric.

  2. Selecione as reticências verticais ao lado do nome do seu fluxo de dados e, em seguida, selecione Excluir.

    Captura de tela com os três pontos verticais e a opção de exclusão no menu suspenso enfatizada.

  3. Selecione Excluir para confirmar a exclusão do seu fluxo de dados.

    Captura de tela da janela Excluir fluxo de dados, com o botão Excluir enfatizado.

O fluxo de dados neste exemplo mostra como carregar e transformar dados no Dataflow Gen2. Aprendeu a:

  • Crie um fluxo de dados Gen2.
  • Transforme dados.
  • Configure as configurações de destino para dados transformados.
  • Execute e agende seu pipeline.

Avance para o próximo artigo para saber como criar seu primeiro pipeline.