Acelerar a preparação de dados com o Data Wrangler no Microsoft Fabric

O Data Wrangler acelera seu fluxo de trabalho de preparação de dados fornecendo uma interface visual imersiva para análise exploratória de dados. Neste artigo, você aprenderá a:

Iniciar o Data Wrangler a partir do notebook Fabric
Explorar dados com visualizações interativas e estatísticas de resumo
Aplicar operações comuns de limpeza de dados com geração automática de código
Exportar funções reutilizáveis de pandas ou PySpark de volta para seu notebook

Este artigo se concentra no Pandas DataFrames. Para DataFrames do Spark, consulte este recurso.

Pré-requisitos

Obtenha uma assinatura do Microsoft Fabric. Ou, inscreva-se para uma avaliação gratuita do Microsoft Fabric.
Entre no Microsoft Fabric.
Alterne para o Fabric usando o alternador de experiências no canto inferior esquerdo da página inicial.

Limitações

Atualmente, as operações de código personalizadas dão suporte apenas a DataFrames Pandas.
A exibição do Data Wrangler funciona melhor em monitores grandes. No entanto, você pode minimizar ou ocultar diferentes partes da interface para acomodar telas menores.

Como iniciar o Data Wrangler

Você pode iniciar o Data Wrangler diretamente de um notebook do Microsoft Fabric para explorar e transformar qualquer DataFrame do pandas ou do Spark.

Para começar a usar dados de exemplo:

Este snippet de código demonstra como realizar a leitura de dados de amostra em um DataFrame do Pandas:

import pandas as pd

# Read a CSV into a Pandas DataFrame
df = pd.read_csv("https://raw.githubusercontent.com/plotly/datasets/master/titanic.csv")
display(df)

Na guia "Página Inicial" da faixa de opções do notebook, use a lista suspensa Data Wrangler para navegar pelos DataFrames ativos do notebook disponíveis para edição. Selecione o que você deseja abrir no Data Wrangler.

Dica

Você não pode abrir o Data Wrangler enquanto o kernel do notebook está ocupado. Uma célula em execução deve ser concluída antes que o Data Wrangler possa ser iniciado, conforme mostrado nesta captura de tela:

Iniciar o Data Wrangler a partir de uma célula

Você também pode abrir o Data Wrangler diretamente de uma célula de notebook, sem navegar até a faixa de opções. Esse ponto de entrada embutido apresenta o Data Wrangler exatamente onde você trabalha com DataFrames.

Quando você executa uma célula que gera um DataFrame, um prompt do Data Wrangler é exibido no nível da célula. Selecione o prompt para abrir esse DataFrame no Data Wrangler. Os comandos com suporte incluem:

df.head() ou df.head(n)
df.tail() ou df.tail(n)
df.show() ou df.show(n)

Execute uma célula que gera um DataFrame:

import pandas as pd

df = pd.read_csv("https://raw.githubusercontent.com/plotly/datasets/master/titanic.csv")
df.head()

Depois que a célula terminar a execução, um prompt do Data Wrangler aparecerá na célula. Selecione Abrir no Data Wrangler para iniciar o Data Wrangler com o df DataFrame.

Quando uma célula define vários DataFrames, o prompt fornece um submenu que lista todos os DataFrames na célula. Você pode abrir qualquer um deles no Data Wrangler , mesmo aqueles que você não imprimiu explicitamente.

Execute uma célula que define vários DataFrames:

import pandas as pd

titanic_df = pd.read_csv("https://raw.githubusercontent.com/plotly/datasets/master/titanic.csv")
iris_df = pd.read_csv("https://raw.githubusercontent.com/plotly/datasets/master/iris-data.csv")
titanic_df.head()
iris_df.head()

Depois que a célula terminar de executar, selecione o prompt do Data Wrangler na célula. Um submenu lista todos os DataFrames definidos na célula. Selecione aquele que você deseja explorar.

Dica

O submenu lista DataFrames definidos na célula atual. Para acessar um DataFrame de uma célula anterior, execute uma nova célula que faça referência a ele — ou use o menu suspenso do Data Wrangler na guia Página Inicial da faixa de opções para navegar por todos os DataFrames ativos.

Como escolher exemplos personalizados

Para abrir um exemplo personalizado de qualquer DataFrame ativo com o Data Wrangler, selecione Escolher exemplo personalizado na lista suspensa, conforme mostrado nesta captura de tela:

Essa ação abre uma caixa de diálogo com opções para especificar o tamanho da amostra desejada (número de linhas) e o método de amostragem (primeiros registros, últimos registros ou um conjunto aleatório). As primeiras 5 mil linhas do DataFrame servem como o tamanho padrão da amostra, conforme mostrado nesta captura de tela:

Exibindo estatísticas de resumo

Quando o Data Wrangler é carregado, ele exibe uma visão geral descritiva do DataFrame escolhido no painel Resumo . Essa visão geral inclui informações sobre as dimensões dataframe, valores ausentes e muito mais. Quando você seleciona qualquer coluna na grade do Data Wrangler, o painel Resumo é atualizado para exibir estatísticas descritivas sobre essa coluna específica. Insights rápidos sobre cada coluna também estão disponíveis no cabeçalho dela.

Dica

As estatísticas e visuais específicos da coluna (no painel Resumo e nos cabeçalhos de coluna) dependem do tipo de dados da coluna. Por exemplo, um histograma agrupado de uma coluna numérica aparece no cabeçalho da coluna somente se a coluna estiver convertida para um tipo numérico, conforme mostrado nesta captura de tela:

Operações de limpeza de dados de navegação

O painel Operações fornece uma lista pesquisável de operações de limpeza de dados. Ao selecionar uma operação de limpeza de dados no painel Operações , você precisará fornecer uma coluna ou coluna de destino, juntamente com todos os parâmetros necessários para concluir a operação. Por exemplo, a solicitação para escalar numericamente uma coluna requer um novo intervalo de valores, conforme mostrado nesta captura de tela:

Dica

É possível aplicar uma seleção reduzida de operações usando o menu de cada cabeçalho de coluna, como mostrado nesta captura de tela:

Visualizar e aplicar operações

A grade de exibição do Data Wrangler realiza uma pré-visualização automática dos resultados de uma operação selecionada, e o código correspondente aparece automaticamente no painel abaixo da grade. Para confirmar o código visualizado, selecione Aplicar em qualquer local. Para excluir o código visualizado e tentar uma nova operação, selecione Descartar , conforme mostrado nesta captura de tela:

Depois de aplicar uma operação, a grade de exibição do Data Wrangler e as estatísticas resumidas são atualizadas para refletir os resultados. O código aparece na lista de operações confirmadas em execução no painel Etapas de Limpeza, conforme mostrado nesta captura de tela.

Dica

É possível desfazer a última etapa aplicada a qualquer momento.. No painel Etapas de Limpeza , um ícone de lixeira aparece quando você passa o cursor sobre a etapa aplicada mais recentemente, conforme mostrado nesta captura de tela:

Esta tabela faz um resumo das operações com suporte por parte do Data Wrangler atualmente:

Operação	Descrição
Sort	Classificar uma coluna em ordem crescente ou decrescente
Filter	Filtrar linhas com base em uma ou mais condições
Codificação One-Hot	Criar novas colunas para cada valor exclusivo em uma coluna existente, indicando a presença ou ausência desses valores por linha
Binarizador de múltiplos rótulos	Dividir dados usando um separador e criar novas colunas para cada categoria, marcando 1 se uma linha tiver essa categoria e 0 se não tiver
Alterar tipo de coluna	Alterar o tipo de dados de uma coluna
Excluir coluna	Exclua uma ou mais colunas
Selecionar coluna	Escolher uma ou mais colunas para manter e excluir o restante
Renomear coluna	Renomear uma coluna
Descartar valores ausentes	Remover linhas com valores ausentes
Remover linhas duplicadas	Remover todas as linhas que têm valores duplicados em uma ou mais colunas
Preencher valores ausentes	Substituir os valores ausentes nas células por um novo valor
Localizar e substituir	Substituir células por aquelas que correspondem exatamente ao padrão
Agrupar por coluna e agregação	Agrupar por valores de coluna e agregar os resultados
Remover espaço em branco	Remover espaço em branco do início e do fim do texto
Dividir o texto	Dividir uma coluna em várias colunas com base em um delimitador definido pelo usuário
Converter texto em minúsculas	Converter texto em minúsculas
Converter texto em maiúsculas	Converter texto em MAIÚSCULAS
Valores mín./máx. da escala	Dimensionar uma coluna numérica entre um valor mínimo e máximo
Preenchimento relâmpago	Criar automaticamente uma nova coluna com base em exemplos derivados de uma coluna existente

Personalizar sua exibição

A qualquer momento, você pode personalizar a interface usando a guia "Exibições" na barra de ferramentas acima da grade de exibição do Data Wrangler. Essa opção pode ocultar ou mostrar painéis diferentes com base em suas preferências e tamanho de tela, conforme mostrado nesta captura de tela:

Salvar e exportar código

A barra de ferramentas acima da grade de exibição do Data Wrangler fornece opções para salvar o código gerado. Você pode copiar o código para a área de transferência ou exportá-lo diretamente para o notebook como uma função. Exportar o código fecha o Data Wrangler e adiciona a nova função a uma célula de código no notebook. Você também pode baixar o DataFrame limpo como um arquivo CSV.

Dica

O Data Wrangler gera um código que é executado somente quando você executa manualmente a nova célula e não substitui o DataFrame original, conforme mostrado nesta captura de tela:

Em seguida, você pode realizar a execução do código exportado, conforme mostrado nesta captura de tela:

Próximas etapas

Agora que você sabe como usar o Data Wrangler com o Pandas DataFrames, explore estes recursos:

Usar o Data Wrangler com DataFrames do Spark – Aplicar as mesmas técnicas ao Spark DataFrames
Assistir a uma demonstração ao vivo – Veja o Data Wrangler em ação com Guy in a Cube
Experimentar o Wrangler de Dados no VS Code – Usar o Wrangler de Dados no Visual Studio Code

Deseja fazer comentários? Compartilhe suas ideias no fórum Ideias do Fabric.

Comentários

Esta página foi útil?

Last updated on 2026-05-20

Acelerar a preparação de dados com o Data Wrangler no Microsoft Fabric

Pré-requisitos

Limitações

Como iniciar o Data Wrangler

Iniciar o Data Wrangler a partir de uma célula

Como escolher exemplos personalizados

Exibindo estatísticas de resumo

Operações de limpeza de dados de navegação

Visualizar e aplicar operações

Personalizar sua exibição

Salvar e exportar código

Próximas etapas

Comentários

Recursos adicionais