Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Gera um gráfico KDE (Estimativa de Densidade de Kernel) usando kernels gaussianos.
Nas estatísticas, a estimativa de densidade de kernel é uma maneira não paramétrica de estimar a função de densidade de probabilidade (PDF) de uma variável aleatória. Essa função usa kernels gaussianos e inclui determinação automática de largura de banda.
Sintaxe
kde(bw_method, column=None, ind=None, **kwargs)
Parâmetros
| Parâmetro | Tipo | Descrição |
|---|---|---|
bw_method |
int ou float | O método usado para calcular a largura de banda do avaliador. Consulte KernelDensity no PySpark para obter mais informações. |
column |
str ou lista de str, opcional | Nome da coluna ou lista de nomes a serem usados para criar o gráfico KDE. Se None (padrão), todas as colunas numéricas serão usadas. |
ind |
lista de float, matriz NumPy ou int, opcional | Pontos de avaliação para o PDF estimado. Se None (padrão), 1000 pontos espaçados igualmente são usados. Se uma matriz NumPy, o KDE será avaliado nesses pontos. Se um inteiro, muitos pontos igualmente espaçados serão usados. |
**kwargs |
opcional | Argumentos de palavra-chave adicionais. |
Devoluções
plotly.graph_objs.Figure
Exemplos
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ["length", "width", "species"]
df = spark.createDataFrame(data, columns)
df.plot.kde(bw_method=0.3, ind=100)