Compartilhar via


caixa

Cria um gráfico box-and-whisker a partir de DataFrame colunas.

Um gráfico de caixa é um método para ilustrar graficamente grupos de dados numéricos por meio de seus quartils. A caixa se estende dos valores de quartil do 1º ao 3º trimestre dos dados, com uma linha na mediana (Q2). Os bigodes se estendem das bordas da caixa para mostrar o intervalo dos dados. Por padrão, eles estendem no máximo 1,5 × IQR (IQR = Q3 – Q1) das bordas da caixa, terminando no ponto de dados mais distante dentro desse intervalo. Exceções são plotadas como pontos separados.

Sintaxe

box(column=None, **kwargs)

Parâmetros

Parâmetro Tipo Descrição
column str ou lista de str, opcional Nome da coluna ou lista de nomes a serem usados para criar o gráfico de caixa. Se None (padrão), todas as colunas numéricas serão usadas.
**kwargs opcional Argumentos de palavra-chave adicionais. Suporte: um float usado para calcular estatísticas precisionaproximadas para o gráfico de caixa. Padrão: 0.01. Use valores menores para estatísticas mais precisas.

Devoluções

plotly.graph_objs.Figure

Exemplos

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
    ("A", 50, 55),
    ("B", 55, 60),
    ("C", 60, 65),
    ("D", 65, 70),
    ("E", 70, 75),
    ("F", 10, 15),
    ("G", 85, 90),
    ("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()