Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Crea un trazado de cajas y bigotes a partir de DataFrame columnas.
Un gráfico de cuadros es un método para representar gráficamente grupos de datos numéricos a través de sus cuartiles. El cuadro se extiende de los valores de cuartil Q1 a Q3 de los datos, con una línea en la mediana (Q2). Los bigotes se extienden desde los bordes de la caja para mostrar el intervalo de los datos. De forma predeterminada, no extienden más de 1,5 × IQR (IQR = Q3 - Q1) desde los bordes del cuadro, finalizando en el punto de datos más lejano dentro de ese intervalo. Los valores atípicos se trazan como puntos independientes.
Sintaxis
box(column=None, **kwargs)
Parámetros
| Parámetro | Tipo | Descripción |
|---|---|---|
column |
str o lista de str, opcional | Nombre de columna o lista de nombres que se van a usar para crear el trazado de cuadros. Si None es (valor predeterminado), se usan todas las columnas numéricas. |
**kwargs |
opcional | Argumentos de palabra clave adicionales. Admite precision: un valor float usado para calcular estadísticas aproximadas para el trazado de cuadros. Predeterminado: 0.01. Use valores más pequeños para obtener estadísticas más precisas. |
Devoluciones
plotly.graph_objs.Figure
Ejemplos
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
("A", 50, 55),
("B", 55, 60),
("C", 60, 65),
("D", 65, 70),
("E", 70, 75),
("F", 10, 15),
("G", 85, 90),
("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()