doos

Hiermee maakt u een box-and-whisker-plot op basis van DataFrame kolommen.

Een boxplot is een methode voor het grafisch weergeven van groepen numerieke gegevens via hun kwartielen. Het vak breidt zich uit van de kwartielwaarden van Q1 naar Q3 van de gegevens, met een lijn op de mediaan (Q2). De whiskers breiden zich uit vanaf de randen van het vak om het bereik van de gegevens weer te geven. Ze breiden standaard niet meer dan 1,5 × IQR (IQR = Q3 - Q1) uit vanaf de randen van het vak, eindigend op het dichtstbijzijnde gegevenspunt binnen dat interval. Uitbijters worden uitgezet als afzonderlijke puntjes.

Syntaxis

box(column=None, **kwargs)

Parameterwaarden

Kenmerk Typ Beschrijving
column str of list of str, optioneel Kolomnaam of lijst met namen die moeten worden gebruikt voor het maken van de boxplot. Als None (standaard) worden alle numerieke kolommen gebruikt.
**kwargs optional Aanvullende trefwoordargumenten. Ondersteunt precision: een float die wordt gebruikt voor het berekenen van geschatte statistieken voor de boxplot. Standaard: 0.01. Gebruik kleinere waarden voor nauwkeurigere statistieken.

Retouren

plotly.graph_objs.Figure

Examples

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
    ("A", 50, 55),
    ("B", 55, 60),
    ("C", 60, 65),
    ("D", 65, 70),
    ("E", 70, 75),
    ("F", 10, 15),
    ("G", 85, 90),
    ("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()