Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Hiermee maakt u een box-and-whisker-plot op basis van DataFrame kolommen.
Een boxplot is een methode voor het grafisch weergeven van groepen numerieke gegevens via hun kwartielen. Het vak breidt zich uit van de kwartielwaarden van Q1 naar Q3 van de gegevens, met een lijn op de mediaan (Q2). De whiskers breiden zich uit vanaf de randen van het vak om het bereik van de gegevens weer te geven. Ze breiden standaard niet meer dan 1,5 × IQR (IQR = Q3 - Q1) uit vanaf de randen van het vak, eindigend op het dichtstbijzijnde gegevenspunt binnen dat interval. Uitbijters worden uitgezet als afzonderlijke puntjes.
Syntaxis
box(column=None, **kwargs)
Parameterwaarden
| Kenmerk | Typ | Beschrijving |
|---|---|---|
column |
str of list of str, optioneel | Kolomnaam of lijst met namen die moeten worden gebruikt voor het maken van de boxplot. Als None (standaard) worden alle numerieke kolommen gebruikt. |
**kwargs |
optional | Aanvullende trefwoordargumenten. Ondersteunt precision: een float die wordt gebruikt voor het berekenen van geschatte statistieken voor de boxplot. Standaard: 0.01. Gebruik kleinere waarden voor nauwkeurigere statistieken. |
Retouren
plotly.graph_objs.Figure
Examples
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
("A", 50, 55),
("B", 55, 60),
("C", 60, 65),
("D", 65, 70),
("E", 70, 75),
("F", 10, 15),
("G", 85, 90),
("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()