boîte

Crée un tracé box-and-whisker à partir de DataFrame colonnes.

Un tracé de zone est une méthode permettant de représenter graphiquement des groupes de données numériques par le biais de leurs quartiles. La zone s’étend des valeurs Q1 à Q3 quartile des données, avec une ligne à la médiane (Q2). Les moustaches s’étendent des bords de la zone pour afficher la plage des données. Par défaut, ils n’étendent pas plus de 1,5 × IQR (IQR = Q3 - Q1) à partir des bords de la zone, se terminant au point de données le plus éloigné dans cet intervalle. Les valeurs hors norme sont tracées sous forme de points distincts.

Syntaxe

box(column=None, **kwargs)

Paramètres

Paramètre Type Description
column str ou liste de str, facultatif Nom de colonne ou liste de noms à utiliser pour créer le tracé de zone. Si None (valeur par défaut), toutes les colonnes numériques sont utilisées.
**kwargs optionnel Arguments de mot clé supplémentaires. Prend en charge precision: float utilisé pour calculer des statistiques approximatives pour le tracé de zone. Par défaut : 0.01. Utilisez des valeurs plus petites pour des statistiques plus précises.

Retours

plotly.graph_objs.Figure

Exemples

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
    ("A", 50, 55),
    ("B", 55, 60),
    ("C", 60, 65),
    ("D", 65, 70),
    ("E", 70, 75),
    ("F", 10, 15),
    ("G", 85, 90),
    ("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()