Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Crée un tracé box-and-whisker à partir de DataFrame colonnes.
Un tracé de zone est une méthode permettant de représenter graphiquement des groupes de données numériques par le biais de leurs quartiles. La zone s’étend des valeurs Q1 à Q3 quartile des données, avec une ligne à la médiane (Q2). Les moustaches s’étendent des bords de la zone pour afficher la plage des données. Par défaut, ils n’étendent pas plus de 1,5 × IQR (IQR = Q3 - Q1) à partir des bords de la zone, se terminant au point de données le plus éloigné dans cet intervalle. Les valeurs hors norme sont tracées sous forme de points distincts.
Syntaxe
box(column=None, **kwargs)
Paramètres
| Paramètre | Type | Description |
|---|---|---|
column |
str ou liste de str, facultatif | Nom de colonne ou liste de noms à utiliser pour créer le tracé de zone. Si None (valeur par défaut), toutes les colonnes numériques sont utilisées. |
**kwargs |
optionnel | Arguments de mot clé supplémentaires. Prend en charge precision: float utilisé pour calculer des statistiques approximatives pour le tracé de zone. Par défaut : 0.01. Utilisez des valeurs plus petites pour des statistiques plus précises. |
Retours
plotly.graph_objs.Figure
Exemples
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
("A", 50, 55),
("B", 55, 60),
("C", 60, 65),
("D", 65, 70),
("E", 70, 75),
("F", 10, 15),
("G", 85, 90),
("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()