Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Dessine un histogramme des DataFramecolonnes .
Un histogramme est une représentation de la distribution des données.
Syntaxe
hist(column=None, bins=10, **kwargs)
Paramètres
| Paramètre | Type | Description |
|---|---|---|
column |
str ou liste de str, facultatif | Nom de colonne ou liste de noms à utiliser pour créer l’histogramme. Si None (valeur par défaut), toutes les colonnes numériques sont utilisées. |
bins |
int, facultatif | Nombre d’histogrammes à utiliser. Par défaut : 10. |
**kwargs |
optionnel | Arguments de mot clé supplémentaires. |
Retours
plotly.graph_objs.Figure
Exemples
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ["length", "width", "species"]
df = spark.createDataFrame(data, columns)
df.plot.hist(bins=4)