Hist

Dessine un histogramme des DataFramecolonnes .

Un histogramme est une représentation de la distribution des données.

Syntaxe

hist(column=None, bins=10, **kwargs)

Paramètres

Paramètre Type Description
column str ou liste de str, facultatif Nom de colonne ou liste de noms à utiliser pour créer l’histogramme. Si None (valeur par défaut), toutes les colonnes numériques sont utilisées.
bins int, facultatif Nombre d’histogrammes à utiliser. Par défaut : 10.
**kwargs optionnel Arguments de mot clé supplémentaires.

Retours

plotly.graph_objs.Figure

Exemples

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ["length", "width", "species"]
df = spark.createDataFrame(data, columns)
df.plot.hist(bins=4)