Hist

Ritar ett histogram över kolumnerna DataFrame.

Ett histogram är en representation av fördelningen av data.

Syntax

hist(column=None, bins=10, **kwargs)

Parameters

Parameter Type Beskrivning
column str eller lista över str, valfritt Kolumnnamn eller lista över namn som ska användas för att skapa histogrammet. Om None (standard) används alla numeriska kolumner.
bins int, valfritt Antal histogram som ska användas. Förvald: 10.
**kwargs optional Ytterligare nyckelordsargument.

Retur

plotly.graph_objs.Figure

Exempel

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ["length", "width", "species"]
df = spark.createDataFrame(data, columns)
df.plot.hist(bins=4)