Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Ritar ett histogram över kolumnerna DataFrame.
Ett histogram är en representation av fördelningen av data.
Syntax
hist(column=None, bins=10, **kwargs)
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
column |
str eller lista över str, valfritt | Kolumnnamn eller lista över namn som ska användas för att skapa histogrammet. Om None (standard) används alla numeriska kolumner. |
bins |
int, valfritt | Antal histogram som ska användas. Förvald: 10. |
**kwargs |
optional | Ytterligare nyckelordsargument. |
Retur
plotly.graph_objs.Figure
Exempel
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ["length", "width", "species"]
df = spark.createDataFrame(data, columns)
df.plot.hist(bins=4)