Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Skapar ett låd-och-whisker-diagram från DataFrame kolumner.
En lådritning är en metod för att grafiskt avbilda grupper av numeriska data via deras kvarttiler. Rutan sträcker sig från Q1 till Q3 kvartilvärden för data, med en linje vid medianvärdet (Q2). Morrhåren sträcker sig från boxens kanter för att visa dataområdet. Som standard utökar de inte mer än 1,5 × IQR (IQR = Q3 – Q1) från rutans kanter och slutar på den längsta datapunkten inom det intervallet. Extremvärden ritas som separata punkter.
Syntax
box(column=None, **kwargs)
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
column |
str eller lista över str, valfritt | Kolumnnamn eller lista med namn som ska användas för att skapa lådritningen. Om None (standard) används alla numeriska kolumner. |
**kwargs |
optional | Ytterligare nyckelordsargument. Stöder precision: en flyttal som används för att beräkna ungefärlig statistik för låddiagrammet. Förvald: 0.01. Använd mindre värden för mer exakt statistik. |
Retur
plotly.graph_objs.Figure
Exempel
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
("A", 50, 55),
("B", 55, 60),
("C", 60, 65),
("D", 65, 70),
("E", 70, 75),
("F", 10, 15),
("G", 85, 90),
("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()