låda

Skapar ett låd-och-whisker-diagram från DataFrame kolumner.

En lådritning är en metod för att grafiskt avbilda grupper av numeriska data via deras kvarttiler. Rutan sträcker sig från Q1 till Q3 kvartilvärden för data, med en linje vid medianvärdet (Q2). Morrhåren sträcker sig från boxens kanter för att visa dataområdet. Som standard utökar de inte mer än 1,5 × IQR (IQR = Q3 – Q1) från rutans kanter och slutar på den längsta datapunkten inom det intervallet. Extremvärden ritas som separata punkter.

Syntax

box(column=None, **kwargs)

Parameters

Parameter Type Beskrivning
column str eller lista över str, valfritt Kolumnnamn eller lista med namn som ska användas för att skapa lådritningen. Om None (standard) används alla numeriska kolumner.
**kwargs optional Ytterligare nyckelordsargument. Stöder precision: en flyttal som används för att beräkna ungefärlig statistik för låddiagrammet. Förvald: 0.01. Använd mindre värden för mer exakt statistik.

Retur

plotly.graph_objs.Figure

Exempel

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
    ("A", 50, 55),
    ("B", 55, 60),
    ("C", 60, 65),
    ("D", 65, 70),
    ("E", 70, 75),
    ("F", 10, 15),
    ("G", 85, 90),
    ("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()