kruistabel (DataFrame)

Berekent een frequentietabel met twee kolommen. Ook wel bekend als een onvoorziene tabel. De eerste kolom van elke rij is de afzonderlijke waarden van col1 en de kolomnamen zijn de afzonderlijke waarden van col2. De naam van de eerste kolom is $col1_$col2. Paren die geen exemplaren hebben, hebben nul als hun aantallen. DataFrame.crosstab en DataFrameStatFunctions.crosstab aliassen zijn.

Syntaxis

crosstab(col1: str, col2: str)

Parameterwaarden

Kenmerk	Typ	Beschrijving
`col1`	str	De naam van de eerste kolom. Afzonderlijke items maken het eerste item van elke rij.
`col2`	str	De naam van de tweede kolom. Afzonderlijke items maken de kolomnamen van het DataFrame.

Retouren

DataFrame: Frequentiematrix van twee kolommen.

Examples

df = spark.createDataFrame([(1, 11), (1, 11), (3, 10), (4, 8), (4, 8)], ["c1", "c2"])
df.crosstab("c1", "c2").sort("c1_c2").show()
# +-----+---+---+---+
# |c1_c2| 10| 11|  8|
# +-----+---+---+---+
# |    1|  0|  2|  0|
# |    3|  1|  0|  0|
# |    4|  0|  0|  2|
# +-----+---+---+---+

Feedback

Is deze pagina nuttig?

Last updated on 2026-04-19