kruistabel (DataFrameStatFunctions)

Berekent een frequentietabel met twee kolommen, ook wel bekend als een onvoorziene tabel. De eerste kolom van elke rij bevat de afzonderlijke waarden van col1en de kolomnamen zijn de afzonderlijke waarden van col2. De naam van de eerste kolom is $col1_$col2. Paren zonder exemplaren hebben een telling van nul. DataFrame.crosstab en DataFrameStatFunctions.crosstab zijn aliassen van elkaar.

Syntaxis

crosstab(col1, col2)

Parameterwaarden

Kenmerk	Typ	Beschrijving
`col1`	str	De naam van de eerste kolom. Afzonderlijke items vormen de eerste kolom van elke rij.
`col2`	str	De naam van de tweede kolom. Afzonderlijke items vormen de kolomnamen van het resulterende `DataFrame`item.

Retouren

DataFrame

Examples

df = spark.createDataFrame([(1, 11), (1, 11), (3, 10), (4, 8), (4, 8)], ["c1", "c2"])
df.stat.crosstab("c1", "c2").sort("c1_c2").show()
# +-----+---+---+---+
# |c1_c2| 10| 11|  8|
# +-----+---+---+---+
# |    1|  0|  2|  0|
# |    3|  1|  0|  0|
# |    4|  0|  0|  2|
# +-----+---+---+---+

Feedback

Is deze pagina nuttig?

Last updated on 2026-04-19