Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Berekent de correlatie van twee kolommen van een DataFrame als een dubbele waarde. Momenteel ondersteunt alleen de Pearson-correlatiecoëfficiënt.
DataFrame.corr en DataFrameStatFunctions.corr zijn aliassen van elkaar.
Syntaxis
corr(col1, col2, method=None)
Parameterwaarden
| Kenmerk | Typ | Beschrijving |
|---|---|---|
col1 |
str | De naam van de eerste kolom. |
col2 |
str | De naam van de tweede kolom. |
method |
str, optioneel | De correlatiemethode.
"pearson" wordt momenteel alleen ondersteund. |
Retouren
float
Examples
df = spark.createDataFrame([(1, 12), (10, 1), (19, 8)], ["c1", "c2"])
df.stat.corr("c1", "c2")
# -0.3592106040535498
df = spark.createDataFrame([(11, 12), (10, 11), (9, 10)], ["small", "bigger"])
df.stat.corr("small", "bigger")
# 1.0