corr (DataFrameStatFunctions)

Berekent de correlatie van twee kolommen van een DataFrame als een dubbele waarde. Momenteel ondersteunt alleen de Pearson-correlatiecoëfficiënt. DataFrame.corr en DataFrameStatFunctions.corr zijn aliassen van elkaar.

Syntaxis

corr(col1, col2, method=None)

Parameterwaarden

Kenmerk Typ Beschrijving
col1 str De naam van de eerste kolom.
col2 str De naam van de tweede kolom.
method str, optioneel De correlatiemethode. "pearson" wordt momenteel alleen ondersteund.

Retouren

float

Examples

df = spark.createDataFrame([(1, 12), (10, 1), (19, 8)], ["c1", "c2"])
df.stat.corr("c1", "c2")
# -0.3592106040535498

df = spark.createDataFrame([(11, 12), (10, 11), (9, 10)], ["small", "bigger"])
df.stat.corr("small", "bigger")
# 1.0