Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Calcula a correlação de duas colunas de um DataFrame como um valor duplo. Atualmente, só dá suporte ao Coeficiente de Correlação pearson.
DataFrame.corr e DataFrameStatFunctions.corr são aliases uns dos outros.
Sintaxe
corr(col1, col2, method=None)
Parâmetros
| Parâmetro | Tipo | Descrição |
|---|---|---|
col1 |
str | O nome da primeira coluna. |
col2 |
str | O nome da segunda coluna. |
method |
str, opcional | O método de correlação. No momento, há suporte somente para "pearson". |
Devoluções
float
Exemplos
df = spark.createDataFrame([(1, 12), (10, 1), (19, 8)], ["c1", "c2"])
df.stat.corr("c1", "c2")
# -0.3592106040535498
df = spark.createDataFrame([(11, 12), (10, 11), (9, 10)], ["small", "bigger"])
df.stat.corr("small", "bigger")
# 1.0