Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Cria um gráfico de dispersão com tamanho e cor de ponto de marcador variável.
As coordenadas de cada ponto são definidas por duas colunas DataFrame e círculos preenchidos são usados para representar cada ponto. Esse tipo de gráfico é útil para ver correlações complexas entre duas variáveis, como coordenadas 2D naturais, como longitude e latitude, ou qualquer par de métricas que possam ser plotadas entre si.
Sintaxe
scatter(x, y, **kwargs)
Parâmetros
| Parâmetro | Tipo | Descrição |
|---|---|---|
x |
str | Nome da coluna a ser usada como coordenadas horizontais para cada ponto. |
y |
str ou lista de str | Nome da coluna a ser usada como coordenadas verticais para cada ponto. |
**kwargs |
opcional | Argumentos de palavra-chave adicionais. |
Devoluções
plotly.graph_objs.Figure
Exemplos
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ['length', 'width', 'species']
df = spark.createDataFrame(data, columns)
df.plot.scatter(x='length', y='width')