Compartilhar via


dispersão

Cria um gráfico de dispersão com tamanho e cor de ponto de marcador variável.

As coordenadas de cada ponto são definidas por duas colunas DataFrame e círculos preenchidos são usados para representar cada ponto. Esse tipo de gráfico é útil para ver correlações complexas entre duas variáveis, como coordenadas 2D naturais, como longitude e latitude, ou qualquer par de métricas que possam ser plotadas entre si.

Sintaxe

scatter(x, y, **kwargs)

Parâmetros

Parâmetro Tipo Descrição
x str Nome da coluna a ser usada como coordenadas horizontais para cada ponto.
y str ou lista de str Nome da coluna a ser usada como coordenadas verticais para cada ponto.
**kwargs opcional Argumentos de palavra-chave adicionais.

Devoluções

plotly.graph_objs.Figure

Exemplos

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ['length', 'width', 'species']
df = spark.createDataFrame(data, columns)
df.plot.scatter(x='length', y='width')