esparcir

Crea un gráfico de dispersión con un tamaño y un color de punto de marcador variables.

Las coordenadas de cada punto se definen mediante dos columnas DataFrame y se usan círculos rellenos para representar cada punto. Este tipo de trazado es útil para ver correlaciones complejas entre dos variables, como coordenadas 2D naturales, como longitud y latitud, o cualquier par de métricas que se puedan trazar entre sí.

Sintaxis

scatter(x, y, **kwargs)

Parámetros

Parámetro Tipo Descripción
x str Nombre de la columna que se va a usar como coordenadas horizontales para cada punto.
y str o lista de str Nombre de la columna que se va a usar como coordenadas verticales para cada punto.
**kwargs opcional Argumentos de palabra clave adicionales.

Devoluciones

plotly.graph_objs.Figure

Ejemplos

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ['length', 'width', 'species']
df = spark.createDataFrame(data, columns)
df.plot.scatter(x='length', y='width')