Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Crea un gráfico de dispersión con un tamaño y un color de punto de marcador variables.
Las coordenadas de cada punto se definen mediante dos columnas DataFrame y se usan círculos rellenos para representar cada punto. Este tipo de trazado es útil para ver correlaciones complejas entre dos variables, como coordenadas 2D naturales, como longitud y latitud, o cualquier par de métricas que se puedan trazar entre sí.
Sintaxis
scatter(x, y, **kwargs)
Parámetros
| Parámetro | Tipo | Descripción |
|---|---|---|
x |
str | Nombre de la columna que se va a usar como coordenadas horizontales para cada punto. |
y |
str o lista de str | Nombre de la columna que se va a usar como coordenadas verticales para cada punto. |
**kwargs |
opcional | Argumentos de palabra clave adicionales. |
Devoluciones
plotly.graph_objs.Figure
Ejemplos
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ['length', 'width', 'species']
df = spark.createDataFrame(data, columns)
df.plot.scatter(x='length', y='width')