disperser

Crée un nuage de points avec une taille et une couleur de point de marqueur variables.

Les coordonnées de chaque point sont définies par deux colonnes DataFrame et les cercles remplis sont utilisés pour représenter chaque point. Ce type de tracé est utile pour voir des corrélations complexes entre deux variables, telles que des coordonnées 2D naturelles telles que la longitude et la latitude, ou toute paire de métriques qui peuvent être tracées les unes sur les autres.

Syntaxe

scatter(x, y, **kwargs)

Paramètres

Paramètre Type Description
x str Nom de colonne à utiliser comme coordonnées horizontales pour chaque point.
y str ou liste de str Nom de colonne à utiliser comme coordonnées verticales pour chaque point.
**kwargs optionnel Arguments de mot clé supplémentaires.

Retours

plotly.graph_objs.Figure

Exemples

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ['length', 'width', 'species']
df = spark.createDataFrame(data, columns)
df.plot.scatter(x='length', y='width')