Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Crée un nuage de points avec une taille et une couleur de point de marqueur variables.
Les coordonnées de chaque point sont définies par deux colonnes DataFrame et les cercles remplis sont utilisés pour représenter chaque point. Ce type de tracé est utile pour voir des corrélations complexes entre deux variables, telles que des coordonnées 2D naturelles telles que la longitude et la latitude, ou toute paire de métriques qui peuvent être tracées les unes sur les autres.
Syntaxe
scatter(x, y, **kwargs)
Paramètres
| Paramètre | Type | Description |
|---|---|---|
x |
str | Nom de colonne à utiliser comme coordonnées horizontales pour chaque point. |
y |
str ou liste de str | Nom de colonne à utiliser comme coordonnées verticales pour chaque point. |
**kwargs |
optionnel | Arguments de mot clé supplémentaires. |
Retours
plotly.graph_objs.Figure
Exemples
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ['length', 'width', 'species']
df = spark.createDataFrame(data, columns)
df.plot.scatter(x='length', y='width')