Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Hiermee maakt u een spreidingsplot met verschillende grootte en kleur van markeringspunten.
De coördinaten van elk punt worden gedefinieerd door twee DataFrame-kolommen en gevulde cirkels worden gebruikt om elk punt weer te geven. Dit soort plot is handig voor het zien van complexe correlaties tussen twee variabelen, zoals natuurlijke 2D-coördinaten, zoals lengte- en breedtegraad, of een paar metrische gegevens die tegen elkaar kunnen worden uitgezet.
Syntaxis
scatter(x, y, **kwargs)
Parameterwaarden
| Kenmerk | Typ | Beschrijving |
|---|---|---|
x |
str | De naam van de kolom die moet worden gebruikt als horizontale coördinaten voor elk punt. |
y |
str of list of str | De naam van de kolom die moet worden gebruikt als verticale coördinaten voor elk punt. |
**kwargs |
optional | Aanvullende trefwoordargumenten. |
Retouren
plotly.graph_objs.Figure
Examples
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ['length', 'width', 'species']
df = spark.createDataFrame(data, columns)
df.plot.scatter(x='length', y='width')