strooien

Hiermee maakt u een spreidingsplot met verschillende grootte en kleur van markeringspunten.

De coördinaten van elk punt worden gedefinieerd door twee DataFrame-kolommen en gevulde cirkels worden gebruikt om elk punt weer te geven. Dit soort plot is handig voor het zien van complexe correlaties tussen twee variabelen, zoals natuurlijke 2D-coördinaten, zoals lengte- en breedtegraad, of een paar metrische gegevens die tegen elkaar kunnen worden uitgezet.

Syntaxis

scatter(x, y, **kwargs)

Parameterwaarden

Kenmerk Typ Beschrijving
x str De naam van de kolom die moet worden gebruikt als horizontale coördinaten voor elk punt.
y str of list of str De naam van de kolom die moet worden gebruikt als verticale coördinaten voor elk punt.
**kwargs optional Aanvullende trefwoordargumenten.

Retouren

plotly.graph_objs.Figure

Examples

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ['length', 'width', 'species']
df = spark.createDataFrame(data, columns)
df.plot.scatter(x='length', y='width')