exempel

Returnerar en samplad delmängd av dataramen.

Syntax

sample(withReplacement: Optional[Union[float, bool]] = None, fraction: Optional[Union[int, float]] = None, seed: Optional[int] = None)

Parameters

Parameter Type Beskrivning
withReplacement bool, valfritt Exempel med ersättning eller inte (standard False).
fraction float, valfritt Del av rader som ska genereras, intervall [0.0, 1.0].
seed int, valfritt Frö för sampling (standard är ett slumpmässigt frö).

Retur

DataFrame: Samplade rader från angiven DataFrame.

Notes

Detta är inte garanterat att ange exakt det bråk som angetts för det totala antalet dataramar.

fraction krävs och withReplacementseed är valfria.

Exempel

df = spark.range(0, 10, 1, 1)
df.sample(0.5, 3).count()
# 7
df.sample(fraction=0.5, seed=3).count()
# 4
df.sample(withReplacement=True, fraction=0.5, seed=3).count()
# 2
df.sample(1.0).count()
# 10
df.sample(fraction=1.0).count()
# 10
df.sample(False, fraction=1.0).count()
# 10