voorbeeld

Retourneert een voorbeeldsubset van dit DataFrame.

Syntaxis

sample(withReplacement: Optional[Union[float, bool]] = None, fraction: Optional[Union[int, float]] = None, seed: Optional[int] = None)

Parameterwaarden

Kenmerk Typ Beschrijving
withReplacement bool, optioneel Voorbeeld met vervanging of niet (standaard False).
fraction float, optioneel Fractie van rijen die moeten worden gegenereerd, bereik [0.0, 1.0].
seed int, optioneel Zaad voor steekproeven (standaard een willekeurig zaad).

Retouren

DataFrame: Gesampampeerde rijen uit het opgegeven DataFrame.

Aantekeningen

Dit is niet gegarandeerd exact de fractie die is opgegeven van het totale aantal van het opgegeven DataFrame.

fraction is vereist en withReplacementseed is optioneel.

Examples

df = spark.range(0, 10, 1, 1)
df.sample(0.5, 3).count()
# 7
df.sample(fraction=0.5, seed=3).count()
# 4
df.sample(withReplacement=True, fraction=0.5, seed=3).count()
# 2
df.sample(1.0).count()
# 10
df.sample(fraction=1.0).count()
# 10
df.sample(False, fraction=1.0).count()
# 10