Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Retourneert een voorbeeldsubset van dit DataFrame.
Syntaxis
sample(withReplacement: Optional[Union[float, bool]] = None, fraction: Optional[Union[int, float]] = None, seed: Optional[int] = None)
Parameterwaarden
| Kenmerk | Typ | Beschrijving |
|---|---|---|
withReplacement |
bool, optioneel | Voorbeeld met vervanging of niet (standaard False). |
fraction |
float, optioneel | Fractie van rijen die moeten worden gegenereerd, bereik [0.0, 1.0]. |
seed |
int, optioneel | Zaad voor steekproeven (standaard een willekeurig zaad). |
Retouren
DataFrame: Gesampampeerde rijen uit het opgegeven DataFrame.
Aantekeningen
Dit is niet gegarandeerd exact de fractie die is opgegeven van het totale aantal van het opgegeven DataFrame.
fraction is vereist en withReplacementseed is optioneel.
Examples
df = spark.range(0, 10, 1, 1)
df.sample(0.5, 3).count()
# 7
df.sample(fraction=0.5, seed=3).count()
# 4
df.sample(withReplacement=True, fraction=0.5, seed=3).count()
# 2
df.sample(1.0).count()
# 10
df.sample(fraction=1.0).count()
# 10
df.sample(False, fraction=1.0).count()
# 10