Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Returnerar en samplad delmängd av dataramen.
Syntax
sample(withReplacement: Optional[Union[float, bool]] = None, fraction: Optional[Union[int, float]] = None, seed: Optional[int] = None)
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
withReplacement |
bool, valfritt | Exempel med ersättning eller inte (standard False). |
fraction |
float, valfritt | Del av rader som ska genereras, intervall [0.0, 1.0]. |
seed |
int, valfritt | Frö för sampling (standard är ett slumpmässigt frö). |
Retur
DataFrame: Samplade rader från angiven DataFrame.
Notes
Detta är inte garanterat att ange exakt det bråk som angetts för det totala antalet dataramar.
fraction krävs och withReplacementseed är valfria.
Exempel
df = spark.range(0, 10, 1, 1)
df.sample(0.5, 3).count()
# 7
df.sample(fraction=0.5, seed=3).count()
# 4
df.sample(withReplacement=True, fraction=0.5, seed=3).count()
# 2
df.sample(1.0).count()
# 10
df.sample(fraction=1.0).count()
# 10
df.sample(False, fraction=1.0).count()
# 10