Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Retorna um subconjunto amostrado deste DataFrame.
Sintaxe
sample(withReplacement: Optional[Union[float, bool]] = None, fraction: Optional[Union[int, float]] = None, seed: Optional[int] = None)
Parâmetros
| Parâmetro | Tipo | Descrição |
|---|---|---|
withReplacement |
bool, opcional | Exemplo com substituição ou não (padrão False). |
fraction |
float, opcional | Fração de linhas a serem geradas, intervalo [0,0, 1,0]. |
seed |
int, opcional | Semente para amostragem (padrão uma semente aleatória). |
Devoluções
DataFrame: linhas amostradas do DataFrame especificado.
Observações
Isso não é garantido para fornecer exatamente a fração especificada da contagem total do DataFrame fornecido.
fraction é necessário e, withReplacement e seed são opcionais.
Exemplos
df = spark.range(0, 10, 1, 1)
df.sample(0.5, 3).count()
# 7
df.sample(fraction=0.5, seed=3).count()
# 4
df.sample(withReplacement=True, fraction=0.5, seed=3).count()
# 2
df.sample(1.0).count()
# 10
df.sample(fraction=1.0).count()
# 10
df.sample(False, fraction=1.0).count()
# 10