Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Devuelve un subconjunto muestreado de este DataFrame.
Sintaxis
sample(withReplacement: Optional[Union[float, bool]] = None, fraction: Optional[Union[int, float]] = None, seed: Optional[int] = None)
Parámetros
| Parámetro | Tipo | Descripción |
|---|---|---|
withReplacement |
bool, opcional | Ejemplo con reemplazo o no (valor predeterminado False). |
fraction |
float, opcional | Fracción de filas que se van a generar, intervalo [0,0, 1,0]. |
seed |
int, opcional | Inicialización para el muestreo (valor predeterminado de una inicialización aleatoria). |
Devoluciones
DataFrame: filas de ejemplo de dataframe dadas.
Notas
Esto no se garantiza que proporcione exactamente la fracción especificada del recuento total del dataframe especificado.
fraction es obligatorio y, withReplacement y seed son opcionales.
Ejemplos
df = spark.range(0, 10, 1, 1)
df.sample(0.5, 3).count()
# 7
df.sample(fraction=0.5, seed=3).count()
# 4
df.sample(withReplacement=True, fraction=0.5, seed=3).count()
# 2
df.sample(1.0).count()
# 10
df.sample(fraction=1.0).count()
# 10
df.sample(False, fraction=1.0).count()
# 10