Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Retourne une nouvelle valeur DataFrame dans laquelle les valeurs Null sont remplies avec une nouvelle valeur.
DataFrame.fillna et DataFrameNaFunctions.fill sont des alias les uns des autres.
Syntaxe
fill(value, subset=None)
Paramètres
| Paramètre | Type | Description |
|---|---|---|
value |
int, float, str, bool ou dict | Valeur à remplacer par des valeurs Null. Si un dict est fourni, subset est ignoré et value doit être un mappage du nom de colonne à la valeur de remplacement. Les valeurs de remplacement doivent être int, float, bool ou str. |
subset |
str, tuple ou list, facultatif | Noms de colonnes à prendre en compte. Les colonnes qui subset n’ont pas de type value de données correspondant sont ignorées. |
Retours
DataFrame
Exemples
df = spark.createDataFrame([
(10, 80.5, "Alice", None),
(5, None, "Bob", None),
(None, None, "Tom", None),
(None, None, None, True)],
schema=["age", "height", "name", "bool"])
Remplissez toutes les valeurs Null avec 50 pour les colonnes numériques.
df.na.fill(50).show()
# +---+------+-----+----+
# |age|height| name|bool|
# +---+------+-----+----+
# | 10| 80.5|Alice|NULL|
# | 5| 50.0| Bob|NULL|
# | 50| 50.0| Tom|NULL|
# | 50| 50.0| NULL|true|
# +---+------+-----+----+
Remplissez toutes les valeurs Null pour False les colonnes booléennes.
df.na.fill(False).show()
# +----+------+-----+-----+
# | age|height| name| bool|
# +----+------+-----+-----+
# | 10| 80.5|Alice|false|
# | 5| NULL| Bob|false|
# |NULL| NULL| Tom|false|
# |NULL| NULL| NULL| true|
# +----+------+-----+-----+
Remplissez les valeurs Null avec 50 pour age et "unknown" pour name.
df.na.fill({'age': 50, 'name': 'unknown'}).show()
# +---+------+-------+----+
# |age|height| name|bool|
# +---+------+-------+----+
# | 10| 80.5| Alice|NULL|
# | 5| NULL| Bob|NULL|
# | 50| NULL| Tom|NULL|
# | 50| NULL|unknown|true|
# +---+------+-------+----+
Remplissez toutes les valeurs "Spark" Null pour la name colonne.
df.na.fill(value='Spark', subset='name').show()
# +----+------+-----+----+
# | age|height| name|bool|
# +----+------+-----+----+
# | 10| 80.5|Alice|NULL|
# | 5| NULL| Bob|NULL|
# |NULL| NULL| Tom|NULL|
# |NULL| NULL|Spark|true|
# +----+------+-----+----+