fillna

Retourneert een nieuw DataFrame waarin null-waarden worden gevuld met een nieuwe waarde. DataFrame.fillna en DataFrameNaFunctions.fill zijn aliassen van elkaar.

Syntaxis

fillna(value: Union["LiteralType", Dict[str, "LiteralType"]], subset: Optional[Union[str, Tuple[str, ...], List[str]]] = None)

Parameterwaarden

Kenmerk Typ Beschrijving
value int, float, string, bool of dict de waarde waarmee null-waarden moeten worden vervangen. Als de waarde een dict is, subset wordt deze genegeerd en value moet het een toewijzing zijn van kolomnaam (tekenreeks) naar vervangingswaarde. De vervangende waarde moet een int, float, booleaanse waarde of tekenreeks zijn.
subset str, tuple of list, optioneel optionele lijst met kolomnamen die u kunt overwegen. Kolommen die zijn opgegeven in een subset die geen overeenkomende gegevenstypen hebben, worden genegeerd.

Retouren

DataFrame: DataFrame met vervangen null-waarden.

Examples

df = spark.createDataFrame([
    (10, 80.5, "Alice", None),
    (5, None, "Bob", None),
    (None, None, "Tom", None),
    (None, None, None, True)],
    schema=["age", "height", "name", "bool"])

df.na.fill(50).show()
# +---+------+-----+----+
# |age|height| name|bool|
# +---+------+-----+----+
# | 10|  80.5|Alice|NULL|
# |  5|  50.0|  Bob|NULL|
# | 50|  50.0|  Tom|NULL|
# | 50|  50.0| NULL|true|
# +---+------+-----+----+

df.na.fill(False).show()
# +----+------+-----+-----+
# | age|height| name| bool|
# +----+------+-----+-----+
# |  10|  80.5|Alice|false|
# |   5|  NULL|  Bob|false|
# |NULL|  NULL|  Tom|false|
# |NULL|  NULL| NULL| true|
# +----+------+-----+-----+

df.na.fill({'age': 50, 'name': 'unknown'}).show()
# +---+------+-------+----+
# |age|height|   name|bool|
# +---+------+-------+----+
# | 10|  80.5|  Alice|NULL|
# |  5|  NULL|    Bob|NULL|
# | 50|  NULL|    Tom|NULL|
# | 50|  NULL|unknown|true|
# +---+------+-------+----+