fillna

Returnerar en ny DataFrame som null-värden fylls med nytt värde. DataFrame.fillna och DataFrameNaFunctions.fill är alias för varandra.

Syntax

fillna(value: Union["LiteralType", Dict[str, "LiteralType"]], subset: Optional[Union[str, Tuple[str, ...], List[str]]] = None)

Parameters

Parameter Type Beskrivning
value int, float, string, bool eller dict värdet som null-värden ska ersättas med. Om värdet är en diktering ignoreras det subset och value måste vara en mappning från kolumnnamn (sträng) till ersättningsvärde. Ersättningsvärdet måste vara en int, float, boolesk eller sträng.
subset str, tuppeln eller listan, valfritt valfri lista över kolumnnamn att överväga. Kolumner som anges i delmängden som inte har matchande datatyper ignoreras.

Retur

DataFrame: DataFrame med ersatta null-värden.

Exempel

df = spark.createDataFrame([
    (10, 80.5, "Alice", None),
    (5, None, "Bob", None),
    (None, None, "Tom", None),
    (None, None, None, True)],
    schema=["age", "height", "name", "bool"])

df.na.fill(50).show()
# +---+------+-----+----+
# |age|height| name|bool|
# +---+------+-----+----+
# | 10|  80.5|Alice|NULL|
# |  5|  50.0|  Bob|NULL|
# | 50|  50.0|  Tom|NULL|
# | 50|  50.0| NULL|true|
# +---+------+-----+----+

df.na.fill(False).show()
# +----+------+-----+-----+
# | age|height| name| bool|
# +----+------+-----+-----+
# |  10|  80.5|Alice|false|
# |   5|  NULL|  Bob|false|
# |NULL|  NULL|  Tom|false|
# |NULL|  NULL| NULL| true|
# +----+------+-----+-----+

df.na.fill({'age': 50, 'name': 'unknown'}).show()
# +---+------+-------+----+
# |age|height|   name|bool|
# +---+------+-------+----+
# | 10|  80.5|  Alice|NULL|
# |  5|  NULL|    Bob|NULL|
# | 50|  NULL|    Tom|NULL|
# | 50|  NULL|unknown|true|
# +---+------+-------+----+