Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Returnerar en ny DataFrame som ersätter ett värde med ett annat värde.
DataFrame.replace och DataFrameNaFunctions.replace är alias för varandra. Värden to_replace och värde måste ha samma typ och får bara vara numeriska värden, booleska värden eller strängar. Värdet kan ha Ingen. När du byter ut omvandlas det nya värdet till den befintliga kolumnens typ.
Syntax
replace(to_replace: Union["LiteralType", List["LiteralType"], Dict["LiteralType", "OptionalPrimitiveType"]], value: Optional[Union["OptionalPrimitiveType", List["OptionalPrimitiveType"]]] = _NoValue, subset: Optional[List[str]] = None)
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
to_replace |
bool, int, float, string, list eller dict | värdet som ska ersättas. Om värdet är en diktering value ignoreras eller kan utelämnas och to_replace måste vara en mappning mellan ett värde och en ersättning. |
value |
bool, int, float, string eller None, valfritt | Ersättningsvärdet måste vara en bool, int, float, string eller None. Om value är en lista value bör vara av samma längd och typ som to_replace. Om value är en skalär och to_replace är en sekvens används den value som ersättning för varje objekt i to_replace. |
subset |
list, valfritt | valfri lista över kolumnnamn att överväga. Kolumner som anges i delmängden som inte har matchande datatyper ignoreras. |
Retur
DataFrame: DataFrame med ersatta värden.
Exempel
df = spark.createDataFrame([
(10, 80, "Alice"),
(5, None, "Bob"),
(None, 10, "Tom"),
(None, None, None)],
schema=["age", "height", "name"])
df.na.replace(10, 20).show()
# +----+------+-----+
# | age|height| name|
# +----+------+-----+
# | 20| 80|Alice|
# | 5| NULL| Bob|
# |NULL| 20| Tom|
# |NULL| NULL| NULL|
# +----+------+-----+
df.na.replace('Alice', None).show()
# +----+------+----+
# | age|height|name|
# +----+------+----+
# | 10| 80|NULL|
# | 5| NULL| Bob|
# |NULL| 10| Tom|
# |NULL| NULL|NULL|
# +----+------+----+
df.na.replace(['Alice', 'Bob'], ['A', 'B'], 'name').show()
# +----+------+----+
# | age|height|name|
# +----+------+----+
# | 10| 80| A|
# | 5| NULL| B|
# |NULL| 10| Tom|
# |NULL| NULL|NULL|
# +----+------+----+