Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Retourneert een nieuw DataFrame dat een waarde vervangt door een andere waarde.
DataFrame.replace en DataFrameNaFunctions.replace zijn aliassen van elkaar. Waarden to_replace en waarde moeten hetzelfde type hebben en kunnen alleen numerieke waarden, booleaanse waarden of tekenreeksen zijn. De waarde kan geen hebben. Bij het vervangen wordt de nieuwe waarde omgezet in het type van de bestaande kolom.
Syntaxis
replace(to_replace: Union["LiteralType", List["LiteralType"], Dict["LiteralType", "OptionalPrimitiveType"]], value: Optional[Union["OptionalPrimitiveType", List["OptionalPrimitiveType"]]] = _NoValue, subset: Optional[List[str]] = None)
Parameterwaarden
| Kenmerk | Typ | Beschrijving |
|---|---|---|
to_replace |
bool, int, float, tekenreeks, lijst of dict | de waarde die moet worden vervangen. Als de waarde een dict is, value wordt deze genegeerd of kan worden weggelaten en to_replace moet een toewijzing tussen een waarde en een vervanging zijn. |
value |
bool, int, float, string of None, optioneel | De vervangingswaarde moet een bool, int, float, string of None zijn. Als value dit een lijst is, value moet deze dezelfde lengte en hetzelfde type hebben als to_replace. Als value een scalaire waarde is en to_replace een reeks is, wordt deze value gebruikt als vervanging voor elk item in to_replace. |
subset |
lijst, optioneel | optionele lijst met kolomnamen die u kunt overwegen. Kolommen die zijn opgegeven in een subset die geen overeenkomende gegevenstypen hebben, worden genegeerd. |
Retouren
DataFrame: DataFrame met vervangen waarden.
Examples
df = spark.createDataFrame([
(10, 80, "Alice"),
(5, None, "Bob"),
(None, 10, "Tom"),
(None, None, None)],
schema=["age", "height", "name"])
df.na.replace(10, 20).show()
# +----+------+-----+
# | age|height| name|
# +----+------+-----+
# | 20| 80|Alice|
# | 5| NULL| Bob|
# |NULL| 20| Tom|
# |NULL| NULL| NULL|
# +----+------+-----+
df.na.replace('Alice', None).show()
# +----+------+----+
# | age|height|name|
# +----+------+----+
# | 10| 80|NULL|
# | 5| NULL| Bob|
# |NULL| 10| Tom|
# |NULL| NULL|NULL|
# +----+------+----+
df.na.replace(['Alice', 'Bob'], ['A', 'B'], 'name').show()
# +----+------+----+
# | age|height|name|
# +----+------+----+
# | 10| 80| A|
# | 5| NULL| B|
# |NULL| 10| Tom|
# |NULL| NULL|NULL|
# +----+------+----+