Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Returnerar col1 om det inte är NaN eller col2 om col1 är NaN. Båda indata ska vara flyttalskolumner (DoubleType eller FloatType). Stöder Spark Connect.
För motsvarande Databricks SQL-funktion, se nanvl funktion.
Syntax
from pyspark.sql import functions as dbf
dbf.nanvl(col1=<col1>, col2=<col2>)
Parameterar
| Parameter | Typ | Description |
|---|---|---|
col1 |
pyspark.sql.Column eller str |
Första kolumnen att kontrollera. |
col2 |
pyspark.sql.Column eller str |
Den andra kolumnen som returneras om den första är NaN. |
Retur
pyspark.sql.Column: värde från första kolumnen eller andra om det första är NaN .
Examples
from pyspark.sql import functions as dbf
df = spark.createDataFrame([(1.0, float('nan')), (float('nan'), 2.0)], ("a", "b"))
df.select("*", dbf.nanvl("a", "b"), dbf.nanvl(df.a, df.b)).show()
+---+---+-----------+-----------+
| a| b|nanvl(a, b)|nanvl(a, b)|
+---+---+-----------+-----------+
|1.0|NaN| 1.0| 1.0|
|NaN|2.0| 2.0| 2.0|
+---+---+-----------+-----------+