nanvl

Returnerar col1 om det inte är NaN eller col2 om col1 är NaN. Båda indata ska vara flyttalskolumner (DoubleType eller FloatType). Stöder Spark Connect.

För motsvarande Databricks SQL-funktion, se nanvl funktion.

Syntax

from pyspark.sql import functions as dbf

dbf.nanvl(col1=<col1>, col2=<col2>)

Parameterar

Parameter Typ Description
col1 pyspark.sql.Column eller str Första kolumnen att kontrollera.
col2 pyspark.sql.Column eller str Den andra kolumnen som returneras om den första är NaN.

Retur

pyspark.sql.Column: värde från första kolumnen eller andra om det första är NaN .

Examples

from pyspark.sql import functions as dbf
df = spark.createDataFrame([(1.0, float('nan')), (float('nan'), 2.0)], ("a", "b"))
df.select("*", dbf.nanvl("a", "b"), dbf.nanvl(df.a, df.b)).show()
+---+---+-----------+-----------+
|  a|  b|nanvl(a, b)|nanvl(a, b)|
+---+---+-----------+-----------+
|1.0|NaN|        1.0|        1.0|
|NaN|2.0|        2.0|        2.0|
+---+---+-----------+-----------+