nanvl

Retourneert col1 als dit niet NaN is, of col2 als col1 NaN is. Beide invoerwaarden moeten drijvendekommakolommen zijn (DoubleType of FloatType). Ondersteunt Spark Connect.

Voor de overeenkomstige Databricks SQL-functie, zie de nanvl functie.

Syntaxis

from pyspark.sql import functions as dbf

dbf.nanvl(col1=<col1>, col2=<col2>)

Parameterwaarden

Kenmerk Typologie Description
col1 pyspark.sql.Column of str Eerste kolom die moet worden gecontroleerd.
col2 pyspark.sql.Column of str Tweede kolom die moet worden geretourneerd als eerste NaN is.

Retouren

pyspark.sql.Column: waarde uit eerste kolom of tweede als eerste NaN is.

Voorbeelden

from pyspark.sql import functions as dbf
df = spark.createDataFrame([(1.0, float('nan')), (float('nan'), 2.0)], ("a", "b"))
df.select("*", dbf.nanvl("a", "b"), dbf.nanvl(df.a, df.b)).show()
+---+---+-----------+-----------+
|  a|  b|nanvl(a, b)|nanvl(a, b)|
+---+---+-----------+-----------+
|1.0|NaN|        1.0|        1.0|
|NaN|2.0|        2.0|        2.0|
+---+---+-----------+-----------+