Isin

Vérifiez si la valeur de colonne se trouve dans une liste de valeurs.

Syntaxe

isin(*cols)

Paramètres

Paramètre Type Description
cols values Liste des valeurs à vérifier

Retours

Colonne (booléen)

Exemples

Exemple 1 : Filtrer les lignes avec des noms dans les valeurs spécifiées.

df = spark.createDataFrame([(2, "Alice"), (5, "Bob"), (8, "Mike")], ["age", "name"])
df[df.name.isin("Bob", "Mike")].orderBy("age").show()
# +---+----+
# |age|name|
# +---+----+
# |  5| Bob|
# |  8|Mike|
# +---+----+

Exemple 2 : Filtrer les lignes avec des âges dans la liste spécifiée.

df[df.age.isin([1, 2, 3])].show()
# +---+-----+
# |age| name|
# +---+-----+
# |  2|Alice|
# +---+-----+

Exemple 3 : Filtrer les lignes avec des noms non dans les valeurs spécifiées.

df[~df.name.isin("Alice", "Bob")].show()
# +---+----+
# |age|name|
# +---+----+
# |  8|Mike|
# +---+----+

Exemple 4 : Utiliser un DataFrame comme sous-requête IN.

df.where(df.age.isin(spark.range(6))).orderBy("age").show()
# +---+-----+
# |age| name|
# +---+-----+
# |  2|Alice|
# |  5|  Bob|
# +---+-----+