regexp_instr

Retourne la position de la première sous-chaîne dans la str chaîne qui correspond au regex regexp Java et correspondant à l’index de groupe regex.

Pour obtenir plus de détails sur la fonction SQL de Databricks correspondante, consultez regexp_instr.

Syntaxe

from pyspark.sql import functions as dbf

dbf.regexp_instr(str=<str>, regexp=<regexp>, idx=<idx>)

Paramètres

Paramètre	Type	Descriptif
`str`	`pyspark.sql.Column` ou `str`	colonne cible sur laquelle travailler.
`regexp`	`pyspark.sql.Column` ou `str`	modèle regex à appliquer.
`idx`	`pyspark.sql.Column` ou `int, optional`	ID de groupe correspondant.

Examples

from pyspark.sql import functions as dbf
df = spark.createDataFrame([("1a 2b 14m", r"\d+(a|b|m)")], ["str", "regexp"])

df.select('*', dbf.regexp_instr('str', dbf.lit(r'\d+(a|b|m)'))).show()
df.select('*', dbf.regexp_instr('str', dbf.lit(r'\d+(a|b|m)'), dbf.lit(1))).show()
df.select('*', dbf.regexp_instr('str', dbf.col("regexp"))).show()
df.select('*', dbf.regexp_instr(dbf.col("str"), "regexp")).show()

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2026-04-27