Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Retourne la position de la première sous-chaîne dans la str chaîne qui correspond au regex regexp Java et correspondant à l’index de groupe regex.
Pour obtenir plus de détails sur la fonction SQL de Databricks correspondante, consultez regexp_instr.
Syntaxe
from pyspark.sql import functions as dbf
dbf.regexp_instr(str=<str>, regexp=<regexp>, idx=<idx>)
Paramètres
| Paramètre | Type | Descriptif |
|---|---|---|
str |
pyspark.sql.Column ou str |
colonne cible sur laquelle travailler. |
regexp |
pyspark.sql.Column ou str |
modèle regex à appliquer. |
idx |
pyspark.sql.Column ou int, optional |
ID de groupe correspondant. |
Examples
from pyspark.sql import functions as dbf
df = spark.createDataFrame([("1a 2b 14m", r"\d+(a|b|m)")], ["str", "regexp"])
df.select('*', dbf.regexp_instr('str', dbf.lit(r'\d+(a|b|m)'))).show()
df.select('*', dbf.regexp_instr('str', dbf.lit(r'\d+(a|b|m)'), dbf.lit(1))).show()
df.select('*', dbf.regexp_instr('str', dbf.col("regexp"))).show()
df.select('*', dbf.regexp_instr(dbf.col("str"), "regexp")).show()