Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Retourneert de positie van de eerste subtekenreeks in de tekenreeks die overeenkomt met de str Java-regex regexp en die overeenkomt met de regex-groepsindex.
Voor de overeenkomstige Databricks SQL-functie, zie de regexp_instr functie.
Syntaxis
from pyspark.sql import functions as dbf
dbf.regexp_instr(str=<str>, regexp=<regexp>, idx=<idx>)
Parameterwaarden
| Kenmerk | Typologie | Description |
|---|---|---|
str |
pyspark.sql.Column of str |
doelkolom waaraan moet worden gewerkt. |
regexp |
pyspark.sql.Column of str |
regex-patroon dat moet worden toegepast. |
idx |
pyspark.sql.Column of int, optional |
overeenkomende groeps-id. |
Voorbeelden
from pyspark.sql import functions as dbf
df = spark.createDataFrame([("1a 2b 14m", r"\d+(a|b|m)")], ["str", "regexp"])
df.select('*', dbf.regexp_instr('str', dbf.lit(r'\d+(a|b|m)'))).show()
df.select('*', dbf.regexp_instr('str', dbf.lit(r'\d+(a|b|m)'), dbf.lit(1))).show()
df.select('*', dbf.regexp_instr('str', dbf.col("regexp"))).show()
df.select('*', dbf.regexp_instr(dbf.col("str"), "regexp")).show()