Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Statistische functie: voegt binaire KllLongsSketch-weergaven samen en retourneert de samengevoegde schets. De optionele k-parameter bepaalt de grootte en nauwkeurigheid van de samengevoegde schets (bereik 8-65535). Als k niet is opgegeven, neemt de samengevoegde schets de k-waarde van de eerste invoerschets over.
Syntaxis
from pyspark.sql import functions as dbf
dbf.kll_merge_agg_bigint(col=<col>, k=<k>)
Parameterwaarden
| Kenmerk | Typologie | Description |
|---|---|---|
col |
pyspark.sql.Column of kolomnaam |
De kolom met binaire KllLongsSketch-weergaven. |
k |
pyspark.sql.Column of int, optioneel |
De k-parameter die de grootte en nauwkeurigheid bepaalt (bereik 8-65535). |
Retouren
pyspark.sql.Column: De samengevoegde binaire weergave van de KllLongsSketch.
Voorbeelden
from pyspark.sql import functions as dbf
df1 = spark.createDataFrame([1,2,3], "INT")
df2 = spark.createDataFrame([4,5,6], "INT")
sketch1 = df1.agg(dbf.kll_sketch_agg_bigint("value").alias("sketch"))
sketch2 = df2.agg(dbf.kll_sketch_agg_bigint("value").alias("sketch"))
merged = sketch1.union(sketch2).agg(dbf.kll_merge_agg_bigint("sketch").alias("merged"))
n = merged.select(dbf.kll_sketch_get_n_bigint("merged")).first()[0]
n
6