Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Gäller för:
Databricks Runtime 18.1 och senare
Skapar en Datasketches TupleSketch från nyckel/värde-par där nycklar används för distinkt räkning och dubbla sammanfattningsvärden aggregeras enligt det angivna läget.
Syntax
tuple_sketch_agg_double ( key, summary [, lgNomEntries [, mode ]] )
Arguments
-
nyckel: Uttrycket för unik värderäkning. Godkända typer är
INTEGER,LONG,FLOAT,DOUBLE,STRING,BINARY,ARRAY<INTEGER>ochARRAY<LONG>. -
sammanfattning: Ett
DOUBLEvärde som ska associeras med och aggregeras för varje nyckel. -
lgNomEntries: En valfri
INTEGERliteral som anger log-base-2 för nominella poster. Måste vara mellan 4 och 26, inklusive. Standardvärdet är 12 (4 096 bucketar). Högre värden ger bättre noggrannhet men använder mer minne. -
mode: En valfri
STRINGliteral som anger aggregeringsläget för sammanfattningar. Giltiga värden:'sum','min','max','alwaysone'. Standardvärdet är'sum'.
Retur
Ett BINARY värde som innehåller den serialiserade kompakta TupleSketch med dubbla sammanfattningar.
Noteringar
-
NULLnyckel- eller sammanfattningsvärden ignoreras under aggregering. - Tomma strängar, tomma bytematriser och tomma matriser ignoreras för nycklar.
- Parametrarna
lgNomEntriesochmodemåste vara konstanta värden. - Använd tuple_sketch_estimate_double för att hämta den distinkta uppskattningen av antalet.
- Använd tuple_sketch_summary_double för att hämta det aggregerade sammanfattningsvärdet.
Vanliga felvillkor
Exempel
-- Create sketch with sum mode (default)
> SELECT tuple_sketch_estimate_double(tuple_sketch_agg_double(key, summary, 12, 'sum')) FROM VALUES (1, 5.0D), (1, 1.0D), (2, 2.0D), (2, 3.0D), (3, 2.2D) tab(key, summary);
3.0
-- Get aggregated summary
> SELECT tuple_sketch_summary_double(tuple_sketch_agg_double(key, summary)) FROM VALUES (1, 1.0D), (1, 2.0D), (2, 3.0D) tab(key, summary);
6.0