Condividi tramite


vector_sum funzione di aggregazione

Si applica a:check contrassegnato come sì Databricks Runtime 18.1 e versioni successive

Calcola la somma a livello di elemento dei vettori in un'aggregazione. Restituisce un vettore in cui ogni elemento è la somma degli elementi corrispondenti in tutti i vettori di input.

Sintassi

vector_sum(vectors) [FILTER ( WHERE cond ) ]

Arguments

  • vectors: colonna di ARRAY<FLOAT> espressioni che rappresentano vettori. Tutti i vettori devono avere la stessa dimensione.
  • cond: espressione booleana facoltativa che filtra le righe usate per l'aggregazione.

Restituzioni

Valore ARRAY<FLOAT> con la stessa dimensione dei vettori di input. Ogni elemento nel risultato è la somma degli elementi corrispondenti in tutti i vettori di input.

NULL i valori e i vettori non contenentiNULL un NULL elemento vengono ignorati nell'aggregazione. Restituisce NULL se tutti i valori del gruppo non sono validi (NULL oNULL non vettori con NULL elementi). Restituisce una matrice [] vuota se tutti i vettori di input sono vuoti.

Note

  • È supportato solo ARRAY<FLOAT> altri tipi, ARRAY<DOUBLE> ad esempio o ARRAY<DECIMAL> generano un errore.
  • Tutti i vettori di input devono avere la stessa dimensione; in caso contrario, la funzione genera VECTOR_DIMENSION_MISMATCH.
  • Un vettore non-NULL che contiene un NULL elemento viene considerato come NULL.

Condizioni di errore

Examples

-- Element-wise sum per category (with GROUP BY)
> SELECT category, vector_sum(embedding) AS sum_vector
    FROM vector_data
    GROUP BY category
    ORDER BY category;
  category: A, sum_vector: [5.0, 7.0, 9.0]
  category: B, sum_vector: [5.0, 3.0, 5.0]

-- Scalar aggregation (without GROUP BY)
> SELECT vector_sum(embedding) AS total_sum FROM vector_data;
  total_sum: [10.0, 10.0, 14.0]