Aprenda a gerar embeddings

Uma incorporação é um formato especial de representação de dados que pode ser facilmente utilizado por modelos e algoritmos de aprendizagem automática. A incorporação é uma representação densa em informação do significado semântico de um texto. Cada embedding é um vetor de números em ponto flutuante, de forma que a distância entre dois embeddings no espaço vetorial está correlacionada com a similaridade semântica entre duas entradas no formato original. Por exemplo, se dois textos são semelhantes, então as suas representações vetoriais também devem ser semelhantes. Embeddings impulsionam a pesquisa de similaridade de vetores em bases de dados Azure como Azure Cosmos DB para NoSQL, Azure Cosmos DB para MongoDB vCore, Base de Dados SQL do Azure ou Base de Dados do Azure para PostgreSQL - Flexible Server.

Pré-requisitos

Um modelo de embedding Azure OpenAI implementado.
Os seguintes valores do seu recurso:
- Endpoint, por exemplo, https://YOUR-RESOURCE-NAME.openai.azure.com/.
- Chave API.
- Nome da implementação do modelo.

Para orientações de configuração mais específicas da linguagem, consulte Azure Linguagens de programação suportadas pela OpenAI.

Como obter embeddings

Para obter um vetor de incorporação para um trecho de texto, faça um pedido ao endpoint de embeddings, conforme mostrado nos seguintes excertos de código:

Nota

A API de embeddings do Azure OpenAI não suporta atualmente o Microsoft Entra ID com a API v1. Use autenticação por chave API para os exemplos deste artigo.

using OpenAI;
using OpenAI.Embeddings;
using System.ClientModel;

EmbeddingClient client = new(
    "text-embedding-3-small",
    credential: new ApiKeyCredential("API-KEY"),
    options: new OpenAIClientOptions()
    {

        Endpoint = new Uri("https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1")
    }
);

string input = "This is a test";

OpenAIEmbedding embedding = client.GenerateEmbedding(input);
ReadOnlyMemory<float> vector = embedding.ToFloats();
Console.WriteLine($"Embeddings: [{string.Join(", ", vector.ToArray())}]");

package main

import (
	"context"
	"fmt"
	"os"

	"github.com/openai/openai-go/v2"
	"github.com/openai/openai-go/v2/option"
)

func main() {
	// Get API key from environment variable
	apiKey := os.Getenv("AZURE_OPENAI_API_KEY")
	if apiKey == "" {
		panic("AZURE_OPENAI_API_KEY environment variable is not set")
	}

	// Create a client with Azure OpenAI endpoint and API key
	client := openai.NewClient(
		option.WithBaseURL("https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/"),
		option.WithAPIKey(apiKey),
	)

	ctx := context.Background()
	text := "The attention mechanism revolutionized natural language processing"

	// Make an embedding request
	embedding, err := client.Embeddings.New(ctx, openai.EmbeddingNewParams{
		Input: openai.EmbeddingNewParamsInputUnion{OfString: openai.String(text)},
		Model: "text-embedding-3-large", // Use your deployed model name on Azure
	})
	if err != nil {
		panic(err.Error())
	}

	// Print embedding information
	fmt.Printf("Model: %s\n", embedding.Model)
	fmt.Printf("Number of embeddings: %d\n", len(embedding.Data))
	fmt.Printf("Embedding dimensions: %d\n", len(embedding.Data[0].Embedding))
	fmt.Printf("Usage - Prompt tokens: %d, Total tokens: %d\n", embedding.Usage.PromptTokens, embedding.Usage.TotalTokens)
	
	// Print first few values of the embedding vector
	fmt.Printf("First 10 embedding values: %v\n", embedding.Data[0].Embedding[:10])
}

import OpenAI from "openai";
const client = new OpenAI({
    baseURL: "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/",
    apiKey: process.env['OPENAI_API_KEY'] //Your Azure OpenAI API key
});

const embedding = await client.embeddings.create({
  model: "text-embedding-3-small",
  input: "Your text string goes here",
});

console.log(embedding);

import os
from openai import OpenAI

client = OpenAI(
  api_key = os.getenv("AZURE_OPENAI_API_KEY"),  
  base_url="https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/"
)

response = client.embeddings.create(
    input = "Your text string goes here",
    model= "text-embedding-3-large"
)

print(response.model_dump_json(indent=2))

# Azure OpenAI metadata variables
$openai = @{
    api_key     = $Env:AZURE_OPENAI_API_KEY
    api_base    = $Env:AZURE_OPENAI_ENDPOINT # your endpoint should look like the following https://YOUR_RESOURCE_NAME.openai.azure.com/
    name        = 'YOUR-DEPLOYMENT-NAME-HERE' #This will correspond to the custom name you chose for your deployment when you deployed a model.
}

$headers = [ordered]@{
    'api-key' = $openai.api_key
}

$text = 'Your text string goes here'

$body = [ordered]@{
    input = $text
	model = $openai.name
} | ConvertTo-Json

$url = "$($openai.api_base)/openai/v1/embeddings"

$response = Invoke-RestMethod -Uri $url -Headers $headers -Body $body -Method Post -ContentType 'application/json'
return $response.data.embedding

curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/v1/embeddings \
  -H 'Content-Type: application/json' \
  -H 'api-key: YOUR_API_KEY' \
	-d '{"model": "YOUR-DEPLOYMENT-NAME", "input": "Sample Document goes here"}'

Melhores práticas

Verifique se as entradas não excedem o comprimento máximo

O comprimento máximo do texto de entrada para os nossos modelos de embedding mais recentes é de 8.192 tokens. Deves verificar se as tuas entradas não ultrapassam esse limite antes de fazeres um pedido.
Se enviar um array de entradas num único pedido de embedding, o tamanho máximo do array é 2048.
Ao enviar um array de entradas num único pedido, lembre-se que o número de tokens por minuto nos seus pedidos deve manter-se abaixo do limite de quota atribuído na implementação do modelo. Por defeito, os modelos de embeddings mais recentes de terceira geração estão sujeitos a um limite de 350 K TPM por região.

Resolução de problemas

Se aparecer um erro 401 ou 403, confirme que a chave API é válida para o recurso.
Se aparecer um 404 erro, confirme que o endpoint inclui o /openai/v1/ caminho e que usou a URL base correta.
Se ocorrer um erro 400, confirme se model está definido como o nome da sua implementação e se o corpo do pedido é um JSON válido.

Limitações e riscos

Os nossos modelos de embedding podem ser pouco fiáveis ou representar riscos sociais em certos casos, podendo causar danos na ausência de mitigações. Consulte o nosso conteúdo Responsible AI para mais informações sobre como abordar a sua utilização de forma responsável.

Próximos passos

Saiba mais sobre a utilização Azure OpenAI e embeddings para realizar pesquisa de documentos com o nosso tutorial embeddings.
Saiba mais sobre os modelos subjacentes que alimentam Azure OpenAI.
Armazene os seus embeddings e realize pesquisa vetorial (similaridade) usando o serviço que escolher:

Comentários

Esta página foi útil?

Last updated on 2026-04-30