Usar a síntese de respostas para respostas apoiadas por citações na Pesquisa de IA do Azure

Observação

Esta funcionalidade está atualmente em pré-visualização pública. Esta pré-visualização é fornecida sem um contrato de nível de serviço e não é recomendada para cargas de trabalho de produção. Algumas funcionalidades poderão não ser suportadas ou poderão ter capacidades limitadas. Para obter mais informações, veja Termos Suplementares de Utilização para Pré-visualizações do Microsoft Azure.

Por defeito, uma base de conhecimento no Pesquisa de IA do Azure realiza uma extração de dados, que devolve segmentos brutos de ancoragem das suas fontes de conhecimento. A extração de dados é útil para recuperar informação específica, mas carece do contexto e raciocínio necessários para consultas complexas.

Pode, em vez disso, ativar a síntese de respostas, que utiliza o LLM especificado na sua base de conhecimento para responder a perguntas em linguagem natural. Cada resposta inclui citações às fontes recuperadas e segue todas as instruções fornecidas, como o uso de listas com marcadores.

Pode permitir a síntese de respostas de duas formas:

  • Na base de conhecimento (torna-se o padrão para todas as consultas)
  • Em pedidos individuais de recuperação (sobrepõe o padrão padrão)

Importante

  • O esforço de raciocínio para recuperação desativa o processamento de LLM, tornando-o incompatível com a elaboração de respostas tanto nas definições da base de conhecimento como nos pedidos de recuperação. Para mais informações, consulte Definir o esforço de raciocínio de recuperação.

  • A síntese de respostas incorre em cobranças de pagamento conforme o uso do Azure OpenAI, que se baseia no número de tokens de entrada e saída. As cobranças aparecem sob o LLM atribuído à base de conhecimento. Para obter mais informações, consulte Disponibilidade e preços da recuperação agêntica.

Pré-requisitos

  • Um serviço Pesquisa de IA do Azure com uma base de conhecimento que especifica um LLM.

  • Permissões para atualizar a base de conhecimento. Configure a autenticação sem chave com o papel de Contribuidor de Serviço de Pesquisa atribuído à sua conta de utilizador (recomendado) ou use uma chave API.

  • Para chamadas de saída para o LLM, o serviço de pesquisa deve ter uma identidade gerida com permissões para Utilizador dos Serviços Cognitivos no recurso Microsoft Foundry.

  • A REST API 2025-11-01-preview ou um pacote de preview equivalente do SDK do Azure: .NET | Java | JavaScript | Python

Permitir a síntese de respostas numa base de conhecimento

Esta secção explica como permitir a síntese de respostas numa base de conhecimento existente. Embora possa usar esta configuração para novas bases de conhecimento, a criação de bases de conhecimento está fora do âmbito deste artigo.

Para permitir a síntese de respostas numa base de conhecimento:

  1. Utilize a versão prévia 2025-11-01 do Knowledge Base - Create or Update (API REST) para elaborar o pedido.

  2. No corpo do pedido, defina outputMode para answerSynthesis.

  3. (Opcional) Use answerInstructions para personalizar a saída da resposta. O nosso exemplo instrui a base de conhecimento a Use concise bulleted lists.

@search-url = <YOUR SEARCH SERVICE URL>
@api-key = <YOUR API KEY>
@knowledge-base-name = <YOUR KNOWLEDGE BASE NAME>

### Enable answer synthesis in a knowledge base
PUT {{search-url}}/knowledgebases/{{knowledge-base-name}}?api-version=2025-11-01-preview  HTTP/1.1
Content-Type: application/json
api-key: {{api-key}}

{
    "name": "{{knowledge-base-name}}",
    "knowledgeSources": [ ... // OMITTED FOR BREVITY ],
    "models": [ ... // OMITTED FOR BREVITY ],
    "outputMode": "answerSynthesis",
    "answerInstructions": "Use concise bulleted lists"
}

Observação

Este exemplo pressupõe que você esteja usando a autenticação baseada em chave para testes de prova de conceito locais. Recomendamos o controle de acesso baseado em função para cargas de trabalho de produção. Para obter mais informações, consulte Conectar-se à Pesquisa de IA do Azure usando funções.

Ativar a síntese de respostas num pedido de recuperação

Para controlo por consulta sobre o formato de resposta, pode ativar a síntese de respostas no momento da consulta. Esta abordagem sobrepõe-se ao modo de saída padrão especificado na base de conhecimento.

Para permitir a síntese de respostas num pedido de recuperação:

  1. Use a pré-visualização de 2025-11-01 do Knowledge Retrieval - Retrieve (API REST) para formular a solicitação.

  2. No corpo do pedido, defina outputMode para answerSynthesis.

@search-url = <YOUR SEARCH SERVICE URL>
@api-key = <YOUR API KEY>
@knowledge-base-name = <YOUR KNOWLEDGE BASE NAME>

### Enable answer synthesis in a retrieve request
POST {{search-url}}/knowledgebases/{{knowledge-base-name}}/retrieve?api-version=2025-11-01-preview  HTTP/1.1
Content-Type: application/json
api-key: {{api-key}}

{
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "What is healthcare?"
                }
            ]
        }
    ],
    "outputMode": "answerSynthesis"
}

Observação

Este exemplo pressupõe que você esteja usando a autenticação baseada em chave para testes de prova de conceito locais. Recomendamos o controle de acesso baseado em função para cargas de trabalho de produção. Para obter mais informações, consulte Conectar-se à Pesquisa de IA do Azure usando funções.

Obtenha uma resposta sintetizada

Quando a síntese de respostas está ativada, o Knowledge Retrieval - Retrieve (REST API) devolve uma resposta em linguagem natural baseada nas instruções que opcionalmente especificou na base de conhecimento. As citações das suas fontes de conhecimento estão formatadas como [ref_id:<number>].

Por exemplo, se as suas instruções forem Use concise bulleted lists e a sua consulta for What is healthcare?, a resposta poderá ter o seguinte aspeto:

{
  "response": [
    {
      "content": [
        {
          "type": "text",
          "text": "- Healthcare encompasses various services provided to patients and the general population ... // TRIMMED FOR BREVITY"
        }
      ]
    }
  ]
}

A saída completa text é a seguinte:

"- Healthcare encompasses various services provided to patients and the general population, including primary health services, hospital care, dental care, mental health services, and alternative health services [ref_id:1].\n- It involves the delivery of safe, effective, patient-centered care through different modalities, such as in-person encounters, shared medical appointments, and group education sessions [ref_id:0].\n- Behavioral health is a significant aspect of healthcare, focusing on the connection between behavior and overall health, including mental health and substance use [ref_id:2].\n- The healthcare system aims to ensure quality of care, access to providers, and accountability for positive outcomes while managing costs effectively [ref_id:2].\n- The global health system is evolving to address complex health needs, emphasizing the importance of cross-sectoral collaboration and addressing social determinants of health [ref_id:4]."

Dependendo da configuração da sua base de conhecimento, a resposta pode incluir outras informações, como registos de atividade e arrays de referência. Para mais informações, consulte Criar uma base de conhecimento.