Partilhar via


Conceitos de agente de dados do Fabric

O agente de dados do Microsoft Fabric é uma funcionalidade geralmente disponível que lhe permite criar os seus próprios sistemas de perguntas e respostas conversacionais utilizando IA generativa. Um agente de dados Fabric torna os insights de dados mais acessíveis e acionáveis para todos na sua organização. Ao utilizar um agente de dados Fabric, a sua equipa pode ter conversas, com perguntas em inglês simples, sobre os dados que a sua organização armazenou no Fabric OneLake e depois receber respostas relevantes. Desta forma, mesmo pessoas sem experiência técnica em IA ou uma compreensão profunda da estrutura de dados podem receber respostas precisas e ricas em contexto. Dentro de arquiteturas de aplicações agenticas mais amplas no Microsoft Fabric, os agentes de dados funcionam como componente de análise conversacional, ligando-se a dados governados no OneLake através de lakehouses, armazéns, modelos semânticos e bases de dados KQL em soluções multiagente.

Também pode adicionar instruções específicas da organização, exemplos e orientações para afinar finamente o agente de dados do Fabric. Esta abordagem assegura que as respostas estejam alinhadas com as necessidades e objetivos da sua organização, permitindo que todos interajam com os dados de forma mais eficaz. O Fabric data agent promove uma cultura de tomada de decisão orientada por dados porque reduz barreiras à acessibilidade de insights, facilita a colaboração e ajuda a sua organização a extrair mais valor dos seus dados.

Pré-requisitos

  • Uma capacidade paga F2 ou superior do Fabric, ou uma capacidade do Power BI Premium (P1 ou superior) com Microsoft Fabric ativado.
  • As definições do tenant do agente de dados Fabric estão ativadas, incluindo a definição Capacidades podem ser designadas como capacidades do Fabric Copilot.
  • O processamento geográfico cruzado para IA está habilitado.
  • O armazenamento geográfico cruzado para IA está habilitado.
  • Pelo menos um destes, com dados: um armazém, uma casa de lago, um ou mais modelos semânticos Power BI, uma base de dados KQL ou uma ontologia.
  • Modelos semânticos Power BI via troca de inquilino dos endpoints XMLA estão ativados para fontes de dados de modelos semânticos Power BI.
  • Para modelos semânticos do Power BI usados com um agente de dados, certifique-se de que os utilizadores que interagem através do agente têm permissão de leitura sobre o modelo semântico. Não é necessária permissão de Membro do Espaço de Trabalho ou de Construção para interagir.

Pré-requisitos de governação

Se o seu tenant ou espaço de trabalho for regido pelas políticas da Microsoft Purview, os agentes devem operar dentro dessas políticas. As seguintes políticas Purview podem limitar o acesso dos agentes e os resultados que os agentes retornam, com base na sensibilidade e configuração da política:

  • Políticas DLP do Purview no Fabric Data Warehouse (geralmente disponíveis): As políticas DLP podem detetar e restringir o acesso a dados sensíveis em ativos do armazém de dados que o agente consulta.
  • Políticas de restrição de acesso (pré-visualização) para Fabric Base de Dados KQL, Fabric Base de Dados SQL e Fabric Data Warehouse: Estas políticas podem impedir o agente de aceder ou devolver resultados de ativos classificados como sensíveis.

Como funciona o agente de dados Fabric

O agente de dados Fabric utiliza grandes modelos de linguagem (LLMs) para ajudar os utilizadores a interagir naturalmente com os seus dados. O agente de dados Fabric aplica APIs do Azure OpenAI Assistant e comporta-se como um agente. Processa perguntas dos utilizadores, determina a fonte de dados mais relevante (Lakehouse, Warehouse, conjunto de dados Power BI, bases de dados KQL, ontologia ou Microsoft Graph) e invoca a ferramenta apropriada para gerar, validar e executar consultas. Os utilizadores podem então colocar perguntas em linguagem simples e receber respostas estruturadas e legíveis para humanos. Esta abordagem elimina a necessidade de escrever consultas complexas e garante um acesso preciso e seguro aos dados.

Veja como funciona em detalhes:

Análise e validação de perguntas: O agente de dados Fabric aplica Azure APIs do OpenAI Assistant como agente subjacente para processar as perguntas dos utilizadores. Essa abordagem garante que a pergunta esteja em conformidade com os protocolos de segurança, as políticas de IA responsável (RAI) e as permissões do usuário. O agente de dados Fabric também respeita os controlos de governação Microsoft Purview aplicados às fontes de dados Fabric subjacentes, incluindo políticas de Prevenção de Perda de Dados (DLP) e restrições de acesso. A aplicação de políticas pode impedir que certas consultas sejam executadas ou que dados específicos sejam apresentados nas respostas. O agente de dados Fabric aplica estritamente o acesso só de leitura, mantendo ligações de dados apenas de leitura a todas as fontes de dados.

Mecanismos de aplicação: O agente de dados Fabric aplica várias camadas de proteção durante o processamento. Utiliza as credenciais e permissões do utilizador solicitante para impor o acesso de privilégios mínimos, garantindo que cada interação só chega aos dados que o utilizador está autorizado a ver. O agente avalia os pedidos em função das definições de políticas de locatário e espaço de trabalho antes de executar qualquer ação. Os guardrails limitam a invocação e as saídas da ferramenta a fontes de dados com âmbito, impedindo que as consultas cheguem a recursos fora do âmbito configurado. Pode, opcionalmente, integrar Segurança de conteúdo de IA do Azure para aplicar controlos de risco de conteúdo que ajudam a reduzir respostas prejudiciais ou fora de política.

Identificação da fonte de dados: O agente de dados Fabric utiliza as credenciais do utilizador para aceder ao esquema da fonte de dados. Esta abordagem garante que o sistema obtém informações da estrutura de dados que o utilizador tem permissão para visualizar. O agente avalia então a pergunta do utilizador em relação a todas as fontes de dados disponíveis, incluindo bases de dados relacionais (Lakehouse e Warehouse), conjuntos de dados Power BI (Modelos Semânticos), bases de dados KQL, ontologias e Microsoft Graph. Ele também pode fazer referência às instruções do agente de dados fornecidas pelo usuário para determinar a fonte de dados mais relevante. Para modelos semânticos do Power BI, o agente usa a permissão de leitura do utilizador sobre o modelo para recuperar o esquema e os metadados para geração de consultas; A permissão de construção não é necessária para consultas orientadas por agentes.

Invocação de ferramentas e geração de consultas: Uma vez identificada a fonte de dados correta(s) fonte(s), o agente de dados Fabric reformula a questão para maior clareza e estrutura, e depois invoca a ferramenta correspondente para gerar uma consulta estruturada:

  • Linguagem natural para SQL (NL2SQL) para bancos de dados relacionais (Lakehouse/Warehouse).
  • Linguagem natural para DAX (NL2DAX) para conjuntos de dados do Power BI (Modelos Semânticos).
  • Linguagem natural para KQL (NL2KQL) para bases de dados em KQL. O NL2KQL pode usar funções definidas pelo utilizador (UDFs) do KQL quando estão disponíveis nas bases de dados selecionadas.
  • Consultas Microsoft Graph para dados organizacionais acessíveis através do Microsoft Graph.

A ferramenta selecionada gera uma consulta baseada no esquema, metadados e contexto fornecidos que o agente subjacente aos dados do Fabric, em seguida, transfere.

Validação da consulta: A ferramenta realiza validação para garantir que a consulta está corretamente formada e cumpre os seus próprios protocolos de segurança e políticas RAI.

Execução e resposta à consulta: Uma vez validada, o agente de dados Fabric executa a consulta contra a fonte de dados escolhida. Os resultados são formatados em uma resposta legível por humanos, que pode incluir dados estruturados, como tabelas, resumos ou insights importantes.

Ao utilizar esta abordagem, os utilizadores podem interagir com os seus dados utilizando linguagem natural. O agente de dados Fabric trata das complexidades da geração, validação e execução de consultas. Os utilizadores não precisam de escrever SQL, DAX ou KQL por si mesmos.

Segurança e governação com a Microsoft Purview

A Microsoft Purview fornece governação e controlos de risco para agentes de dados Fabric. Estas funcionalidades estão atualmente em pré-visualização e ajudam as organizações a manter a conformidade ao utilizar agentes para aceder a dados Fabric. As capacidades-chave incluem:

  • Descoberta e auditoria de riscos: Os prompts e respostas dos agentes de dados Fabric podem ser sujeitos à descoberta e auditoria de risco Purview, dando às equipas de segurança visibilidade sobre como os agentes interagem com os dados organizacionais.
  • Avaliações de Risco de Dados DSPM: Gestão da Postura de Segurança de Dados (DSPM) As Avaliações de Risco de Dados podem revelar riscos sensíveis de dados nas fontes de dados utilizadas pelos agentes, ajudando-o a identificar e abordar a exposição potencial.
  • Gestão de Riscos Insider: A Gestão de Riscos Insider da Purview pode detetar padrões de utilização de IA de risco envolvendo agentes, como volumes invulgares de consultas ou acesso a dados sensíveis.
  • Auditoria, eDiscovery e retenção: As políticas de Auditoria, eDiscovery e retenção de Purview aplicam-se a interações e resultados de agentes nas cargas de trabalho suportadas pelo Fabric. A deteção de utilização não conforme pode também sinalizar atividade de agentes que viole políticas organizacionais.

Para mais informações sobre como Microsoft Purview se integra com Fabric, veja Use Microsoft Purview para governar Microsoft Fabric.

Configuração do agente de dados Fabric

Configurar um agente de dados Fabric é semelhante a construir um relatório Power BI — começa por desenhá-lo e aperfeiçoá-lo para garantir que satisfaz as suas necessidades, depois publica e partilha com colegas para que possam interagir com os dados. Configurar um agente de dados Fabric envolve:

Seleção de fontes de dados: Um agente de dados Fabric suporta até cinco fontes de dados em qualquer combinação, incluindo lakehouses, armazéns, bases de dados KQL, modelos semânticos do Power BI, ontologias e Microsoft Graph. Por exemplo, um agente de dados Fabric configurado pode incluir cinco modelos semânticos Power BI. Pode incluir uma combinação de dois modelos semânticos Power BI, uma casa de lago e uma base de dados KQL. Você tem muitas opções disponíveis.

Escolher Tabelas Relevantes: Depois de selecionar as fontes de dados, adicione-as uma de cada vez e defina as tabelas específicas de cada fonte que o agente de dados Fabric utiliza. Esta etapa garante que o agente de dados Fabric recupera resultados precisos, focando-se apenas nos dados relevantes. Para as casas de lago, este passo significa selecionar tabelas de casas de lago (não ficheiros individuais de casas de lago). Se os seus dados começarem como ficheiros (por exemplo, CSV ou JSON), torne-os disponíveis para o agente, ingerindo-os em tabelas ou expondo-os através de tabelas.

Adição de Contexto: Para melhorar a precisão dos agentes de dados do Fabric, forneça mais contexto através de instruções dos agentes de dados do Fabric e consultas de exemplo. Como agente subjacente para o agente de dados Fabric, o contexto ajuda a API do Azure OpenAI Assistant a tomar decisões mais informadas sobre como processar as perguntas dos utilizadores e determinar qual a fonte de dados mais adequada para as responder.

  • Instruções do agente de dados: Adicione instruções para orientar o agente subjacente ao agente de dados Fabric, na determinação da melhor fonte de dados para responder a tipos específicos de perguntas. Você também pode fornecer regras ou definições personalizadas que esclareçam a terminologia organizacional ou requisitos específicos. Essas instruções podem fornecer mais contexto ou preferências que influenciam como o agente seleciona e consulta fontes de dados. Por exemplo, direcionar perguntas sobre métricas financeiras para um modelo semântico Power BI, atribuir consultas envolvendo exploração de dados primários ao lakehouse, e encaminhar perguntas que requerem análise de registos para a base de dados KQL.

  • Exemplos de consultas: Adicione pares de exemplo pergunta-consulta para ilustrar como o agente de dados Fabric deve responder a consultas comuns. Esses exemplos servem como um guia para o agente, o que o ajuda a entender como interpretar perguntas semelhantes e gerar respostas precisas.

Observação

Adicionar pares de exemplos de consulta/pergunta não é atualmente suportado para fontes de dados de modelos semânticos do Power BI.

Ao combinar instruções claras de IA com consultas de exemplo relevantes, pode alinhar melhor o agente de dados Fabric com as necessidades de dados da sua organização, garantindo respostas mais precisas e conscientes do contexto.

Importante

As instruções de agente de dados fornecidas pelo programador e as consultas de exemplo devem operar dentro de restrições organizacionais e baseadas em funções. Se instruções ou prompts entrarem em conflito com a política (por exemplo, tentativas de contornar comportamentos de apenas leitura ou aceder a fontes fora do âmbito), o agente recusa ou redireciona o pedido de acordo com o modelo de precedência descrito na secção seguinte.

Camadas de governação e intenção

Quando configura um agente de dados Fabric, múltiplas camadas de intenção podem influenciar o comportamento do agente. Estas camadas, listadas da maior para a menor precedência, definem o que o agente pode fazer:

  1. Intenção organizacional: Políticas para todo o inquilino e requisitos de conformidade definidos pelos administradores da sua organização. Estas restrições têm a maior prioridade e não podem ser ultrapassadas por nenhuma outra camada.
  2. Intenção baseada em funções: Definições de governação do espaço de trabalho e limites de permissões que se aplicam a funções ou grupos específicos. Estas definições impõem controlos de acesso e restrições ao âmbito dos dados.
  3. Intenção do programador: Instruções personalizadas, exemplos de consultas e configurações de fontes de dados que fornece quando constrói o agente de dados.
  4. Intenção do utilizador: Perguntas e prompts que os utilizadores finais enviam durante conversas com o agente.

Quando surgem conflitos entre camadas, camadas de precedência superior sobrepõem-se às camadas inferiores. Por exemplo, as políticas organizacionais e as definições de governação do espaço de trabalho sobrepõem-se sempre às instruções do programador e aos pedidos de utilizador. Este modelo de precedência garante que o agente opere dentro dos limites aprovados, independentemente de como esteja configurado ou solicitado.

Diferença entre um agente de dados Fabric e um copilot

Embora tanto os agentes de dados Fabric como os copilots Fabric utilizem IA generativa para processar e raciocinar sobre dados, existem diferenças-chave na sua funcionalidade e casos de uso:

Flexibilidade de configuração: Pode configurar de forma abrangente os agentes de dados Fabric. Você pode fornecer instruções personalizadas e exemplos para adaptar seu comportamento a cenários específicos. Os copilotos Fabric, por outro lado, vêm pré-configurados e não oferecem este nível de personalização.

Âmbito e caso de uso: Fabric copilots auxiliam em tarefas dentro de Microsoft Fabric, como gerar código de caderno ou consultas de armazém. Os agentes de dados Fabric, em contraste, são artefactos configuráveis autónomos que podem consultar dados através de modelos OneLake e semânticos. Os agentes de dados Fabric também podem integrar-se com o Microsoft 365 Copilot para obter insights em linguagem natural diretamente nas aplicações Microsoft 365. Quando os agentes são acedidos através do Microsoft 365 Copilot, as políticas de governação da Microsoft Purview continuam a aplicar-se às fontes de dados subjacentes. Além disso, os agentes de dados Fabric podem ligar-se a sistemas externos como Microsoft Copilot Studio, Azure AI Foundry, Microsoft Teams ou outras ferramentas fora do Fabric. Orquestradores externos e ambientes de execução multi-agente podem invocar agentes de dados Fabric para suportar fluxos de trabalho orientados a agentes de ponta a ponta, mantendo-se focados no acesso de dados regulamentado e exclusivamente de leitura.

Avaliação do agente de dados Fabric

A equipa de produto avaliou rigorosamente a qualidade e segurança das respostas dos agentes de dados Fabric:

Benchmark Testing: A equipa de produto testou Fabric agentes de dados numa variedade de conjuntos de dados públicos e privados para garantir respostas de alta qualidade e precisas.

Mitigações Reforçadas de Danos: A equipa de produto implementou salvaguardas para garantir que os resultados dos agentes de dados Fabric permaneçam focados no contexto de fontes de dados selecionadas, reduzindo o risco de respostas irrelevantes ou enganosas.

Governação e segurança

A integração com Microsoft Purview fornece controlos de governação para agentes de dados Fabric. Quando configura um agente de dados, as políticas de governação da Purview aplicam-se às fontes de dados subjacentes a que o agente pode acedecer. Esta integração ajuda a garantir que o acesso aos dados através dos agentes siga as mesmas regras de conformidade e classificação que o acesso direto.

políticas Microsoft Purview: Políticas de Purview, como controles de acesso a dados e etiquetas de sensibilidade, aplicam-se às fontes de dados que os agentes consultam. Se uma política da Purview restringe o acesso a uma casa de lago ou armazém, o agente respeita essa restrição ao processar as consultas dos utilizadores.

Proteção de acesso de saída: Os agentes de dados do Fabric operam dentro dos limites de proteção de acesso de saída do cliente. As ligações de saída das operações do agente estão sujeitas à mesma rede e regras de acesso configuradas para o seu locatário Fabric. Os administradores podem gerir as ligações de saída permitidas através do Fabric admin portal nas configurações do locatário para controlar quais os pontos finais externos que os agentes podem alcançar.

Integração do Microsoft 365 Copilot: Quando os agentes de dados Fabric são exibidos através do Microsoft 365 Copilot, as políticas de governança do Purview continuam a ser aplicadas. Os utilizadores só podem aceder a dados que as suas credenciais e políticas do Purview permitem, independentemente do ponto de entrada.

ALM e DevOps para agentes de dados

Os agentes de dados Fabric suportam capacidades de gestão do ciclo de vida de aplicações (ALM) que ajudam a gerir configurações de agentes em ambientes de desenvolvimento, teste e produção.

Diagnósticos: Utilize diagnósticos incorporados para monitorizar o comportamento do agente, identificar problemas de geração de consultas e resolver a qualidade da resposta. Os diagnósticos fornecem visibilidade sobre como o agente processa perguntas e seleciona as fontes de dados.

Integração com Git: Podes controlar as configurações dos teus agentes com integração com Git. Ligue o seu espaço de trabalho Fabric a um repositório Git para acompanhar alterações nas instruções do agente, consultas de exemplo e seleções de fontes de dados ao longo do tempo.

Pipelines de implementação: Utilizar pipelines de implementação Fabric para promover agentes de dados entre espaços de trabalho (por exemplo, do desenvolvimento à produção). Este suporte permite-lhe testar alterações num ambiente de staging antes de as disponibilizar aos utilizadores finais.

Supervisão operacional

Para manter a qualidade e o alinhamento contínuo das políticas, considere estas práticas operacionais para o seu agente de dados Fabric:

  • Registo e auditoria: Monitorizar as interações com os agentes através das capacidades disponíveis de registo e auditoria. Rever os padrões de consulta e a qualidade das respostas ajuda-o a identificar comportamentos inesperados precocemente.
  • Escalonamento humano no ciclo: Estabeleça caminhos de escalonamento para pedidos sensíveis ou de grande impacto. Para cenários em que as respostas automáticas não são suficientes, defina processos que encaminhem as perguntas para revisores qualificados.
  • Revisão periódica: Revise regularmente as instruções do seu agente de dados e exemplos de consultas para garantir que permanecem alinhadas com as políticas e estruturas de dados atuais da organização. À medida que as suas fontes de dados ou requisitos de negócio mudam, atualize a configuração do agente em conformidade.

Limitações

  • O agente de dados Fabric gera apenas consultas de leitura SQL, DAX e KQL. Não gera consultas SQL, DAX ou KQL que criem, atualizam ou eliminam dados.
  • O agente de dados Fabric não suporta dados não estruturados, como ficheiros .pdf, .docxou .txt. Não podes usar o agente de dados Fabric para aceder a recursos de dados não estruturados.
  • Para fontes de dados lakehouse, o agente de dados do Fabric responde às perguntas usando as tabelas lakehouse que selecionar. Não lê diretamente ficheiros Lakehouse autónomos (por exemplo, ficheiros CSV ou JSON) a menos que sejam ingeridos ou expostos como tabelas.
  • O agente de dados Fabric atualmente não suporta línguas não inglesas. Para um desempenho ótimo, forneça perguntas, instruções e exemplos de consultas em inglês.
  • Não podes alterar o LLM que o agente de dados Fabric usa.
  • O histórico de conversas no agente de dados Fabric pode nem sempre persistir. Em certos casos, como alterações na infraestrutura do backend, atualizações de serviço ou atualizações de modelos, o histórico de conversas anteriores pode ser reiniciado ou perdido.
  • O agente de dados Fabric não pode executar consultas quando a capacidade de espaço de trabalho da fonte de dados está numa região diferente da capacidade do agente de dados. Por exemplo, uma casa de lago com capacidade no Norte da Europa falha se a capacidade do Agente de Dados estiver em França Central.
  • Os utilizadores podem fornecer até 100 consultas de exemplo por fonte de dados no seu Data Agent.
  • Os Fabric Data Agents são atualmente concebidos para insights conversacionais, em vez de para devolver conjuntos de dados completos. Para garantir respostas concisas e eficazes, os resultados do chat limitam e/ou resumem automaticamente os dados devolvidos. Atualmente, as respostas estão limitadas a um máximo de 25 linhas e 25 colunas. Por favor, note que o histórico de conversas anteriores pode influenciar respostas subsequentes. Por exemplo, se pedir para "mostrar todas as linhas deste ano", o agente devolverá no máximo 25 linhas. Perguntas de seguimento podem então ser respondidas com base neste contexto já limitado, o que pode afetar o resultado. Nesses casos, recomenda-se iniciar uma nova sessão de chat.
  • As respostas do agente podem ser truncadas ou bloqueadas se as políticas DLP ou de restrição de acesso da Microsoft Purview se aplicarem às fontes de dados subjacentes. O comportamento específico depende da configuração das políticas da sua organização.
  • Ativos marcados como sensíveis pelas políticas da Purview podem ser inacessíveis ao agente, o que pode resultar em respostas incompletas ou na incapacidade de consultar certas fontes de dados.
  • As interações com agentes podem ser registadas e descobertas através do Auditoria do Microsoft Purview e eDiscovery. As organizações devem considerar estes controlos de governação ao implementar agentes para cargas de trabalho sensíveis.
  • O acesso a modelos semânticos do Power BI através de um agente de dados é regido por permissão de leitura no modelo e não requer acesso ao nível do espaço de trabalho. A Segurança ao Nível de Linha (RLS) e a Segurança ao Nível de Coluna (CLS) ainda se aplicam.