Partilhar via


O que é uma base de dados gráfica?

Observação

Esta funcionalidade está atualmente em pré-visualização pública. Esta pré-visualização é fornecida sem estar sujeita a um acordo de nível de serviço e não é adequada para cargas de trabalho de produção. Algumas funcionalidades poderão não ser suportadas ou poderão ter capacidades limitadas. Para mais informações, consulte Termos de Utilização Suplementares para Microsoft Azure Pré-visualizações.

Uma base de dados de grafos é um tipo de base de dados que representa a informação como nós (entidades) e arestas (relações) em vez de tabelas e linhas. Esta estrutura facilita a exploração de ligações e padrões complexos entre os seus dados.

O tipo de base de dados de grafos mais utilizado implementa o modelo de grafo de propriedades com rótulos (LPG): as entidades (nós) e as relações (arestas) podem ter rótulos e propriedades (pares-chave-valor). Este modelo flexível permite tanto designs opcionais como orientados por esquema, e permite expressar relações complexas. Como as conexões são armazenadas explicitamente como bordas, as consultas atravessam relacionamentos seguindo bordas em vez de calcular junções caras no momento da consulta.

Observação

Exemplos neste artigo utilizam o conjunto de dados de exemplos de grafos de redes sociais.

Conceitos principais do banco de dados gráfico

Uma base de dados de grafos organiza os dados em três blocos fundamentais de construção:

  • Os nós representam entidades como pessoas, produtos ou lugares. Os nós podem ter rótulos e propriedades que descrevem seus atributos. Por exemplo, um Person nó pode ter propriedades como firstName, lastName, e age.
  • As arestas representam como as entidades estão conectadas, por exemplo FRIENDS_WITH, PURCHASED, ou LOCATED_IN. As arestas também podem transportar atributos e rótulos para captar metadados de relacionamentos.
  • As propriedades associam detalhes a nós e arestas (por exemplo, o nome de uma pessoa ou o de uma aresta desde a data).

Como funciona a consulta de relações

As consultas de grafos recuperam informações conectadas percorrendo de um nó inicial para os seus vizinhos, depois para os vizinhos destes e assim por diante. O custo de uma travessia depende do número de arestas que toca (a vizinhança local), não do tamanho total do conjunto de dados. Esta característica torna questões sobre caminhos, ligações e padrões — como amigos de amigos, caminhos mais curtos ou dependências de múltiplos saltos — naturais e eficientes de expressar.

As bases de dados de grafos utilizam linguagens de consulta baseadas em padrões, como a Linguagem de Consulta de Grafos (GQL), para descrever estas travessias de forma concisa. O mesmo grupo de trabalho internacional que supervisiona o SQL (ISO/IEC 39075) está a padronizar o GQL, que alinha a consulta de grafos com os padrões estabelecidos de bases de dados.

Exemplo (correspondência de padrões com GQL):

MATCH (p:Person {firstName: "Annemarie"})-[:knows]->(friend)-[:likes]->(c:Comment)
RETURN c
ORDER BY c.creationDate
LIMIT 100

Este padrão lê-se como: começando no nó de Pessoa de Annemarie, seguir as arestas :knows até cada nó de amigo, depois seguir as arestas :likes até os nós relacionados :Comment. Devolva os 100 comentários mais recentes ordenados pela data de criação.

Modelo de dados de grafos e flexibilidade de esquemas

Os modelos de dados gráficos são de esquema opcional: pode trabalhar com um esquema fixo quando houver necessidade de uma sólida governança ou evoluir o modelo quando novos tipos de nós, relações ou propriedades surgirem. Essa abordagem reduz a necessidade de duplicação de dados e permite que as equipes unifiquem dados de várias fontes sem um grande redesenho inicial. Para mais informações sobre o modelo de dados utilizado no gráfico do Microsoft Fabric, veja Grafos de propriedades rotulados.

Usos comuns para bancos de dados gráficos

As bases de dados de grafos alinham-se estreitamente com domínios onde as ligações geram valor, tais como:

  • Redes sociais — modelos de relações entre as pessoas e as suas interações
  • Grafos de conhecimento — conectam conceitos, entidades e factos para pesquisa semântica e raciocínio
  • Sistemas de recomendação — percorrem as interações utilizador-item para revelar sugestões personalizadas
  • Redes de fraude e risco — detetam padrões suspeitos em contas, transações e dispositivos
  • Topologia de rede e TI — mapear dependências entre servidores, serviços e componentes de infraestrutura
  • Análise de dependência da cadeia de abastecimento — rastrear as origens e relações dos componentes entre fornecedores

Nesses cenários, as perguntas são menos sobre registros únicos e mais sobre quantas entidades se relacionam e interagem ao longo de vários saltos.

Quando considerar um banco de dados gráfico

Uma base de dados de grafos é uma boa opção quando as relações impulsionam as questões centrais que precisa de responder. Escolha uma base de dados de grafos quando:

  • As suas principais questões envolvem caminhos, bairros e padrões em dados ligados.
  • O número de saltos é variável ou não é conhecido antecipadamente.
  • É preciso combinar e navegar por relações entre conjuntos de dados díspares.

Se fizer regularmente este tipo de perguntas, um modelo gráfico é uma escolha natural.

Como o grafo no Microsoft Fabric se compara em relação a bases de dados de grafos autónomas

Representar os seus dados como um grafo e armazená-los numa base de dados de grafos separada e autónoma introduz frequentemente ETL (extração, transformação, carga) e sobrecarga de governação. Por outro lado, o gráfico no Microsoft Fabric opera diretamente no OneLake, o que reduz ou elimina a necessidade de pipelines ETL separados e duplicação de dados. Considere estas compensações:

  • Movimentação e duplicação de dados: Bases de dados de grafos autónomas normalmente exigem extração, transformação e carregamento de dados para um armazenamento separado, o que aumenta a complexidade e pode levar à duplicação de conjuntos de dados. O Graph funciona no OneLake, por isso podes modelar e consultar dados ligados sem os mover.
  • Custos operacionais: pilhas de gráficos autónomos funcionam como clusters ou serviços separados e frequentemente acarretam custos associados à capacidade ociosa. Em gráfico, as cargas de trabalho consomem unidades de capacidade agrupadas (CUs) com redução automática e métricas centralizadas, o que simplifica as operações e pode reduzir custos.
  • Escalabilidade: Alguns bancos de dados gráficos autónomos dependem de aumento de escala ou clustering específico do fornecedor. O Graph foi concebido para grafos de grande escala e utiliza sharding escalonável entre múltiplos trabalhadores para gerir cargas de trabalho de big data de forma eficiente.
  • Ferramentas e competências: Sistemas de grafos específicos de fornecedores podem exigir linguagens especializadas e frameworks analíticos separados. O Graph fornece modelação unificada, consultas baseadas em standards (GQL), algoritmos integrados de análise de grafos, integração com BI e IA, e ferramentas exploratórias low/no-code. Estas capacidades permitem que um conjunto mais vasto de utilizadores trabalhe com dados ligados.
  • Governação e segurança: Implementações separadas de grafos precisam de configurações independentes de governação e segurança. Graph utiliza a governação, linhagem e controlo de acesso baseado em funções (RBAC) do OneLake, para que conformidade, auditoria e permissões se mantenham consistentes com o resto do seu ambiente Fabric.