Partilhar via


Análise Sintática de Documentos

Importante

Esta funcionalidade está em Pré-visualização Pública e está em conformidade com a HIPAA.

A análise sintática de documentos utiliza técnicas de investigação de ponta para extrair e visualizar dados estruturados de uma vasta gama de tipos de documentos, incluindo, mas não se limitando a, PDFs, imagens, documentos Word (DOC/DOCX) e ficheiros PowerPoint (PPT/PPTX). Foi concebido para lidar com layouts complexos como tabelas, gráficos e conteúdos mistos de texto e imagem.

A análise sintética de documentos baseia-se na ai_parse_document função e inclui uma interface que permite analisar documentos e inspecionar imediatamente a sua estrutura através de texto formatado ou saídas JSON estruturadas.

Requisitos

Analisar documentos

Use o Document Parsing para analisar os seus documentos e visualizar a sua estrutura.

  1. Vá para o ícone Agentes.Agentes no painel de navegação esquerdo do seu espaço de trabalho.
  2. Clique em Criar Agente>Análise de Documentos.
  3. Selecione o seu documento de origem. Pode optar por carregar um ficheiro ou selecionar um de um catálogo existente do Unity Catalog. Os formatos suportados incluem: PDF, imagens, DOC/DOCX e PPT/PPTX.
  4. Clique em Analisar Documento.

Analisar o seu documento pode demorar alguns minutos. Quando concluído, a análise sintética de documentos mostra o documento de origem à esquerda e o documento analisado à direita. Pode optar por visualizar o documento analisado como texto formatado ou JSON bruto.

UI de análise de documentos mostrando a origem e o documento analisado lado a lado

Resultados do processo e da consulta

Para visualizar a ai_parse_document consulta e executá-la em mais documentos, clique em Usar Agente e escolha executar a consulta a partir do SQL Editor ou do Notebook. Pode editar a consulta para apontar para o volume ou tabela onde se encontram os seus documentos.

A análise de documentos fornece uma interface de utilizador para a função SQL ai_parse_document. Consulte a ai_parse_document página de referência para exemplos e detalhes mais avançados.

Limitações

Veja ai_parse_document limitações.