Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Dokumentparsning använder toppmoderna forskningstekniker för att extrahera och visualisera strukturerade data från en mängd olika dokumenttyper, inklusive men inte begränsat till PDF-filer, bilder, Word dokument (DOC/DOCX) och PowerPoint filer (PPT/PPTX). Den är utformad för att hantera komplexa layouter som tabeller, diagram och blandat textbildinnehåll.
Dokumentparsning bygger på ai_parse_document funktionen och innehåller ett användargränssnitt som gör att du kan parsa dokument och omedelbart inspektera deras struktur genom formaterad text eller strukturerade JSON-utdata.
Requirements
- En arbetsyta som innehåller följande:
- Serverlös beräkning aktiverad. Se Krav för serverlös beräkning.
- Unity Catalog aktiverat. Se Aktivera en arbetsyta för Unity Catalog.
- Åtkomst till en serverlös användningsprincip med en icke-nollbudget.
- Den här funktionen är endast tillgänglig i vissa regioner, se TILLGÄNGLIGHET för AI-funktioner.
- Funktionen
ai_parse_documentär också tillgänglig för arbetsytor med tillägget Förbättrad säkerhet och efterlevnad.
- Funktionen
Analysera dokument
Använd Dokumentparsning för att parsa dina dokument och visualisera deras struktur.
- Gå till
Agenter i det vänstra navigeringsfönstret på arbetsytan.
- Klicka på Skapa agent>Dokumentparsing.
- Välj källdokumentet. Du kan välja att ladda upp en fil eller välja en från en befintlig Unity-katalogkatalog. Format som stöds är: PDF, bilder, DOC/DOCX och PPT/PPTX.
- Klicka på Parsa dokument.
Det kan ta några minuter att parsa dokumentet. När dokumentparsers har slutförts visas källdokumentet till vänster och det tolkade dokumentet till höger. Du kan välja att visa det tolkade dokumentet som Formaterad text eller Rå JSON.
Bearbeta och fråga efter resultat
Om du vill visa ai_parse_document frågan och köra den i fler dokument klickar du på Använd agent och väljer antingen att köra frågan från SQL-redigeraren eller notebook-filen. Du kan redigera frågan så att den pekar på volymen eller tabellen som dokumenten finns i.
Dokumentparsning tillhandahåller ett gränssnittsgränssnitt för SQL-funktionen ai_parse_document. Mer avancerade exempel och information finns på ai_parse_document referenssidan.