Microsoft.Extensions.DataIngestion Namnområde

Klasser

Name Description
ClassificationEnricher

Berikar dokumentsegment med en klassificeringsetikett baserat på deras innehåll.

EnricherOptions

Representerar alternativ för berikare som använder en AI-chattklient.

HeaderChunker

Delar upp dokument i segment baserat på rubriker och deras motsvarande nivåer, vilket bevarar rubrikkontexten.

ImageAlternativeTextEnricher

Berikar IngestionDocumentImage element med alternativ text med hjälp av en AI-tjänst, så att de genererade inbäddningarna kan innehålla information om bildinnehållet.

IngestionChunk<T>

Representerar ett segment av innehåll som extraherats från en IngestionDocument.

IngestionChunker<T>

Delar upp en IngestionDocument i segment.

IngestionChunkerOptions

Alternativ för att konfigurera inmatningssegmentet.

IngestionChunkProcessor<T>

Bearbetar segment i en pipeline.

IngestionChunkWriter<T>

Skriver segment till ett mål.

IngestionDocument

En formatagnostisk container som normaliserar olika indataformat i en strukturerad hierarki.

IngestionDocumentElement

Representerar ett element i en IngestionDocument.

IngestionDocumentFooter

Representerar en sidfot i ett dokument.

IngestionDocumentHeader

Representerar en rubrik i ett dokument.

IngestionDocumentImage

Representerar en bild i ett dokument.

IngestionDocumentParagraph

Representerar ett stycke i ett dokument.

IngestionDocumentProcessor

En del av pipelinen för dokumentbearbetning som tar en IngestionDocument som indata och genererar en (potentiellt ändrad) IngestionDocument som utdata.

IngestionDocumentReader

Läser källinnehåll och konverterar det till en IngestionDocument.

IngestionDocumentSection

Ett avsnitt kan bara vara en sida eller en logisk gruppering av element i ett dokument.

IngestionDocumentTable

Representerar en tabell i ett dokument.

IngestionPipeline<T>

Representerar en pipeline för att mata in data från dokument och bearbeta dem till segment.

IngestionPipelineOptions

Alternativ för att konfigurera inmatningspipelinen.

IngestionResult

Representerar resultatet av en inmatningsåtgärd.

KeywordEnricher

Berikar segment med extrahering av nyckelord med hjälp av en AI-chattmodell.

MarkdownReader

Läser Markdown-innehåll och konverterar det till en IngestionDocument.

MarkItDownMcpReader

Läser dokument genom att konvertera dem till Markdown med hjälp av MarkItDown MCP-servern.

MarkItDownReader

Läser dokument genom att konvertera dem till Markdown med verktyget MarkItDown .

SentimentEnricher

Berikar segment med attitydanalys med hjälp av en AI-chattmodell.

SummaryEnricher

Berikar segment med sammanfattningstext med hjälp av en AI-chattmodell.

VectorStoreWriter<T>

Skriver segment till VectorStore med hjälp av standardschemat.

VectorStoreWriterOptions

Representerar alternativ för VectorStoreWriter<T>.