Microsoft.Extensions.DataIngestion Naamruimte

Klassen

Name Description
ClassificationEnricher

Verrijkt documentsegmenten met een classificatielabel op basis van hun inhoud.

EnricherOptions

Vertegenwoordigt opties voor verrijkers die een AI-chatclient gebruiken.

HeaderChunker

Hiermee worden documenten gesplitst in segmenten op basis van kopteksten en de bijbehorende niveaus, waarbij de context van de koptekst behouden blijft.

ImageAlternativeTextEnricher

IngestionDocumentImage Verrijkt elementen met alternatieve tekst met behulp van een AI-service, zodat de gegenereerde insluitingen informatie over de afbeeldingsinhoud kunnen bevatten.

IngestionChunk<T>

Vertegenwoordigt een deel van de inhoud dat is geëxtraheerd uit een IngestionDocument.

IngestionChunker<T>

Splitst een IngestionDocument in segmenten.

IngestionChunkerOptions

Opties voor het configureren van de opname chunker.

IngestionChunkProcessor<T>

Verwerkt segmenten in een pijplijn.

IngestionChunkWriter<T>

Schrijft segmenten naar een bestemming.

IngestionDocument

Een indelingsagnostische container die diverse invoerindelingen normaliseert in een gestructureerde hiërarchie.

IngestionDocumentElement

Vertegenwoordigt een element binnen een IngestionDocument.

IngestionDocumentFooter

Vertegenwoordigt een voettekst in een document.

IngestionDocumentHeader

Vertegenwoordigt een koptekst in een document.

IngestionDocumentImage

Vertegenwoordigt een afbeelding in een document.

IngestionDocumentParagraph

Vertegenwoordigt een alinea in een document.

IngestionDocumentProcessor

Onderdeel van de documentverwerkingspijplijn die een IngestionDocument als invoer gebruikt en een (mogelijk gewijzigd) IngestionDocument als uitvoer produceert.

IngestionDocumentReader

Leest broninhoud en converteert deze naar een IngestionDocument.

IngestionDocumentSection

Een sectie kan slechts een pagina of een logische groepering van elementen in een document zijn.

IngestionDocumentTable

Vertegenwoordigt een tabel in een document.

IngestionPipeline<T>

Vertegenwoordigt een pijplijn voor het opnemen van gegevens uit documenten en het verwerken ervan in segmenten.

IngestionPipelineOptions

Opties voor het configureren van de opnamepijplijn.

IngestionResult

Vertegenwoordigt het resultaat van een opnamebewerking.

KeywordEnricher

Verrijkt segmenten met trefwoordextractie met behulp van een AI-chatmodel.

MarkdownReader

Leest Markdown-inhoud en converteert deze naar een IngestionDocument.

MarkItDownMcpReader

Leest documenten door ze te converteren naar Markdown met behulp van de MarkItDown MCP-server.

MarkItDownReader

Leest documenten door ze te converteren naar Markdown met behulp van het hulpprogramma MarkItDown .

SentimentEnricher

Verrijkt segmenten met sentimentanalyse met behulp van een AI-chatmodel.

SummaryEnricher

Verrijkt segmenten met samenvattingstekst met behulp van een AI-chatmodel.

VectorStoreWriter<T>

Schrijft segmenten naar het VectorStore standaardschema.

VectorStoreWriterOptions

Vertegenwoordigt opties voor de VectorStoreWriter<T>.