DocumentTokenChunker Classe

Definizione

Elabora un documento tokenzzandone il contenuto e dividendolo in blocchi sovrapposti di token.

public ref class DocumentTokenChunker sealed : Microsoft::Extensions::DataIngestion::IngestionChunker<System::String ^>
public sealed class DocumentTokenChunker : Microsoft.Extensions.DataIngestion.IngestionChunker<string>
type DocumentTokenChunker = class
    inherit IngestionChunker<string>
Public NotInheritable Class DocumentTokenChunker
Inherits IngestionChunker(Of String)
Ereditarietà
DocumentTokenChunker

Commenti

Questa classe usa un tokenizer per convertire il contenuto del documento in token e quindi suddivide i token in blocchi di una dimensione specificata, con una sovrapposizione configurabile tra blocchi consecutivi.

Si noti che le tabelle possono essere suddivise a metà riga.

Costruttori

Nome Descrizione
DocumentTokenChunker(IngestionChunkerOptions)

Inizializza una nuova istanza della DocumentTokenChunker classe con le opzioni specificate.

Metodi

Nome Descrizione
ProcessAsync(IngestionDocument, CancellationToken)

Suddivide un documento in blocchi in modo asincrono.

Si applica a