SplitSkill interface

Paket:: @azure/search-documents

Eine Fähigkeit, eine Zeichenfolge in Textblöcke aufzuteilen.

Extends: BaseSearchIndexerSkill

Eigenschaften

azureOpenAITokenizerParameters	Gilt nur, wenn die Einheit auf azureOpenAITokens festgelegt ist. Wenn angegeben, verwendet splitSkill diese Parameter beim Ausführen der Tokenisierung. Die Parameter sind ein gültiges 'encoderModelName' und eine optionale 'allowedSpecialTokens'-Eigenschaft.
defaultLanguageCode	Ein Wert, der angibt, welcher Sprachcode verwendet werden soll. Der Standardwert ist `en`.
maximumPagesToTake	Gilt nur, wenn "textSplitMode" auf "Pages" festgelegt ist. Wenn angegeben, wird splitSkill nach der Verarbeitung der ersten "maximumPagesToTake"-Seiten unterbrochen, um die Leistung zu verbessern, wenn nur einige anfängliche Seiten aus jedem Dokument benötigt werden.
maxPageLength	Die gewünschte maximale Seitenlänge. Der Standardwert ist 10000.
odatatype	Polymorphe Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann
pageOverlapLength	Gilt nur, wenn "textSplitMode" auf "Pages" festgelegt ist. Wenn angegeben, beginnt der n+1. Block mit dieser Anzahl von Zeichen/Token vom Ende des n. Abschnitts.
textSplitMode	Ein Wert, der angibt, welcher Geteilte Modus ausgeführt werden soll.
unit	Gilt nur, wenn textSplitMode auf Seiten festgelegt ist. Es gibt zwei mögliche Werte. Die Auswahl der Werte bestimmt die Länge (maximumPageLength und pageOverlapLength). Der Standardwert ist "Zeichen", was bedeutet, dass die Länge durch Zeichen gemessen wird.

Geerbte Eigenschaften

context	Stellt die Ebene dar, auf der Vorgänge ausgeführt werden, z. B. der Dokumentstamm- oder Dokumentinhalt (z. B. /document oder /document/content). Der Standardwert ist /document.
description	Die Beschreibung der Fähigkeiten, die die Eingaben, Ausgaben und die Nutzung der Fähigkeiten beschreibt.
inputs	Eingaben der Fähigkeiten können eine Spalte im Quelldatensatz oder die Ausgabe einer upstream-Fähigkeit sein.
name	Der Name der Fähigkeit, die sie innerhalb des Skillsets eindeutig identifiziert. Eine Fähigkeit ohne definierten Namen erhält einen Standardnamen des 1-basierten Indexes im Kompetenzarray, dem das Zeichen "#" vorangestellt ist.
outputs	Die Ausgabe einer Fähigkeit ist entweder ein Feld in einem Suchindex oder ein Wert, der als Eingabe durch eine andere Fähigkeit genutzt werden kann.

Details zur Eigenschaft

azureOpenAITokenizerParameters

Gilt nur, wenn die Einheit auf azureOpenAITokens festgelegt ist. Wenn angegeben, verwendet splitSkill diese Parameter beim Ausführen der Tokenisierung. Die Parameter sind ein gültiges 'encoderModelName' und eine optionale 'allowedSpecialTokens'-Eigenschaft.

azureOpenAITokenizerParameters?: AzureOpenAITokenizerParameters

Eigenschaftswert

AzureOpenAITokenizerParameters

defaultLanguageCode

Ein Wert, der angibt, welcher Sprachcode verwendet werden soll. Der Standardwert ist en.

defaultLanguageCode?: "da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"

Eigenschaftswert

"da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"

maximumPagesToTake

Gilt nur, wenn "textSplitMode" auf "Pages" festgelegt ist. Wenn angegeben, wird splitSkill nach der Verarbeitung der ersten "maximumPagesToTake"-Seiten unterbrochen, um die Leistung zu verbessern, wenn nur einige anfängliche Seiten aus jedem Dokument benötigt werden.

maximumPagesToTake?: number

Eigenschaftswert

number

maxPageLength

Die gewünschte maximale Seitenlänge. Der Standardwert ist 10000.

maxPageLength?: number

Eigenschaftswert

number

odatatype

Polymorphe Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann

odatatype: "#Microsoft.Skills.Text.SplitSkill"

Eigenschaftswert

"#Microsoft.Skills.Text.SplitSkill"

pageOverlapLength

Gilt nur, wenn "textSplitMode" auf "Pages" festgelegt ist. Wenn angegeben, beginnt der n+1. Block mit dieser Anzahl von Zeichen/Token vom Ende des n. Abschnitts.

pageOverlapLength?: number

Eigenschaftswert

number

textSplitMode

Ein Wert, der angibt, welcher Geteilte Modus ausgeführt werden soll.

textSplitMode?: "pages" | "sentences"

Eigenschaftswert

"pages" | "sentences"

unit

Gilt nur, wenn textSplitMode auf Seiten festgelegt ist. Es gibt zwei mögliche Werte. Die Auswahl der Werte bestimmt die Länge (maximumPageLength und pageOverlapLength). Der Standardwert ist "Zeichen", was bedeutet, dass die Länge durch Zeichen gemessen wird.

unit?: string

Eigenschaftswert

string

Geerbte Eigenschaftsdetails

context

Stellt die Ebene dar, auf der Vorgänge ausgeführt werden, z. B. der Dokumentstamm- oder Dokumentinhalt (z. B. /document oder /document/content). Der Standardwert ist /document.

context?: string

Eigenschaftswert

string

Geerbt vonSearchIndexerSkill.context

description

Die Beschreibung der Fähigkeiten, die die Eingaben, Ausgaben und die Nutzung der Fähigkeiten beschreibt.

description?: string

Eigenschaftswert

string

Geerbt vonSearchIndexerSkill.description

inputs

Eingaben der Fähigkeiten können eine Spalte im Quelldatensatz oder die Ausgabe einer upstream-Fähigkeit sein.

inputs: InputFieldMappingEntry[]

Eigenschaftswert

InputFieldMappingEntry[]

Geerbt vonSearchIndexerSkill.inputs

name

Der Name der Fähigkeit, die sie innerhalb des Skillsets eindeutig identifiziert. Eine Fähigkeit ohne definierten Namen erhält einen Standardnamen des 1-basierten Indexes im Kompetenzarray, dem das Zeichen "#" vorangestellt ist.

name?: string

Eigenschaftswert

string

Von SearchIndexerSkill.namegeerbt

outputs

Die Ausgabe einer Fähigkeit ist entweder ein Feld in einem Suchindex oder ein Wert, der als Eingabe durch eine andere Fähigkeit genutzt werden kann.

outputs: OutputFieldMappingEntry[]

Eigenschaftswert

OutputFieldMappingEntry[]

Geerbt vonSearchIndexerSkill.outputs

Feedback

War diese Seite hilfreich?

Freigeben über

SplitSkill interface

Eigenschaften

Geerbte Eigenschaften

Details zur Eigenschaft

azureOpenAITokenizerParameters

Eigenschaftswert

defaultLanguageCode

Eigenschaftswert

maximumPagesToTake

Eigenschaftswert

maxPageLength

Eigenschaftswert

odatatype

Eigenschaftswert

pageOverlapLength

Eigenschaftswert

textSplitMode

Eigenschaftswert

unit

Eigenschaftswert

Geerbte Eigenschaftsdetails

context

Eigenschaftswert

description

Eigenschaftswert

inputs

Eigenschaftswert

name

Eigenschaftswert

outputs

Eigenschaftswert

Feedback