Freigeben über


SplitSkill interface

Eine Fähigkeit, eine Zeichenfolge in Textblöcke aufzuteilen.

Extends

Eigenschaften

azureOpenAITokenizerParameters

Gilt nur, wenn die Einheit auf azureOpenAITokens festgelegt ist. Wenn angegeben, verwendet splitSkill diese Parameter beim Ausführen der Tokenisierung. Die Parameter sind ein gültiges 'encoderModelName' und eine optionale 'allowedSpecialTokens'-Eigenschaft.

defaultLanguageCode

Ein Wert, der angibt, welcher Sprachcode verwendet werden soll. Der Standardwert ist en.

maximumPagesToTake

Gilt nur, wenn "textSplitMode" auf "Pages" festgelegt ist. Wenn angegeben, wird splitSkill nach der Verarbeitung der ersten "maximumPagesToTake"-Seiten unterbrochen, um die Leistung zu verbessern, wenn nur einige anfängliche Seiten aus jedem Dokument benötigt werden.

maxPageLength

Die gewünschte maximale Seitenlänge. Der Standardwert ist 10000.

odatatype

Polymorphe Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann

pageOverlapLength

Gilt nur, wenn "textSplitMode" auf "Pages" festgelegt ist. Wenn angegeben, beginnt der n+1. Block mit dieser Anzahl von Zeichen/Token vom Ende des n. Abschnitts.

textSplitMode

Ein Wert, der angibt, welcher Geteilte Modus ausgeführt werden soll.

unit

Gilt nur, wenn textSplitMode auf Seiten festgelegt ist. Es gibt zwei mögliche Werte. Die Auswahl der Werte bestimmt die Länge (maximumPageLength und pageOverlapLength). Der Standardwert ist "Zeichen", was bedeutet, dass die Länge durch Zeichen gemessen wird.

Geerbte Eigenschaften

context

Stellt die Ebene dar, auf der Vorgänge ausgeführt werden, z. B. der Dokumentstamm- oder Dokumentinhalt (z. B. /document oder /document/content). Der Standardwert ist /document.

description

Die Beschreibung der Fähigkeiten, die die Eingaben, Ausgaben und die Nutzung der Fähigkeiten beschreibt.

inputs

Eingaben der Fähigkeiten können eine Spalte im Quelldatensatz oder die Ausgabe einer upstream-Fähigkeit sein.

name

Der Name der Fähigkeit, die sie innerhalb des Skillsets eindeutig identifiziert. Eine Fähigkeit ohne definierten Namen erhält einen Standardnamen des 1-basierten Indexes im Kompetenzarray, dem das Zeichen "#" vorangestellt ist.

outputs

Die Ausgabe einer Fähigkeit ist entweder ein Feld in einem Suchindex oder ein Wert, der als Eingabe durch eine andere Fähigkeit genutzt werden kann.

Details zur Eigenschaft

azureOpenAITokenizerParameters

Gilt nur, wenn die Einheit auf azureOpenAITokens festgelegt ist. Wenn angegeben, verwendet splitSkill diese Parameter beim Ausführen der Tokenisierung. Die Parameter sind ein gültiges 'encoderModelName' und eine optionale 'allowedSpecialTokens'-Eigenschaft.

azureOpenAITokenizerParameters?: AzureOpenAITokenizerParameters

Eigenschaftswert

defaultLanguageCode

Ein Wert, der angibt, welcher Sprachcode verwendet werden soll. Der Standardwert ist en.

defaultLanguageCode?: "da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"

Eigenschaftswert

"da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"

maximumPagesToTake

Gilt nur, wenn "textSplitMode" auf "Pages" festgelegt ist. Wenn angegeben, wird splitSkill nach der Verarbeitung der ersten "maximumPagesToTake"-Seiten unterbrochen, um die Leistung zu verbessern, wenn nur einige anfängliche Seiten aus jedem Dokument benötigt werden.

maximumPagesToTake?: number

Eigenschaftswert

number

maxPageLength

Die gewünschte maximale Seitenlänge. Der Standardwert ist 10000.

maxPageLength?: number

Eigenschaftswert

number

odatatype

Polymorphe Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann

odatatype: "#Microsoft.Skills.Text.SplitSkill"

Eigenschaftswert

"#Microsoft.Skills.Text.SplitSkill"

pageOverlapLength

Gilt nur, wenn "textSplitMode" auf "Pages" festgelegt ist. Wenn angegeben, beginnt der n+1. Block mit dieser Anzahl von Zeichen/Token vom Ende des n. Abschnitts.

pageOverlapLength?: number

Eigenschaftswert

number

textSplitMode

Ein Wert, der angibt, welcher Geteilte Modus ausgeführt werden soll.

textSplitMode?: "pages" | "sentences"

Eigenschaftswert

"pages" | "sentences"

unit

Gilt nur, wenn textSplitMode auf Seiten festgelegt ist. Es gibt zwei mögliche Werte. Die Auswahl der Werte bestimmt die Länge (maximumPageLength und pageOverlapLength). Der Standardwert ist "Zeichen", was bedeutet, dass die Länge durch Zeichen gemessen wird.

unit?: string

Eigenschaftswert

string

Geerbte Eigenschaftsdetails

context

Stellt die Ebene dar, auf der Vorgänge ausgeführt werden, z. B. der Dokumentstamm- oder Dokumentinhalt (z. B. /document oder /document/content). Der Standardwert ist /document.

context?: string

Eigenschaftswert

string

Geerbt vonSearchIndexerSkill.context

description

Die Beschreibung der Fähigkeiten, die die Eingaben, Ausgaben und die Nutzung der Fähigkeiten beschreibt.

description?: string

Eigenschaftswert

string

Geerbt vonSearchIndexerSkill.description

inputs

Eingaben der Fähigkeiten können eine Spalte im Quelldatensatz oder die Ausgabe einer upstream-Fähigkeit sein.

inputs: InputFieldMappingEntry[]

Eigenschaftswert

Geerbt vonSearchIndexerSkill.inputs

name

Der Name der Fähigkeit, die sie innerhalb des Skillsets eindeutig identifiziert. Eine Fähigkeit ohne definierten Namen erhält einen Standardnamen des 1-basierten Indexes im Kompetenzarray, dem das Zeichen "#" vorangestellt ist.

name?: string

Eigenschaftswert

string

Von SearchIndexerSkill.namegeerbt

outputs

Die Ausgabe einer Fähigkeit ist entweder ein Feld in einem Suchindex oder ein Wert, der als Eingabe durch eine andere Fähigkeit genutzt werden kann.

outputs: OutputFieldMappingEntry[]

Eigenschaftswert

Geerbt vonSearchIndexerSkill.outputs