SplitSkill interface
Eine Fähigkeit, eine Zeichenfolge in Textblöcke aufzuteilen.
- Extends
Eigenschaften
| azure |
Gilt nur, wenn die Einheit auf azureOpenAITokens festgelegt ist. Wenn angegeben, verwendet splitSkill diese Parameter beim Ausführen der Tokenisierung. Die Parameter sind ein gültiges 'encoderModelName' und eine optionale 'allowedSpecialTokens'-Eigenschaft. |
| default |
Ein Wert, der angibt, welcher Sprachcode verwendet werden soll. Der Standardwert ist |
| maximum |
Gilt nur, wenn "textSplitMode" auf "Pages" festgelegt ist. Wenn angegeben, wird splitSkill nach der Verarbeitung der ersten "maximumPagesToTake"-Seiten unterbrochen, um die Leistung zu verbessern, wenn nur einige anfängliche Seiten aus jedem Dokument benötigt werden. |
| max |
Die gewünschte maximale Seitenlänge. Der Standardwert ist 10000. |
| odatatype | Polymorphe Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann |
| page |
Gilt nur, wenn "textSplitMode" auf "Pages" festgelegt ist. Wenn angegeben, beginnt der n+1. Block mit dieser Anzahl von Zeichen/Token vom Ende des n. Abschnitts. |
| text |
Ein Wert, der angibt, welcher Geteilte Modus ausgeführt werden soll. |
| unit | Gilt nur, wenn textSplitMode auf Seiten festgelegt ist. Es gibt zwei mögliche Werte. Die Auswahl der Werte bestimmt die Länge (maximumPageLength und pageOverlapLength). Der Standardwert ist "Zeichen", was bedeutet, dass die Länge durch Zeichen gemessen wird. |
Geerbte Eigenschaften
| context | Stellt die Ebene dar, auf der Vorgänge ausgeführt werden, z. B. der Dokumentstamm- oder Dokumentinhalt (z. B. /document oder /document/content). Der Standardwert ist /document. |
| description | Die Beschreibung der Fähigkeiten, die die Eingaben, Ausgaben und die Nutzung der Fähigkeiten beschreibt. |
| inputs | Eingaben der Fähigkeiten können eine Spalte im Quelldatensatz oder die Ausgabe einer upstream-Fähigkeit sein. |
| name | Der Name der Fähigkeit, die sie innerhalb des Skillsets eindeutig identifiziert. Eine Fähigkeit ohne definierten Namen erhält einen Standardnamen des 1-basierten Indexes im Kompetenzarray, dem das Zeichen "#" vorangestellt ist. |
| outputs | Die Ausgabe einer Fähigkeit ist entweder ein Feld in einem Suchindex oder ein Wert, der als Eingabe durch eine andere Fähigkeit genutzt werden kann. |
Details zur Eigenschaft
azureOpenAITokenizerParameters
Gilt nur, wenn die Einheit auf azureOpenAITokens festgelegt ist. Wenn angegeben, verwendet splitSkill diese Parameter beim Ausführen der Tokenisierung. Die Parameter sind ein gültiges 'encoderModelName' und eine optionale 'allowedSpecialTokens'-Eigenschaft.
azureOpenAITokenizerParameters?: AzureOpenAITokenizerParameters
Eigenschaftswert
defaultLanguageCode
Ein Wert, der angibt, welcher Sprachcode verwendet werden soll. Der Standardwert ist en.
defaultLanguageCode?: "da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"
Eigenschaftswert
"da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"
maximumPagesToTake
Gilt nur, wenn "textSplitMode" auf "Pages" festgelegt ist. Wenn angegeben, wird splitSkill nach der Verarbeitung der ersten "maximumPagesToTake"-Seiten unterbrochen, um die Leistung zu verbessern, wenn nur einige anfängliche Seiten aus jedem Dokument benötigt werden.
maximumPagesToTake?: number
Eigenschaftswert
number
maxPageLength
Die gewünschte maximale Seitenlänge. Der Standardwert ist 10000.
maxPageLength?: number
Eigenschaftswert
number
odatatype
Polymorphe Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann
odatatype: "#Microsoft.Skills.Text.SplitSkill"
Eigenschaftswert
"#Microsoft.Skills.Text.SplitSkill"
pageOverlapLength
Gilt nur, wenn "textSplitMode" auf "Pages" festgelegt ist. Wenn angegeben, beginnt der n+1. Block mit dieser Anzahl von Zeichen/Token vom Ende des n. Abschnitts.
pageOverlapLength?: number
Eigenschaftswert
number
textSplitMode
Ein Wert, der angibt, welcher Geteilte Modus ausgeführt werden soll.
textSplitMode?: "pages" | "sentences"
Eigenschaftswert
"pages" | "sentences"
unit
Gilt nur, wenn textSplitMode auf Seiten festgelegt ist. Es gibt zwei mögliche Werte. Die Auswahl der Werte bestimmt die Länge (maximumPageLength und pageOverlapLength). Der Standardwert ist "Zeichen", was bedeutet, dass die Länge durch Zeichen gemessen wird.
unit?: string
Eigenschaftswert
string
Geerbte Eigenschaftsdetails
context
Stellt die Ebene dar, auf der Vorgänge ausgeführt werden, z. B. der Dokumentstamm- oder Dokumentinhalt (z. B. /document oder /document/content). Der Standardwert ist /document.
context?: string
Eigenschaftswert
string
Geerbt vonSearchIndexerSkill.context
description
Die Beschreibung der Fähigkeiten, die die Eingaben, Ausgaben und die Nutzung der Fähigkeiten beschreibt.
description?: string
Eigenschaftswert
string
Geerbt vonSearchIndexerSkill.description
inputs
Eingaben der Fähigkeiten können eine Spalte im Quelldatensatz oder die Ausgabe einer upstream-Fähigkeit sein.
inputs: InputFieldMappingEntry[]
Eigenschaftswert
Geerbt vonSearchIndexerSkill.inputs
name
Der Name der Fähigkeit, die sie innerhalb des Skillsets eindeutig identifiziert. Eine Fähigkeit ohne definierten Namen erhält einen Standardnamen des 1-basierten Indexes im Kompetenzarray, dem das Zeichen "#" vorangestellt ist.
name?: string
Eigenschaftswert
string
Von SearchIndexerSkill.namegeerbt
outputs
Die Ausgabe einer Fähigkeit ist entweder ein Feld in einem Suchindex oder ein Wert, der als Eingabe durch eine andere Fähigkeit genutzt werden kann.
outputs: OutputFieldMappingEntry[]
Eigenschaftswert
Geerbt vonSearchIndexerSkill.outputs