Kognitive Fähigkeit zur Extraktion von Schlüsselphrasen

Die Key Phrase Extraction-Fähigkeit bewertet unstrukturierten Text und liefert für jeden Datensatz eine Liste von Schlüsselphrasen. Diese Fähigkeit verwendet die Key Phrase Machine-Learning-Modelle, die von der Azure Language in Foundry Tools bereitgestellt werden.

Diese Funktion ist nützlich, wenn Sie schnell die Hauptthemen im Protokoll identifizieren möchten. Zum Beispiel gibt der Eingabetext "Das Essen war köstlich und es gab wunderbares Personal", der Service antwortet "Essen" und "wunderbares Personal".

Note

Diese Fähigkeit ist an Foundry Tools gebunden und erfordert eine abrechenbare Ressource für Transaktionen, die pro Indexer pro Tag 20 Dokumente umfassen. Die Ausführung der integrierten Fähigkeiten wird zum bestehenden Foundry Tools Standard-Preis berechnet.

@odata.type

Microsoft.Skills.Text.KeyPhraseExtractionSkill

Data limits

Die maximale Größe eines Datensatzes sollte 50.000 Zeichen betragen, gemessen durch String.Length. Wenn du deine Daten vor dem Senden an den Keyphrase-Extractor aufteilen musst, solltest du die Text-Split-Fähigkeit in Betracht ziehen. Wenn du eine Text-Split-Fähigkeit nutzt, stelle die Seitenlänge auf 5000 für die beste Leistung.

Skill parameters

Bei Parametern wird die Groß-/Kleinschreibung beachtet.

Inputs Description
defaultLanguageCode (Optional) Der Sprachcode, der auf Dokumente angewendet wird, die die Sprache nicht explizit angeben. Wenn der Standardsprachcode nicht angegeben ist, wird Englisch (en) als Standardsprachcode verwendet.
Siehe die vollständige Liste der unterstützten Sprachen.
maxKeyPhraseCount (Optional) Die maximale Anzahl von Schlüsselphrasen, die erzeugt werden muss.
modelVersion (Optional) Spezifiziert die Version des Modells , die beim Aufruf der Schlüsselphrase-API verwendet werden soll. Standardmäßig wird das neueste verfügbare Formular angezeigt, wenn es nicht angegeben ist. Wir empfehlen Ihnen, diesen Wert nur anzugeben, wenn es notwendig ist.

Skill inputs

Input Description
text Der zu analysierende Text.
languageCode Eine Zeichenkette, die die Sprache der Aufzeichnungen angibt. Wenn dieser Parameter nicht angegeben ist, wird der Standardcode verwendet, um die Datensätze zu analysieren.
Siehe die vollständige Liste der unterstützten Sprachen.

Skill outputs

Output Description
keyPhrases Eine Liste von Schlüsselbegriffen, die aus dem Eingabetext extrahiert wurden. Die Schlüsselphrasen werden in der Reihenfolge ihrer Bedeutung zurückgegeben.

Sample definition

Betrachten Sie einen SQL-Datensatz mit folgenden Feldern:

{
    "content": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. They accumulate ice from snowfall and lose it through melting. As global temperatures have risen, many of the world’s glaciers have already started to shrink and retreat. Continued warming could see many iconic landscapes – from the Canadian Rockies to the Mount Everest region of the Himalayas – lose almost all their glaciers by the end of the century.",
    "language": "en"
}

Dann könnte deine Fertigkeitsdefinition so aussehen:

 {
    "@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      },
      {
        "name": "languageCode",
        "source": "/document/language" 
      }
    ],
    "outputs": [
      {
        "name": "keyPhrases",
        "targetName": "myKeyPhrases"
      }
    ]
  }

Sample output

Im vorherigen Beispiel wird die Ausgabe deiner Fähigkeit auf einen neuen Knoten im angereicherten Baum namens "document/myKeyPhrases" geschrieben, da das der angegebene Knoten ist targetName . Wenn du kein Spezifizieren angibst targetName, dann wäre es "Dokument/Schlüsselphrasen".

document/myKeyPhrases

[
  "world’s glaciers", 
  "huge rivers of ice", 
  "Canadian Rockies", 
  "iconic landscapes",
  "Mount Everest region",
  "Continued warming"
]

Du kannst "document/myKeyphrases" als Eingabe für andere Skills oder als Quelle für eine Ausgabefeldzuordnung verwenden.

Warnings

Wenn du einen nicht unterstützten Sprachcode angibst, wird eine Warnung generiert und Schlüsselphrasen werden nicht extrahiert. Wenn dein Text leer ist, wird eine Warnung ausgelöst. Wenn Ihr Text größer als 50.000 Zeichen ist, werden nur die ersten 50.000 Zeichen analysiert und eine Warnung ausgegeben.

See also