Estrazione delle parole chiave delle abilità cognitive

L'abilità Estrazione delle Parole Chiave valuta il testo non strutturato e, per ogni record, restituisce un elenco di frasi chiave. Questa abilità utilizza i modelli di machine learning Key Phrase forniti da Azure Language in Foundry Tools.

Questa capacità è utile se hai bisogno di identificare rapidamente i principali punti di discussione nel verbale. Ad esempio, dato il testo di input "Il cibo era delizioso e c'era personale meraviglioso", il servizio restituisce "cibo" e "personale meraviglioso".

Note

Questa competenza è vincolata a Foundry Tools e richiede una risorsa fatturabile per transazioni che superano i 20 documenti per indicizzatore al giorno. L'esecuzione di competenze predefinite viene addebitata al prezzo standard degli strumenti Foundry esistenti.

@odata.type

Microsoft.Skills.Text.KeyPhraseExtractionSkill

Data limits

La dimensione massima di un record dovrebbe essere di 50.000 caratteri misurata da String.Length. Se devi suddividere i tuoi dati prima di inviarli all'estrattore di parole chiave, considera l'uso della competenza Text Split. Se usi una skill di divisione del testo, imposta la lunghezza della pagina a 5000 per ottenere le migliori prestazioni.

Skill parameters

I parametri fanno distinzione tra maiuscole e minuscole.

Inputs	Description
`defaultLanguageCode`	(Opzionale) Il codice linguistico da applicare a documenti che non specificano esplicitamente il linguaggio. Se il codice predefinito della lingua non è specificato, l'inglese (en) viene usato come codice predefinito. Vedi l'elenco completo delle lingue supportate.
`maxKeyPhraseCount`	(Opzionale) Il numero massimo di parole chiave da produrre.
`modelVersion`	(Opzionale) Specifica la versione del modello da utilizzare quando si chiama l'API della parola chiave. Di default viene impostato sull'ultima disponibile quando non è specificata. Ti consigliamo di non specificare questo valore a meno che non sia necessario.

Skill inputs

Input	Description
`text`	Il testo da analizzare.
`languageCode`	Una stringa che indica la lingua dei documenti. Se questo parametro non è specificato, il codice predefinito del linguaggio viene utilizzato per analizzare i record. Vedi l'elenco completo delle lingue supportate.

Skill outputs

Output	Description
`keyPhrases`	Un elenco di frasi chiave estratte dal testo di input. Le frasi chiave vengono restituite in ordine di importanza.

Sample definition

Consideriamo un record SQL che ha i seguenti campi:

{
    "content": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. They accumulate ice from snowfall and lose it through melting. As global temperatures have risen, many of the world’s glaciers have already started to shrink and retreat. Continued warming could see many iconic landscapes – from the Canadian Rockies to the Mount Everest region of the Himalayas – lose almost all their glaciers by the end of the century.",
    "language": "en"
}

Allora la tua definizione di abilità potrebbe essere questa:

 {
    "@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      },
      {
        "name": "languageCode",
        "source": "/document/language" 
      }
    ],
    "outputs": [
      {
        "name": "keyPhrases",
        "targetName": "myKeyPhrases"
      }
    ]
  }

Sample output

Per l'esempio precedente, l'output della tua abilità viene scritto in un nuovo nodo nell'albero arricchito chiamato "document/myKeyPhrases" poiché è quello targetName che abbiamo specificato. Se non specifichi un targetName, allora sarebbe "document/keyPhrases".

document/myKeyPhrases

[
  "world’s glaciers", 
  "huge rivers of ice", 
  "Canadian Rockies", 
  "iconic landscapes",
  "Mount Everest region",
  "Continued warming"
]

Puoi usare "document/myKeyPhrases" come input per altre competenze, oppure come fonte di mappatura di un campo di output.

Warnings

Se fornisci un codice linguistico non supportato, viene generato un avviso e le frasi chiave non vengono estratte. Se il tuo testo è vuoto, viene prodotto un avviso. Se il tuo testo supera i 50.000 caratteri, vengono analizzati solo i primi 50.000 caratteri e viene emessa una segnalazione.

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-04-30