Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Il rilevamento della scena rileva quando una scena cambia in un video in base ai segnali visivi. Una scena mostra un singolo evento e ha una serie di scatti correlati. Gli scatti sono una serie di fotogrammi che differiscono per segnali visivi, come cambiamenti improvvisi o graduali nella combinazione di colori di fotogrammi adiacenti. I metadati della ripresa includono l'ora di inizio, l'ora di fine e un elenco di fotogrammi chiave nella ripresa. Un fotogramma chiave è un fotogramma di una ripresa che rappresenta al meglio la scena.
Casi d'uso del rilevamento di scene, di riprese e di fotogrammi chiave
- Esplorare, gestire e modificare facilmente i contenuti video in base alle diverse granularità.
- Usa il rilevamento del tipo di ripresa editoriale per modificare i video in clip o trailer, oppure quando si cerca uno stile specifico di fotogramma chiave.
Rilevamento della scena
Video Indexer di Azure per intelligenza artificiale determina quando una scena cambia in base ai segnali visivi. Una scena illustra un singolo evento composto da una serie di scatti consecutivi, che sono correlati semanticamente.
Un'anteprima della scena è il primo fotogramma chiave dello scatto sottostante.
Azure AI Video Indexer segmenta un video in scene in base alla coerenza dei colori tra scatti consecutivi e recupera l'ora iniziale e finale di ogni scena.
I video devono contenere almeno tre scene.
Rilevamento inquadratura
Video Indexer di Azure per intelligenza artificiale determina quando un'immagine cambia nel video in base ai segnali visivi. Lo fa rilevando transizioni improvvise e graduali nella combinazione di colori e altre caratteristiche visive dei fotogrammi adiacenti. I metadati dello scatto includono un'ora di inizio e di fine e l'elenco dei fotogrammi chiave inclusi nello scatto. Gli scatti sono fotogrammi consecutivi acquisiti contemporaneamente dalla stessa fotocamera.
Nota
Potrebbe esserci un divario tra gli scatti che include fotogrammi che sono parte della transizione. Pertanto, questi fotogrammi non sono considerati parte della ripresa.
Rilevamento del tipo di scatto del fotogramma chiave editoriale
Il tipo di inquadratura viene determinato in base all'analisi del primo fotogramma chiave di ogni inquadratura. Le inquadrature vengono identificate in base alla scala, alle dimensioni e alla posizione dei volti che appaiono nel primo fotogramma chiave.
Le dimensioni e la scala dello scatto vengono determinate in base alla distanza tra la fotocamera e i visi che appaiono nel fotogramma. Video Indexer di Azure per intelligenza artificiale rileva i tipi di screenshot seguenti usando queste proprietà:
- Wide: mostra il corpo di un'intera persona.
- Medio: mostra il corpo superiore e il viso di una persona.
- Primo piano: mostra principalmente il viso di una persona.
- Primo piano estremo: mostra la faccia di una persona che riempie lo schermo.
I tipi di inquadratura possono anche essere determinati dalla posizione dei caratteri del soggetto rispetto al centro del fotogramma. Questa proprietà definisce i tipi di screenshot seguenti in Azure AI Video Indexer:
- Sinistra inquadratura: una persona appare sul lato sinistro dell'inquadratura.
- Volto centrale: una persona viene visualizzata nell'area centrale della cornice.
- Lato destro: una persona appare sul lato destro dell'inquadratura.
- Esterno: una persona è presente in un ambiente esterno.
- Interni: una persona viene visualizzata in un ambiente interno.
Altre caratteristiche:
- Due scatti: mostra i volti di due persone di medie dimensioni.
- Molteplici volti: più di due persone.
Visualizzare il codice JSON di informazioni dettagliate con il portale Web
Dopo aver caricato e indicizzato un video, scaricare informazioni dettagliate in formato JSON dal portale Web.
- Selezionare la scheda Libreria .
- Seleziona il supporto che desideri.
- Selezionare Download e quindi Insights (JSON). Il file JSON viene aperto in una nuova scheda del browser.
- Trovare la coppia di chiavi descritta nella risposta di esempio.
Usare l'API
- Usare una richiesta di Get Video Index. Passare
&includeSummarizedInsights=false. - Trovare le coppie chiave descritte nella risposta di esempio.
Esempio di risposta
"scenes": [
{
"id": 1,
"instances": [
{
"adjustedStart": "0:00:00",
"adjustedEnd": "0:00:09.1333333",
"start": "0:00:00",
"end": "0:00:09.1333333"
}
]
},
{
"id": 2,
"instances": [
{
"adjustedStart": "0:00:09.1333333",
"adjustedEnd": "0:00:10.8",
"start": "0:00:09.1333333",
"end": "0:00:10.8"
}
]
},
{
"id": 3,
"instances": [
{
"adjustedStart": "0:00:10.8",
"adjustedEnd": "0:00:26.9333333",
"start": "0:00:10.8",
"end": "0:00:26.9333333"
}
]
}...
{
"id": 31,
"instances": [
{
"adjustedStart": "0:18:45",
"adjustedEnd": "0:18:50.2",
"start": "0:18:45",
"end": "0:18:50.2"
}
]
}
],
"shots": [
{
"id": 1,
"tags": [
"Wide",
"Medium"
],
"keyFrames": [
{
"id": 1,
"instances": [
{
"thumbnailId": "60152925-0e6d-48cf-be33-aa6c00dfb334",
"adjustedStart": "0:00:00.1666667",
"adjustedEnd": "0:00:00.2",
"start": "0:00:00.1666667",
"end": "0:00:00.2"
}
]
},
{
"id": 2,
"instances": [
{
"thumbnailId": "f1a09cdf-b42b-45f5-bc69-5292d1216e50",
"adjustedStart": "0:00:00.2333333",
"adjustedEnd": "0:00:00.2666667",
"start": "0:00:00.2333333",
"end": "0:00:00.2666667"
}
]
}
],
"instances": [
{
"adjustedStart": "0:00:00",
"adjustedEnd": "0:00:01.9333333",
"start": "0:00:00",
"end": "0:00:01.9333333"
}
]
},
{
"id": 2,
"tags": [
"Medium"
],
"keyFrames": [
{
"id": 3,
"instances": [
{
"thumbnailId": "b17774d0-41cf-4174-9c41-6bc2f17c86e2",
"adjustedStart": "0:00:02",
"adjustedEnd": "0:00:02.0333333",
"start": "0:00:02",
"end": "0:00:02.0333333"
}
]
}
],
"instances": [
{
"adjustedStart": "0:00:01.9333333",
"adjustedEnd": "0:00:02.9666667",
"start": "0:00:01.9333333",
"end": "0:00:02.9666667"
}
]
}...
Scaricare i fotogrammi chiave con l'API
Per scaricare ogni fotogramma-chiave, usa gli ID dei fotogrammi-chiave con una richiesta API Ottieni miniature.
Avviso
Non usare i dati direttamente dalla cartella artefatti per scopi di produzione. Gli artefatti sono output intermedi del processo di indicizzazione e sono output non elaborati di motori di intelligenza artificiale diversi che analizzano i video. Lo schema degli artefatti potrebbe cambiare nel tempo.
Importante
Consultare la panoramica delle note sulla trasparenza per le funzionalità di VI.
Note di rilevamento di scene, riprese e fotogrammi chiave
- Il rilevatore funziona meglio sui file multimediali con riprese e scene all'interno di essi.
- Se il video viene filmato con una camera che non si muove mai, la segmentazione dell'inquadratura funziona male e i fotogrammi chiave potrebbero non essere rappresentativi.
- I fotogrammi chiave vengono selezionati tenendo conto del livello di sfocatura delle immagini. Se la maggior parte dello scatto è sfocata, ad esempio a causa del movimento, il fotogramma chiave potrebbe anche essere sfocato.
- I video con scarsa qualità visiva producono risultati scarsi.
- L'ora di ogni colpo/scena/fotogramma chiave può essere spostata (inferiore a un secondo).
I componenti scena, inquadratura e keyframe
Nessun componente definito.
Codice di esempio
Vedere tutti gli esempi per VI