Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Si applica solo a:Portale di Foundry (versione classica). Questo articolo non è disponibile per il nuovo portale foundry.
Altre informazioni sul nuovo portale.
Nota
I collegamenti in questo articolo potrebbero aprire contenuto nella nuova documentazione di Microsoft Foundry anziché nella documentazione di Foundry (versione classica) visualizzata.
Un incorporamento è un formato speciale di rappresentazione dei dati che i modelli e gli algoritmi di Machine Learning possono usare facilmente. L'incorporamento è una rappresentazione densa di informazioni del significato semantico di una parte di testo. Ogni incorporamento è un vettore di numeri a virgola mobile, in modo che la distanza tra due incorporamenti nello spazio vettoriale sia correlata alla somiglianza semantica tra due input nel formato originale. Ad esempio, se due testi sono simili, anche le rappresentazioni vettoriali dovrebbero essere simili. Incorpora la ricerca della somiglianza dei vettori di alimentazione nei sistemi di recupero, ad esempio Azure AI Search (scelta consigliata) e nei database Azure, ad esempio Azure Cosmos DB per MongoDB vCore , database SQL di Azure e Database di Azure per PostgreSQL - Server flessibile.
Incorporamento di modelli
Gli incorporamenti semplificano l'apprendimento automatico su input di grandi dimensioni che rappresentano parole acquisendo le analogie semantiche in uno spazio vettoriale. È quindi possibile usare gli incorporamenti per determinare se due blocchi di testo sono semanticamente correlati o simili e fornire un punteggio per valutare la somiglianza.
Somiglianza coseno
Gli incorporamenti di OpenAI su Azure spesso si basano sulla similarità coseno per calcolare la somiglianza tra documenti e una query.
Dal punto di vista matematico, la similarità del coseno misura il coseno dell'angolo tra due vettori proiettati in uno spazio multidimensionale. Questa misura è utile, perché se due documenti sono lontani dalla distanza euclidea a causa delle dimensioni, potrebbero comunque avere un angolo più piccolo tra di essi e quindi una maggiore somiglianza del coseno. Per altre informazioni sulle equazioni di somiglianza del coseno, vedere Somiglianza del coseno.
Un metodo alternativo per identificare documenti simili consiste nel contare il numero di parole comuni tra documenti. Questo approccio non viene ridimensionato perché è probabile che un'espansione delle dimensioni del documento comporti un maggior numero di parole comuni rilevate anche tra argomenti diversi. Per questo motivo, la somiglianza coseno può offrire un'alternativa più efficace.
Passaggi successivi
- Per ulteriori informazioni sull'uso di Azure OpenAI e degli embeddings per eseguire la ricerca di documenti, consulta la nostra guida sugli embeddings.
- Archiviare gli incorporamenti ed eseguire una ricerca vettoriale (somiglianza) usando Azure Cosmos DB per MongoDB vCore, Azure Cosmos DB per NoSQL , database SQL di Azure o Database di Azure per PostgreSQL - Server flessibile.
- Usare un Eventhouse in Microsoft Fabric per l'Intelligence in tempo reale come database Vector
- Usare la funzione series_cosine_similarity per la ricerca di somiglianza.