Informazioni sugli incorporamenti in Azure OpenAI in Microsoft Foundry Models (versione classica)

Si applica solo a:Portale di Foundry (versione classica). Questo articolo non è disponibile per il nuovo portale foundry. Altre informazioni sul nuovo portale.

Nota

I collegamenti in questo articolo potrebbero aprire contenuto nella nuova documentazione di Microsoft Foundry anziché nella documentazione di Foundry (versione classica) visualizzata.

Un incorporamento è un formato speciale di rappresentazione dei dati che i modelli e gli algoritmi di Machine Learning possono usare facilmente. L'incorporamento è una rappresentazione densa di informazioni del significato semantico di una parte di testo. Ogni incorporamento è un vettore di numeri a virgola mobile, in modo che la distanza tra due incorporamenti nello spazio vettoriale sia correlata alla somiglianza semantica tra due input nel formato originale. Ad esempio, se due testi sono simili, anche le rappresentazioni vettoriali dovrebbero essere simili. Incorpora la ricerca della somiglianza dei vettori di alimentazione nei sistemi di recupero, ad esempio Azure AI Search (scelta consigliata) e nei database Azure, ad esempio Azure Cosmos DB per MongoDB vCore , database SQL di Azure e Database di Azure per PostgreSQL - Server flessibile.

Incorporamento di modelli

Gli incorporamenti semplificano l'apprendimento automatico su input di grandi dimensioni che rappresentano parole acquisendo le analogie semantiche in uno spazio vettoriale. È quindi possibile usare gli incorporamenti per determinare se due blocchi di testo sono semanticamente correlati o simili e fornire un punteggio per valutare la somiglianza.

Somiglianza coseno

Gli incorporamenti di OpenAI su Azure spesso si basano sulla similarità coseno per calcolare la somiglianza tra documenti e una query.

Dal punto di vista matematico, la similarità del coseno misura il coseno dell'angolo tra due vettori proiettati in uno spazio multidimensionale. Questa misura è utile, perché se due documenti sono lontani dalla distanza euclidea a causa delle dimensioni, potrebbero comunque avere un angolo più piccolo tra di essi e quindi una maggiore somiglianza del coseno. Per altre informazioni sulle equazioni di somiglianza del coseno, vedere Somiglianza del coseno.

Un metodo alternativo per identificare documenti simili consiste nel contare il numero di parole comuni tra documenti. Questo approccio non viene ridimensionato perché è probabile che un'espansione delle dimensioni del documento comporti un maggior numero di parole comuni rilevate anche tra argomenti diversi. Per questo motivo, la somiglianza coseno può offrire un'alternativa più efficace.

Passaggi successivi