Che cos'è Personalizer?

Importante

A partire dal 20 settembre 2023 non sarà possibile creare nuove risorse di Personalizer. Il servizio Personalizer sarà ritirato il 1° ottobre 2026. Consigliamo di migrare al microsoft/learning-loop open-source.

Personalizza esperienze di Azure AI è un servizio di intelligenza artificiale che aiuta le applicazioni a prendere decisioni più intelligenti su larga scala utilizzando l'apprendimento con rinforzo. Personalizer elabora le informazioni sullo stato dell'applicazione, dello scenario e/o degli utenti (contesti), e un set di decisioni possibili e attributi correlati (azioni) per determinare la decisione migliore da prendere. Il feedback dall'applicazione (ricompense) viene inviato a Personalizer affinché possa imparare a migliorare la sua capacità decisionale in quasi tempo reale.

Il Personalizer può determinare le azioni migliori da intraprendere in diversi scenari:

E-commerce: quale prodotto deve essere mostrato ai clienti per massimizzare le probabilità di acquisto?
Raccomandazione sui contenuti: quale articolo deve essere mostrato per aumentare il tasso di clic?
Progettazione dei contenuti: dove deve essere posizionato un annuncio per ottimizzare il coinvolgimento degli utenti su un sito web?
Comunicazione: quando e come deve essere inviata una notifica per massimizzare le possibilità di risposta?

Per iniziare a usare Personalizza esperienze, seguire la guida di avvio rapido oppure provare Personalizza esperienze nel browser con questa demo interattiva.

Questa documentazione contiene i tipi di articoli seguenti:

Guide di avvio rapido: forniscono istruzioni dettagliate per la configurazione, oltre a codice di esempio per iniziare a inviare richieste API al servizio.
Guide pratiche contengono istruzioni per l'uso delle caratteristiche e delle funzionalità avanzate di Personalizer.
Esempi di codice mostrano come usare Personalizer e ad aiutarti a interfacciare facilmente la tua applicazione con il servizio.
Esercitazioni sono guide più dettagliate che implementano Personalizer come parte di una soluzione aziendale più ampia.
Concetti forniscono ulteriori dettagli sulle caratteristiche, le capacità e i fondamenti di Personalizer.

Come funziona Personalizza esperienze?

Personalizer usa l'apprendimento per rinforzo per selezionare l'azione migliore in un determinato contesto tra tutti gli utenti al fine di massimizzare una ricompensa media.

Contesto: informazioni che descrivono lo stato dell'applicazione, dello scenario o dell'utente che possono essere rilevanti per prendere una decisione.
- Esempio: l'ubicazione, il tipo di dispositivo, l'età e gli argomenti preferiti degli utenti che visitano un sito Web.
Azioni: un insieme discreto di elementi tra cui è possibile scegliere, insieme agli attributi che descrivono ogni elemento.
- Esempio: un insieme di articoli di notizie e gli argomenti illustrati in ogni articolo.
Ricompensa: punteggio numerico compreso tra 0 e 1 che indica se la decisione è stata cattiva (0) o buona (1).
- Esempio: "1" indica che un utente ha fatto clic sull'articolo suggerito, mentre "0" indica che l'utente non lo ha fatto.

API Classificazione e Ricompensa

Personalizer ti consente di sfruttare la potenza e la flessibilità dell'apprendimento per rinforzo usando solo due API principali.

L'RankAPI viene chiamato dall'applicazione ogni volta che si deve prendere una decisione. L'applicazione invia un codice JSON contenente un insieme di azioni, funzionalità che descrivono ogni azione e funzionalità che descrivono il contesto corrente. Ogni chiamata all'API Classificazione è nota come evento e annotata con un ID evento univoco. Personalizer quindi restituisce l'ID della migliore azione che massimizza la ricompensa media complessiva come stabilito dal modello sottostante.

L'APIReward viene chiamata dall'applicazione ogni volta che c'è un feedback che può aiutare Personalizer a determinare se l'ID azione restituito nella chiamata Rank ha fornito valore. Ad esempio, se un utente ha fatto clic sull'articolo di notizie suggerito o ha completato l'acquisto di un prodotto suggerito. Una chiamata all'API Ricompensa può essere eseguita in tempo reale (subito dopo l'esecuzione della chiamata all'API Classificazione) o ritardata per soddisfare meglio le esigenze dello scenario. Il punteggio di ricompensa è determinato dalle metriche e dagli obiettivi aziendali e può essere generato da un algoritmo o da determinate regole nell'applicazione. Il punteggio è un numero con valore reale compreso tra 0 e 1.

Modalità di apprendimento

Modalità apprendista Analogamente a come un apprendista impara un mestiere osservando un esperto, la modalità apprendista consente a Personalizza esperienze di apprendere osservando la logica decisionale corrente dell'applicazione. Questo permette di attenuare il cosiddetto problema di avvio a freddo con un nuovo modello non sottoposto a training e consente di convalidare le funzionalità di azione e contesto inviate a Personalizza esperienze. In modalità apprendista ogni chiamata all'API Classificazione restituisce l'azione di base o l'azione predefinita, ovvero l'azione che l'applicazione avrebbe eseguito senza usare Personalizza esperienze. Questa azione viene inviata dalla tua applicazione a Personalizer nell'API Ranking come primo elemento nell'insieme di azioni possibili.
Modalità online Personalizza esperienze restituisce l'azione migliore in base al contesto, come determinato dal modello di apprendimento per rinforzo sottostante, ed esplora altre possibili azioni che potrebbero migliorare le prestazioni. Personalizza esperienze apprende dal feedback fornito nelle chiamate all'API Ricompensa.

Tenere presente che Personalizer usa informazioni collettive provenienti da tutti gli utenti per apprendere le azioni migliori in base al contesto corrente. Il servizio non si occupa di:

Gestire e rendere persistenti le informazioni del profilo utente. Non devono essere inviati ID utente univoci a Personalizer.
Registrare le preferenze o i dati cronologici dei singoli utenti.

Scenari di esempio

Ecco alcuni esempi in cui è possibile usare Personalizer per selezionare il contenuto migliore da presentare a un utente.

Tipo di contenuto	Azioni {funzionalità}	Caratteristiche del contesto	ID azione ricompensa restituito (visualizza questo contenuto)
Articoli di notizie	a) `The president...`, {nazionale, politica, [testo]} b. `Premier League ...`, {internazionale, sport, [testo, immagine, video]} c. `Hurricane in the ...`, {locale, meteo, [testo, immagine]}	Country='USA', Recent_Topics=('politica', 'affari') Month='Ottobre'	a `The president...`
Film	1. `Star Wars` {1977, [azione, avventura, fantasy], George Lucas} 2. `Hoop Dreams` {1994, [documentario, sport], Steve James} 3. `Casablanca` {1942, [commedia, genere drammatico, guerra], Michael Curtiz}	Dispositivo='smart TV' Screen_Size='large', GenerePreferito='classici'	3. `Casablanca`
Prodotti di e-commerce	i. `Product A` {3 kg, €€€€, consegna in 1 giorno} ii. `Product B` {20 kg, $$, consegnare entro 7 giorni} iii. `Product C` {3 kg, €, consegna in 2 giorni}	Device='iPhone', Spending_Tier='basso', Month='Giugno'	ii. `Product B`

Requisiti dello scenario

Usa Personalizer quando il tuo scenario ha:

Un insieme limitato di azioni o elementi tra cui scegliere in ogni evento di personalizzazione. È consigliabile non superare 50 azioni in ogni chiamata all'API Classificazione. In presenza di un insieme più ampio di azioni possibili, è consigliabile usare un motore di raccomandazioni o un altro meccanismo per ridurre l'elenco di azioni prima di chiamare l'API Classificazione.
Informazioni che descrivono le azioni (funzionalità dell'azione).
Informazioni che descrivono il contesto corrente (funzionalità contestuali).
Un volume di dati sufficiente per consentire a Personalizer di imparare. In generale, si consiglia un minimo di 1.000 eventi al giorno per consentire a Personalizer di apprendere in modo efficace. Se il Personalizer non riceve un numero sufficiente di dati, il servizio richiede più tempo per determinare le azioni migliori.

Uso responsabile dell'IA

In Microsoft, ci impegniamo per il progresso dell'IA guidato dai principi che hanno messo le persone al primo posto. I modelli di IA come quelli disponibili nel servizio Personalizza esperienze hanno notevoli vantaggi potenziali, ma senza un'attenta progettazione e una ponderata mitigazione, tali modelli rischiano di generare contenuti errati o addirittura dannosi. Microsoft ha effettuato investimenti significativi per evitare abusi e danni imprevisti, incorporando Microsoft principi per l'uso responsabile dell'IA, creando filtri di contenuto per supportare i clienti e fornendo indicazioni per l'implementazione dell'IA responsabile ai clienti. Vedere i documenti sull'IA responsabile per Personalizer.

Integrare Personalizer in un'applicazione

Progettare e pianificare le azioni e il contesto. Determinare come interpretare il feedback come punteggio di ricompensa.

Ogni risorsa di personalizzazione creata viene definita come un ciclo di apprendimento. Il ciclo riceverà le chiamate alle API Rank e Reward per quel contenuto o esperienza utente ed eseguirà il training di un modello sottostante di apprendimento con rinforzo. Sono disponibili tre modalità:

Tipo di risorsa	Scopo
Modalità apprendista - `E0`	Eseguire il training di Personalizer per simulare la logica decisionale corrente senza influenzare l'applicazione esistente, prima di utilizzare la modalità online per apprendere politiche migliori in un ambiente di produzione.
Modalità online - Standard, `S0`	Personalizer utilizza l'apprendimento per rinforzo per determinare le migliori azioni in produzione.
Modalità online - Gratuita, `F0`	Prova Personalizer in un ambiente limitato non di produzione.

Aggiungere Personalizer all'applicazione, al sito Web o al sistema:

Aggiungere una chiamata Rank a Personalizer nell'applicazione, nel sito Web o nel sistema per determinare l'azione migliore.
Usare l'azione migliore, specificata come azione di ricompensa ID nello scenario.

Applicare la logica di business al comportamento o ai dati di feedback degli utenti per determinare il punteggio di ricompensa. Ad esempio:

Comportamento	Punteggio di ricompensa calcolato
L'utente ha selezionato un articolo di notizie suggerito da Personalizer	1
L'utente ha selezionato un articolo di notizie non suggerito da Personalizer	0
L'utente ha esitato a selezionare un articolo di notizie, scorrendo la pagina con indecisione, e infine ha selezionato l'articolo di notizie suggerito da Personalizza esperienze	0,5

Aggiungere una chiamata Reward per l'invio di un punteggio di ricompensa compreso tra 0 e 1
- Subito dopo la ricezione del feedback.
- In un momento successivo in scenari in cui è previsto un feedback ritardato.
Valuta il loop operativo con una valutazione offline dopo un periodo di tempo in cui Personalizer ha ricevuto dati significativi per prendere decisioni online. La valutazione offline consente di testare e valutare l'efficacia del servizio Personalizza esperienze senza modifiche al codice e senza alcun impatto sull'esperienza utente.

Passaggi successivi

Introduzione rapida a Personalizer

Last updated on 2026-04-09