Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Importante
A partir de 20 de setembro de 2023, não poderá criar novos recursos Personalizer. O serviço Personalizer será retirado a 1 de outubro de 2026. Recomendamos migrar para o open-source microsoft/learning-loop.
As configurações de aprendizagem determinam os hiperparâmetros do modelo de treinamento. Dois modelos dos mesmos dados que são treinados em diferentes configurações de aprendizagem acabarão sendo diferentes.
Políticas de aprendizagem de importação e exportação
Pode importar e exportar ficheiros de políticas de aprendizagem a partir do portal Azure. Use esse método para salvar políticas existentes, testá-las, substituí-las e arquivá-las em seu controle de código-fonte como artefatos para referência e auditoria futuras.
Aprenda como importar e exportar uma política de aprendizagem no portal Azure do seu recurso Personalizer.
Compreender as configurações da política de aprendizagem
As configurações na política de aprendizagem não devem ser alteradas. Altere as configurações somente se entender como elas afetam o Personalizador. Sem esse conhecimento, você pode causar problemas, incluindo invalidar modelos do Personalizador.
Personalizer utiliza vowpalwabbit para treinar e avaliar os eventos. Consulte a documentação do vowpalwabbit sobre como editar as configurações de aprendizagem usando o vowpalwabbit. Quando tiver os argumentos corretos na linha de comandos, guarde o comando num ficheiro com o seguinte formato (substitua o valor da propriedade arguments pelo comando desejado) e carregue o ficheiro para importar as definições de aprendizagem no painel Model and Learning Settings no portal Azure do seu recurso Personalizer.
O seguinte .json é um exemplo de uma política de aprendizagem.
{
"name": "new learning settings",
"arguments": " --cb_explore_adf --epsilon 0.2 --power_t 0 -l 0.001 --cb_type mtr -q ::"
}
Comparar políticas de aprendizagem
Você pode comparar o desempenho de diferentes políticas de aprendizagem em relação a dados anteriores nos logs do Personalizer fazendo avaliações offline.
Carregue as suas próprias políticas de aprendizagem para as comparar com a política de aprendizagem atual.
Otimizar as políticas de aprendizagem
O personalizador pode criar uma política de aprendizagem otimizada em uma avaliação offline. Uma política de aprendizagem otimizada que tenha melhores recompensas em uma avaliação off-line produzirá melhores resultados quando for usada on-line no Personalizador.
Depois de otimizar uma política de aprendizagem, você pode aplicá-la diretamente ao Personalizador para que ela substitua imediatamente a política atual. Ou você pode salvar a política otimizada para avaliação adicional e, posteriormente, decidir se deseja descartá-la, salvá-la ou aplicá-la.
Próximos passos
- Aprenda sobre eventos ativos e inativos.