Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Importante
Itens marcados (versão prévia) neste artigo estão atualmente em versão prévia pública. Essa versão prévia é fornecida sem um contrato de nível de serviço e não recomendamos isso para cargas de trabalho de produção. Alguns recursos podem não ter suporte ou ter recursos restritos. Para obter mais informações, consulte Supplemental Terms of Use for Microsoft Azure Previews.
Este artigo mostra como simplificar a seleção de modelos no catálogo de modelos do Foundry usando os placares de modelos (versão prévia) e a função de comparação lado a lado no portal do Foundry. Avalie as pontuações de parâmetro de comparação do modelo entre qualidade, segurança, custo e taxa de transferência para escolher o melhor modelo para seu cenário.
Depois de ler este artigo, você pode identificar o melhor modelo para seu cenário comparando pontuações de parâmetro de comparação, exibindo gráficos de compensação e avaliando modelos lado a lado.
Analisar e comparar modelos usando:
tabela de classificação do modelo para identificar rapidamente modelos de alta performance em classificações de qualidade, segurança, custo estimado e taxa de transferência
Gráficos de compensação para comparar visualmente o desempenho do modelo entre duas métricas, como qualidade versus custo
Rankings por cenário para encontrar o ranking de benchmarks mais relevante para o seu cenário específico.
Comparar modelos para avaliar recursos, desempenho e custo estimado em uma exibição lado a lado
Pré-requisitos
Uma assinatura Azure com uma forma de pagamento válida. As assinaturas de Azure gratuitas ou de avaliação não funcionarão. Se você não tiver uma assinatura Azure, crie uma conta de Azure paga para começar.
Pelo menos a função de Leitor no projeto do Foundry. Para obter mais informações, consulte o controle de acesso baseado em função no Foundry.
Acesso ao portal do Foundry.
Tabelas de líderes do modelo de acesso
Use o catálogo de modelos para acessar o placar de líderes e identificar modelos de alto desempenho.
Se você ainda não estiver em seu projeto, selecione-o.
Selecione Descobrir na barra de navegação superior para procurar o catálogo de modelos. A página de visão geral exibe um instantâneo da tabela de classificação do modelo na parte superior.
Classifique as diferentes métricas – qualidade, segurança, custo estimado e taxa de transferência – para exibir os principais modelos para cada critério. Selecione qualquer modelo para acessar sua página de detalhes ou selecione Ir para o placar de líderes para exibir a lista completa. A página de detalhes do modelo mostra a visão geral, os parâmetros de comparação e as opções de implantação do modelo.
Na página de classificação do Modelo, veja os principais líderes em qualidade, segurança, desempenho e custo estimado. Expanda esses gráficos para exibir visualmente os 10 primeiros. Cada gráfico expandido mostra um grafo de barras dos 10 principais modelos para essa métrica.
Role para baixo dos gráficos para encontrar o ranking completo dos modelos. Classifique as métricas mais importantes e selecione um nome de modelo para acessar sua página de detalhes.
A tabela de classificação aparece com colunas classificáveis para qualidade, segurança, rendimento e custo estimado.
Selecione dois ou três modelos para comparação detalhada de recursos em uma exibição lado a lado.
A exibição de comparação é exibida, mostrando recursos, desempenho e custo estimado para seus modelos selecionados.
Gráficos de compensação
O gráfico de compensação permite comparar as compensações visualmente com base nos critérios mais importantes para você.
Por exemplo, suponha que o modelo de maior qualidade não seja o mais barato. Talvez seja necessário fazer compensações entre critérios de qualidade, segurança, custo e taxa de transferência. No gráfico de compensação, você pode comparar a performance dos modelos em relação a duas métricas de forma rápida e prática.
Use o gráfico de trade-off na página de classificação dos modelos para visualizar como os modelos equilibram os critérios concorrentes.
Use o menu suspenso Comparar qualidade com para alternar entre comparações de custo estimado, produtividade ou segurança.
Adicione ou remova modelos do gráfico de compensação usando o seletor de modelo no lado direito do gráfico.
Passe o mouse sobre um ponto de dados para exibir as pontuações exatas do modelo selecionado. Os modelos mais próximos do canto superior direito do gráfico têm um bom desempenho em ambos os eixos.
Exibir placares de líderes por cenário
Suponha que você tenha um cenário que exija determinadas funcionalidades de modelo. Por exemplo, se você estiver criando um chatbot de resposta a perguntas que precise de fortes capacidades de raciocínio e resistência a conteúdo prejudicial, compare modelos em tabelas de classificação específicas de capacidades.
Na página da tabela de líderes do modelo, role até a seção Tabelas de Líderes por cenário.
Selecione uma categoria de cenário, como Raciocínio, Codificação ou Resposta a Perguntas.
Revise a ordem de modelos para o cenário selecionado. O ranking mostra o desempenho dos modelos em benchmarks específicos para essa capacidade.
Depois de explorar os placares de líderes, decida sobre um modelo a ser usado.
Comparar modelos
A exibição de comparação lado a lado permite que você avalie até três modelos simultaneamente em várias dimensões.
No placar de modelos, selecione dois ou três modelos marcando as caixas ao lado dos seus nomes.
Selecione Comparar para abrir o modo de exibição de comparação lado a lado.
Examine a comparação entre as seguintes abas:
- Parâmetros de comparação de desempenho: pontuações de qualidade, segurança e taxa de transferência de conjuntos de dados públicos
- Detalhes do modelo: janela de contexto, dados de treinamento e idiomas compatíveis
- Pontos de extremidade com suporte: Opções de implantação, como API sem servidor e computação gerenciada.
- Suporte a recursos: recursos como chamada de função, saída estruturada e visão
Para saber mais sobre um modelo específico, selecione Exibir detalhes. Se você estiver pronto para começar a usar um modelo, selecione Implantar.
Exibir parâmetros de comparação de modelo
Para exibir parâmetros de comparação para um modelo específico, selecione o nome do modelo no placar de líderes ou pesquise-o no catálogo de modelos. Na página de detalhes do modelo, selecione a guia Parâmetros de Comparação .
Nota
Os dados de parâmetro de comparação não estão disponíveis para todos os modelos no catálogo. Se um modelo não tiver uma guia Benchmarks , os resultados do benchmark ainda não foram publicados para esse modelo. Os resultados do benchmarking realizados por Microsoft estão disponíveis para modelos selecionados. As informações de benchmarking relatadas pelos provedores são incluídas quando disponíveis.
Quando estiver na guia Parâmetros de Comparação para um modelo específico, você poderá coletar informações abrangentes para entender melhor e interpretar os resultados do parâmetro de comparação:
Resultados de parâmetro de comparação de dados públicos: pontuações agregadas de alto nível para qualidade de IA, segurança, custo estimado, latência e taxa de transferência que fornecem uma visão geral rápida do desempenho do modelo.
Gráficos comparativos: esses gráficos exibem a posição relativa do modelo em comparação com os modelos relacionados.
Tabela de comparação de métricas: esta tabela apresenta resultados detalhados para cada métrica.
Por padrão, o Foundry exibe um índice médio entre várias métricas e conjuntos de dados para fornecer uma visão geral de alto nível do desempenho do modelo.
Dica
As pontuações de parâmetro de comparação são índices normalizados. Uma pontuação mais alta indica melhor desempenho para métricas de qualidade e segurança. Para custo e taxa de transferência, o custo estimado mais baixo e a taxa de transferência mais alta geralmente são preferenciais. Use os gráficos de compensação para equilibrar esses critérios concorrentes para seu cenário.
Para acessar os resultados de parâmetro de comparação para uma métrica e um conjunto de dados específicos:
Selecione o botão expandir no gráfico. O gráfico de comparação pop-up revela informações detalhadas e oferece maior flexibilidade para comparação.
Selecione a métrica de interesse e escolha conjuntos de dados diferentes, com base em seu cenário específico. Para obter definições mais detalhadas das métricas e descrições dos conjuntos de dados públicos usados para calcular os resultados, selecione Ler mais.
Para comparações de modelo lado a lado, compare modelos para avaliar recursos, métricas de desempenho e custos estimados em vários modelos.
Nota
A opção Experimentar com seus próprios dados na guia parâmetros de comparação está disponível apenas na Foundry (clássica). Para avaliar um modelo com seus próprios dados no novo portal, consulte Avaliar aplicativos de IA generativos.
Solucionando problemas
| Questão | Resolução |
|---|---|
| O modelo não aparece no placar classificatório | Nem todos os modelos são avaliados. Verifique se há disponibilidade no catálogo de modelos. |
| Sem a guia de Parâmetros de comparação no cartão de modelo | Os resultados do benchmark ainda não foram publicados para este modelo. |
| As pontuações de parâmetro de comparação diferem dos meus resultados | Os parâmetros de comparação públicos usam conjuntos de dados padronizados e podem não refletir o desempenho em seus dados específicos. Para avaliar um modelo com seus próprios dados, consulte Avaliar aplicativos de IA generativos. |
| Gráfico de trade-off não mostra pontos de dados | Verifique se você tem modelos selecionados no seletor de modelo. Pelo menos dois modelos são necessários para comparações de compensação. |
| Não é possível comparar mais de três modelos | A exibição de comparação lado a lado dá suporte a no máximo três modelos. Desmarque um modelo antes de adicionar outro. |
| As pontuações de parâmetro de comparação parecem desatualizadas | Microsoft atualiza pontuações de parâmetro de comparação periodicamente. Verifique a página de detalhes do modelo para a data de avaliação do parâmetro de comparação. |
Conteúdo relacionado
- Tabelas de classificação dos modelos no portal do Foundry — Saiba mais sobre os parâmetros de referência, conjuntos de dados e métricas por trás das pontuações da tabela de classificação.
- Avalie aplicativos de IA generativos com o Foundry – Execute avaliações em seus próprios dados para medir o desempenho do modelo para seu cenário.
- Exibir os resultados da avaliação no portal do Foundry – Interpretar e comparar os resultados da avaliação entre execuções.