Partilhar via


SystemGetCrossValidationResults (Serviços de Análise - Mineração de Dados)

Aplica-se a: SQL Server 2019 e anteriores Analysis Services Azure Analysis Services Fabric/Power BI Premium

Importante

A mineração de dados foi preterida no SQL Server 2017 Analysis Services e agora descontinuada no SQL Server 2022 Analysis Services. A documentação não é atualizada para recursos preteridos e descontinuados. Para saber mais, consulte Compatibilidade com versões anteriores do Analysis Services.

Particiona a estrutura de mineração no número especificado de secções eficazes, treina um modelo para cada partição e depois devolve métricas de precisão para cada partição.

Observação

Este procedimento armazenado não pode ser usado para validar cruzadamente modelos de clustering, nem modelos construídos utilizando o algoritmo Microsoft Time Series ou o algoritmo Microsoft Sequence Clustering. Para validar modelos de clustering cruzados, pode usar o procedimento armazenado separado, SystemGetClusterCrossValidationResults (Serviços de Análise - Mineração de Dados).

Sintaxe

  
SystemGetCrossValidationResults(  
<mining structure>  
[, <mining model list>]  
,<fold count>  
,<max cases>  
,<target attribute>  
[,<target state>]  
[,<target threshold>]  
[,<test list>])  

Arguments

Estrutura mineira
Nome de uma estrutura de mineração na base de dados atual.

(required)

Lista de modelos de mineração
Lista separada por vírgulas de modelos de mineração a validar.

Se o nome de um modelo contiver caracteres que não sejam válidos no nome de um identificador, o nome deve ser incluído entre parênteses.

Se não for especificada uma lista de modelos de mineração, é realizada a validação cruzada contra todos os modelos associados à estrutura especificada e que contenham um atributo previsível.

Observação

Para validar modelos de clustering cruzados, deve usar um procedimento armazenado separado, SystemGetClusterCrossValidationResults (Serviços de Análise - Mineração de Dados).

(facultativo)

Contagem de folds
Inteiro que especifica o número de partições em que se deve separar o conjunto de dados. O valor mínimo é 2. O número máximo de dobras é o número inteiro máximo ou o número de casos, o que for menor.

Cada partição conterá aproximadamente este número de casos: número máximo de casos/e contagem de folds.

Não há nenhum valor padrão.

Observação

O número de dobras afeta significativamente o tempo necessário para realizar a validação cruzada. Se selecionar um número demasiado alto, a consulta pode durar muito tempo e, em alguns casos, o servidor pode ficar sem resposta ou ficar sem resposta.

(required)

Casos máximos
Integer que especifica o número máximo de casos que podem ser testados em todas as folds.

Um valor de 0 indica que todos os casos da fonte de dados serão utilizados.

Se especificar um valor maior do que o número real de casos no conjunto de dados, todos os casos da fonte de dados serão usados.

Não há nenhum valor padrão.

(required)

Atributo alvo
Cadeia que contém o nome do atributo previsível. Um atributo previsível pode ser uma coluna, uma coluna de tabela aninhada ou uma coluna de chave de tabela aninhada de um modelo de mineração.

Observação

A existência do atributo alvo é validada apenas em tempo de execução.

(required)

Estado alvo
Fórmula que especifica o valor a prever. Se for especificado um valor-alvo, as métricas são recolhidas apenas para o valor especificado.

Se um valor não for especificado ou for nulo, as métricas são calculadas para o estado mais provável de cada previsão.

O padrão é nulo.

Um erro é gerado durante a validação se o valor especificado não for válido para o atributo especificado, ou se a fórmula não for do tipo correto para o atributo especificado.

(facultativo)

Limiar de alvo
Duplo maior que 0 e menor que 1. Indica a pontuação mínima de probabilidade que deve ser obtida para que a previsão do estado alvo especificado seja contada como correta.

Uma previsão cuja probabilidade é inferior ou igual a este valor é considerada incorreta.

Se não for especificado valor ou for nulo, utiliza-se o estado mais provável, independentemente da sua pontuação de probabilidade.

O padrão é nulo.

Observação

O SQL Server Analysis Services não gera erro se definir o limiar de estado em 0.0, mas nunca deve usar esse valor. Na prática, um limiar de 0,0 significa que previsões com probabilidade de 0 por cento são contadas como corretas.

(facultativo)

Lista de testes
Uma cadeia que especifica opções de teste.

Nota Este parâmetro é reservado para uso futuro.

(facultativo)

Tipo de Retorno

O conjunto de linhas que é devolvido contém as pontuações de cada partição em cada modelo.

A tabela seguinte descreve as colunas do conjunto de linhas.

Nome da Coluna Description
Nome do modelo O nome do modelo que foi testado.
AttributeName O nome da coluna previsível.
AtributoEstado Um valor-alvo especificado na coluna previsível. Se este valor for nulo, foi usada a previsão mais provável.

Se esta coluna contiver um valor, a precisão do modelo é avaliada apenas com base nesse valor.
PartitionIndex Um índice baseado em 1 que identifica a que partição os resultados se aplicam.
Tamanho da partição Um inteiro que indica quantos casos foram incluídos em cada partição.
Test Categoria do teste realizado. Para uma descrição das categorias e dos testes incluídos em cada categoria, consulte Medidas no Relatório de Validação Cruzada.
Medida O nome da medida devolvido pelo teste. As medidas para cada modelo dependem do tipo do valor previsível. Para uma definição de cada medida, veja Cross-Validation (Serviços de Análise - Mineração de Dados).

Para uma lista de medidas devolvidas para cada tipo previsível, veja Medidas no Relatório de Validação Cruzada.
Valor O valor da medida de teste especificada.

Observações

Para devolver métricas de precisão para o conjunto de dados completo, use SystemGetAccuracyResults (Serviços de Análise - Mineração de Dados).

Se o modelo de mineração já foi particionado em folds, pode contornar o processamento e devolver apenas os resultados da validação cruzada usando SystemGetAccuracyResults (Serviços de Análise - Mineração de Dados).

Examples

O exemplo seguinte demonstra como particionar uma estrutura de mineração para validação cruzada em duas dobras, e depois testar dois modelos de mineração associados à estrutura de mineração, [v Target Mail].

A linha três do código lista os modelos de mineração que queres testar. Se não especificar a lista, são usados todos os modelos não clusterizados associados à estrutura. A linha quatro do código especifica o número de partições. Como não é especificado valor para os casos máximos, todos os casos na estrutura de mineração são usados e distribuídos uniformemente entre as partições.

A linha cinco especifica o atributo previsível, Comprador de Bicicleta, e a linha seis especifica o valor a prever, 1 (que significa "sim, vou comprar").

O valor NULL na linha sete indica que não existe uma barra mínima de probabilidade que deva ser cumprida. Portanto, a primeira previsão que tenha uma probabilidade diferente de zero será usada para avaliar a precisão.

CALL SystemGetCrossValidationResults(  
[v Target Mail],  
[Target Mail DT], [Target Mail NB],  
2,  
'Bike Buyer',  
1,  
NULL  
)  

Exemplos de resultados:

Nome do modelo AttributeName AtributoEstado PartitionIndex Tamanho da partição Test Medida Valor
DT do Correio Alvo Comprador de Bicicletas 1 1 500 Classification Verdadeiro Positivo 144
DT do Correio Alvo Comprador de Bicicletas 1 1 500 Classification Falso Positivo 105
DT do Correio Alvo Comprador de Bicicletas 1 1 500 Classification Verdadeiro negativo 186
DT do Correio Alvo Comprador de Bicicletas 1 1 500 Classification Falso Negativo 65
DT do Correio Alvo Comprador de Bicicletas 1 1 500 Probabilidade Registo -0.619042807138345
DT do Correio Alvo Comprador de Bicicletas 1 1 500 Probabilidade Elevação 0.0740963734002671
DT do Correio Alvo Comprador de Bicicletas 1 1 500 Probabilidade Erro quadrático médio da raiz 0.346946279977653
DT do Correio Alvo Comprador de Bicicletas 1 2 500 Classification Verdadeiro Positivo 162
DT do Correio Alvo Comprador de Bicicletas 1 2 500 Classification Falso Positivo 86
DT do Correio Alvo Comprador de Bicicletas 1 2 500 Classification Verdadeiro negativo 165
DT do Correio Alvo Comprador de Bicicletas 1 2 500 Classification Falso Negativo 87
DT do Correio Alvo Comprador de Bicicletas 1 2 500 Probabilidade Registo -0.654117781086519
DT do Correio Alvo Comprador de Bicicletas 1 2 500 Probabilidade Elevação 0.038997399132084
DT do Correio Alvo Comprador de Bicicletas 1 2 500 Probabilidade Erro quadrático médio da raiz 0.342721344892651

Requerimentos

A validação cruzada está disponível apenas no SQL Server Enterprise a partir do SQL Server 2008.

Ver também

SystemGetCrossValidationResults
SystemGetAccuracyResults (Serviços de Análise - Mineração de Dados)
SystemGetClusterCrossValidationResults (Serviços de Análise - Mineração de Dados)
SystemGetClusterAccuracyResults (Serviços de Análise - Mineração de Dados)