Partilhar via


SystemGetClusterCrossValidationResults (Serviços de Análise - Mineração de Dados)

Aplica-se a: SQL Server 2019 e anteriores Analysis Services Azure Analysis Services Fabric/Power BI Premium

Importante

A mineração de dados foi preterida no SQL Server 2017 Analysis Services e agora descontinuada no SQL Server 2022 Analysis Services. A documentação não é atualizada para recursos preteridos e descontinuados. Para saber mais, consulte Compatibilidade com versões anteriores do Analysis Services.

Particiona a estrutura de mineração no número especificado de secções eficazes, treina um modelo para cada partição e depois devolve métricas de precisão para cada partição.

Nota Este procedimento armazenado só pode ser usado com uma estrutura de mineração que contenha pelo menos um modelo de clustering. Para validar de forma cruzada modelos que não são clustering, deve usar SystemGetCrossValidationResults (Serviços de Análise - Mineração de Dados).

Sintaxe

  
SystemGetClusterCrossValidationResults(  
<structure name>,   
[,<mining model list>]  
,<fold count>}  
,<max cases>  
<test list>])  

Arguments

Estrutura mineira
Nome de uma estrutura de mineração na base de dados atual.

(required)

Lista de modelos de mineração
Lista separada por vírgulas de modelos de mineração a validar.

Se não for especificada uma lista de modelos de mineração, é realizada a validação cruzada contra todos os modelos de agrupamento associados à estrutura especificada.

Observação

Para validar de forma cruzada modelos que não são modelos de clustering, deve usar um procedimento armazenado separado, SystemGetCrossValidationResults (Serviços de Análise - Mineração de Dados).

(facultativo)

Contagem de folds
Inteiro que especifica o número de partições em que se deve separar o conjunto de dados. O valor mínimo é 2. O número máximo de dobras é o número inteiro máximo ou o número de casos, o que for menor.

Cada partição conterá aproximadamente este número de casos: número máximo de casos/e contagem de folds.

Não há nenhum valor padrão.

Observação

O número de dobras afeta significativamente o tempo necessário para realizar a validação cruzada. Se selecionar um número demasiado alto, a consulta pode correr durante muito tempo e, em alguns casos, o servidor pode ficar sem resposta ou ficar sem resposta.

(required)

Casos máximos
Integer que especifica o número máximo de casos que podem ser testados.

Um valor de 0 indica que todos os casos da fonte de dados serão utilizados.

Se especificar um número superior ao número real de casos no conjunto de dados, todos os casos da fonte de dados serão utilizados.

(required)

Lista de testes
Uma cadeia que especifica opções de teste.

Nota Este parâmetro é reservado para uso futuro.

(facultativo)

Tipo de Retorno

A tabela de Tipos de Retorno contém pontuações para cada partição individual e agregados para todos os modelos.

A tabela seguinte descreve as colunas devolvidas.

Nome da Coluna Description
Nome do modelo O nome do modelo que foi testado.
AttributeName O nome da coluna previsível. Para modelos de cluster, sempre nulo.
AtributoEstado Um valor-alvo especificado na coluna previsível. Para modelos de cluster, sempre nulo.
PartitionIndex Um índice baseado em 1 que identifica a que partição se aplicam os resultados.
Tamanho da partição Um inteiro que indica quantos casos foram incluídos em cada partição.
Test O tipo de teste que foi realizado.
Medida O nome da medida devolvido pelo teste. As medidas para cada modelo dependem do tipo do valor previsível. Para uma definição de cada medida, veja Cross-Validation (Serviços de Análise - Mineração de Dados).

Para uma lista de medidas devolvidas para cada tipo previsível, veja Medidas no Relatório de Validação Cruzada.
Valor O valor da medida de teste especificada.

Observações

Para devolver métricas de precisão para todo o conjunto de dados, use SystemGetClusterAccuracyResults (Serviços de Análise - Mineração de Dados).

Além disso, se o modelo de mineração já tiver sido particionado em folds, pode contornar o processamento e devolver apenas os resultados da validação cruzada usando SystemGetClusterAccuracyResults (Serviços de Análise - Mineração de Dados).

Examples

O exemplo seguinte demonstra como particionar uma estrutura de mineração em três dobras e depois testar dois modelos de agrupamento associados à estrutura de mineração.

A terceira linha do código lista os modelos de mineração específicos que queres testar. Se não especificar a lista, são usados todos os modelos de agrupamento associados à estrutura.

A linha quatro do código especifica o número de dobras, e a linha cinco indica o número máximo de casos a utilizar.

Como estes são modelos de agrupamento, não precisa de especificar um atributo ou valor previsível.

CALL SystemGetClusterCrossValidationResults(  
[v Target Mail],  
[Cluster 1], [Cluster 2],  
3,  
10000  
)  

Exemplos de resultados:

Nome do modelo AttributeName AtributoEstado PartitionIndex Tamanho da partição Test Medida Valor
Cluster 1 1 3025 Clusterização Verosimilhança de Caso 0.930524511864121
Cluster 1 2 3025 Clusterização Verosimilhança de Caso 0.919184178430778
Cluster 1 3 3024 Clusterização Verosimilhança de Caso 0.929651120490248
Cluster 2 1 1289 Clusterização Verosimilhança de Caso 0.922789726933607
Cluster 2 2 1288 Clusterização Verosimilhança de Caso 0.934865535691068
Cluster 2 3 1288 Clusterização Verosimilhança de Caso 0.924724595688798

Requerimentos

A validação cruzada está disponível apenas no SQL Server Enterprise a partir do SQL Server 2008.

Ver também

SystemGetCrossValidationResults (Serviços de Análise - Mineração de Dados)
SystemGetAccuracyResults (Serviços de Análise - Mineração de Dados)
SystemGetClusterCrossValidationResults
SystemGetClusterAccuracyResults (Serviços de Análise - Mineração de Dados)