Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Aplica-se a:
SQL Server 2019 e anteriores Analysis Services
Azure Analysis Services
Fabric/Power BI Premium
Importante
A mineração de dados foi preterida no SQL Server 2017 Analysis Services e agora descontinuada no SQL Server 2022 Analysis Services. A documentação não é atualizada para recursos preteridos e descontinuados. Para saber mais, consulte Compatibilidade com versões anteriores do Analysis Services.
Particiona a estrutura de mineração no número especificado de secções eficazes, treina um modelo para cada partição e depois devolve métricas de precisão para cada partição.
Observação
Este procedimento armazenado não pode ser usado para validar cruzadamente modelos de clustering, nem modelos construídos utilizando o algoritmo Microsoft Time Series ou o algoritmo Microsoft Sequence Clustering. Para validar modelos de clustering cruzados, pode usar o procedimento armazenado separado, SystemGetClusterCrossValidationResults (Serviços de Análise - Mineração de Dados).
Sintaxe
SystemGetCrossValidationResults(
<mining structure>
[, <mining model list>]
,<fold count>
,<max cases>
,<target attribute>
[,<target state>]
[,<target threshold>]
[,<test list>])
Arguments
Estrutura mineira
Nome de uma estrutura de mineração na base de dados atual.
(required)
Lista de modelos de mineração
Lista separada por vírgulas de modelos de mineração a validar.
Se o nome de um modelo contiver caracteres que não sejam válidos no nome de um identificador, o nome deve ser incluído entre parênteses.
Se não for especificada uma lista de modelos de mineração, é realizada a validação cruzada contra todos os modelos associados à estrutura especificada e que contenham um atributo previsível.
Observação
Para validar modelos de clustering cruzados, deve usar um procedimento armazenado separado, SystemGetClusterCrossValidationResults (Serviços de Análise - Mineração de Dados).
(facultativo)
Contagem de folds
Inteiro que especifica o número de partições em que se deve separar o conjunto de dados. O valor mínimo é 2. O número máximo de dobras é o número inteiro máximo ou o número de casos, o que for menor.
Cada partição conterá aproximadamente este número de casos: número máximo de casos/e contagem de folds.
Não há nenhum valor padrão.
Observação
O número de dobras afeta significativamente o tempo necessário para realizar a validação cruzada. Se selecionar um número demasiado alto, a consulta pode durar muito tempo e, em alguns casos, o servidor pode ficar sem resposta ou ficar sem resposta.
(required)
Casos máximos
Integer que especifica o número máximo de casos que podem ser testados em todas as folds.
Um valor de 0 indica que todos os casos da fonte de dados serão utilizados.
Se especificar um valor maior do que o número real de casos no conjunto de dados, todos os casos da fonte de dados serão usados.
Não há nenhum valor padrão.
(required)
Atributo alvo
Cadeia que contém o nome do atributo previsível. Um atributo previsível pode ser uma coluna, uma coluna de tabela aninhada ou uma coluna de chave de tabela aninhada de um modelo de mineração.
Observação
A existência do atributo alvo é validada apenas em tempo de execução.
(required)
Estado alvo
Fórmula que especifica o valor a prever. Se for especificado um valor-alvo, as métricas são recolhidas apenas para o valor especificado.
Se um valor não for especificado ou for nulo, as métricas são calculadas para o estado mais provável de cada previsão.
O padrão é nulo.
Um erro é gerado durante a validação se o valor especificado não for válido para o atributo especificado, ou se a fórmula não for do tipo correto para o atributo especificado.
(facultativo)
Limiar de alvo
Duplo maior que 0 e menor que 1. Indica a pontuação mínima de probabilidade que deve ser obtida para que a previsão do estado alvo especificado seja contada como correta.
Uma previsão cuja probabilidade é inferior ou igual a este valor é considerada incorreta.
Se não for especificado valor ou for nulo, utiliza-se o estado mais provável, independentemente da sua pontuação de probabilidade.
O padrão é nulo.
Observação
O SQL Server Analysis Services não gera erro se definir o limiar de estado em 0.0, mas nunca deve usar esse valor. Na prática, um limiar de 0,0 significa que previsões com probabilidade de 0 por cento são contadas como corretas.
(facultativo)
Lista de testes
Uma cadeia que especifica opções de teste.
Nota Este parâmetro é reservado para uso futuro.
(facultativo)
Tipo de Retorno
O conjunto de linhas que é devolvido contém as pontuações de cada partição em cada modelo.
A tabela seguinte descreve as colunas do conjunto de linhas.
| Nome da Coluna | Description |
|---|---|
| Nome do modelo | O nome do modelo que foi testado. |
| AttributeName | O nome da coluna previsível. |
| AtributoEstado | Um valor-alvo especificado na coluna previsível. Se este valor for nulo, foi usada a previsão mais provável. Se esta coluna contiver um valor, a precisão do modelo é avaliada apenas com base nesse valor. |
| PartitionIndex | Um índice baseado em 1 que identifica a que partição os resultados se aplicam. |
| Tamanho da partição | Um inteiro que indica quantos casos foram incluídos em cada partição. |
| Test | Categoria do teste realizado. Para uma descrição das categorias e dos testes incluídos em cada categoria, consulte Medidas no Relatório de Validação Cruzada. |
| Medida | O nome da medida devolvido pelo teste. As medidas para cada modelo dependem do tipo do valor previsível. Para uma definição de cada medida, veja Cross-Validation (Serviços de Análise - Mineração de Dados). Para uma lista de medidas devolvidas para cada tipo previsível, veja Medidas no Relatório de Validação Cruzada. |
| Valor | O valor da medida de teste especificada. |
Observações
Para devolver métricas de precisão para o conjunto de dados completo, use SystemGetAccuracyResults (Serviços de Análise - Mineração de Dados).
Se o modelo de mineração já foi particionado em folds, pode contornar o processamento e devolver apenas os resultados da validação cruzada usando SystemGetAccuracyResults (Serviços de Análise - Mineração de Dados).
Examples
O exemplo seguinte demonstra como particionar uma estrutura de mineração para validação cruzada em duas dobras, e depois testar dois modelos de mineração associados à estrutura de mineração, [v Target Mail].
A linha três do código lista os modelos de mineração que queres testar. Se não especificar a lista, são usados todos os modelos não clusterizados associados à estrutura. A linha quatro do código especifica o número de partições. Como não é especificado valor para os casos máximos, todos os casos na estrutura de mineração são usados e distribuídos uniformemente entre as partições.
A linha cinco especifica o atributo previsível, Comprador de Bicicleta, e a linha seis especifica o valor a prever, 1 (que significa "sim, vou comprar").
O valor NULL na linha sete indica que não existe uma barra mínima de probabilidade que deva ser cumprida. Portanto, a primeira previsão que tenha uma probabilidade diferente de zero será usada para avaliar a precisão.
CALL SystemGetCrossValidationResults(
[v Target Mail],
[Target Mail DT], [Target Mail NB],
2,
'Bike Buyer',
1,
NULL
)
Exemplos de resultados:
| Nome do modelo | AttributeName | AtributoEstado | PartitionIndex | Tamanho da partição | Test | Medida | Valor |
|---|---|---|---|---|---|---|---|
| DT do Correio Alvo | Comprador de Bicicletas | 1 | 1 | 500 | Classification | Verdadeiro Positivo | 144 |
| DT do Correio Alvo | Comprador de Bicicletas | 1 | 1 | 500 | Classification | Falso Positivo | 105 |
| DT do Correio Alvo | Comprador de Bicicletas | 1 | 1 | 500 | Classification | Verdadeiro negativo | 186 |
| DT do Correio Alvo | Comprador de Bicicletas | 1 | 1 | 500 | Classification | Falso Negativo | 65 |
| DT do Correio Alvo | Comprador de Bicicletas | 1 | 1 | 500 | Probabilidade | Registo | -0.619042807138345 |
| DT do Correio Alvo | Comprador de Bicicletas | 1 | 1 | 500 | Probabilidade | Elevação | 0.0740963734002671 |
| DT do Correio Alvo | Comprador de Bicicletas | 1 | 1 | 500 | Probabilidade | Erro quadrático médio da raiz | 0.346946279977653 |
| DT do Correio Alvo | Comprador de Bicicletas | 1 | 2 | 500 | Classification | Verdadeiro Positivo | 162 |
| DT do Correio Alvo | Comprador de Bicicletas | 1 | 2 | 500 | Classification | Falso Positivo | 86 |
| DT do Correio Alvo | Comprador de Bicicletas | 1 | 2 | 500 | Classification | Verdadeiro negativo | 165 |
| DT do Correio Alvo | Comprador de Bicicletas | 1 | 2 | 500 | Classification | Falso Negativo | 87 |
| DT do Correio Alvo | Comprador de Bicicletas | 1 | 2 | 500 | Probabilidade | Registo | -0.654117781086519 |
| DT do Correio Alvo | Comprador de Bicicletas | 1 | 2 | 500 | Probabilidade | Elevação | 0.038997399132084 |
| DT do Correio Alvo | Comprador de Bicicletas | 1 | 2 | 500 | Probabilidade | Erro quadrático médio da raiz | 0.342721344892651 |
Requerimentos
A validação cruzada está disponível apenas no SQL Server Enterprise a partir do SQL Server 2008.
Ver também
SystemGetCrossValidationResults
SystemGetAccuracyResults (Serviços de Análise - Mineração de Dados)
SystemGetClusterCrossValidationResults (Serviços de Análise - Mineração de Dados)
SystemGetClusterAccuracyResults (Serviços de Análise - Mineração de Dados)