SystemGetCrossValidationResults (Analysis Services - Data Mining)

Van toepassing op: SQL Server 2019 en eerder Analysis Services Azure Analysis Services Fabric/Power BI Premium

Belangrijk

Data mining werd verouderd verklaard in SQL Server 2017 Analysis Services en is nu stopgezet in SQL Server 2022 Analysis Services. Documentatie wordt niet bijgewerkt voor afgeschafte en stopgezette functies. Zie Analysis Services-compatibiliteit met eerdere versies voor meer informatie.

Partitioneert de mijnbouwstructuur in het opgegeven aantal kruissecties, traint een model voor elke partitie en retourneert vervolgens metrische gegevens over nauwkeurigheid voor elke partitie.

Opmerking

Deze opgeslagen procedure kan niet worden gebruikt voor het kruisvalideren van clusteringmodellen of modellen die zijn gebouwd met behulp van het Microsoft Time Series-algoritme of het algoritme Microsoft Sequence Clustering. Als u clusteringmodellen kruislings wilt valideren, kunt u de afzonderlijke opgeslagen procedure SystemGetClusterCrossValidationResults (Analysis Services - Data Mining) gebruiken.

Syntaxis

  
SystemGetCrossValidationResults(  
<mining structure>  
[, <mining model list>]  
,<fold count>  
,<max cases>  
,<target attribute>  
[,<target state>]  
[,<target threshold>]  
[,<test list>])  

Arguments

mijnbouwstructuur
Naam van een mijnbouwstructuur in de huidige database.

(required)

mijnmodellijst
Door komma's gescheiden lijst met mijnbouwmodellen die moeten worden gevalideerd.

Als een modelnaam tekens bevat die niet geldig zijn in de naam van een id, moet de naam tussen vierkante haken worden geplaatst.

Als er geen lijst met mijnbouwmodellen is opgegeven, wordt kruisvalidatie uitgevoerd voor alle modellen die zijn gekoppeld aan de opgegeven structuur en die een voorspelbaar kenmerk bevatten.

Opmerking

Als u clusteringmodellen kruislings wilt valideren, moet u een afzonderlijke opgeslagen procedure, SystemGetClusterCrossValidationResults (Analysis Services - Data Mining) gebruiken.

(optioneel)

aantal vouwen
Geheel getal dat het aantal partities aangeeft waarin de gegevensset moet worden gescheiden. De minimumwaarde is 2. Het maximum aantal vouwen is het maximumaantal gehele getallen of het aantal gevallen, afhankelijk van wat lager is.

Elke partitie bevat ongeveer dit aantal gevallen: maximumaantal cases/.

Er is geen standaardwaarde.

Opmerking

Het aantal vouwen is sterk van invloed op de tijd die nodig is om kruisvalidatie uit te voeren. Als u een getal selecteert dat te hoog is, kan de query erg lang worden uitgevoerd en kan de server in sommige gevallen niet meer reageren of een time-out hebben.

(required)

max. cases
Geheel getal dat het maximum aantal gevallen aangeeft dat kan worden getest op alle vouwen.

Een waarde van 0 geeft aan dat alle gevallen in de gegevensbron worden gebruikt.

Als u een waarde opgeeft die groter is dan het werkelijke aantal gevallen in de gegevensset, worden alle gevallen in de gegevensbron gebruikt.

Er is geen standaardwaarde.

(required)

doelkenmerk
Tekenreeks die de naam van het voorspelbare kenmerk bevat. Een voorspelbaar kenmerk kan een kolom, geneste tabelkolom of geneste tabelsleutelkolom van een mijnbouwmodel zijn.

Opmerking

Het bestaan van het doelkenmerk wordt alleen tijdens runtime gevalideerd.

(required)

doelstatus
Formule waarmee de waarde wordt opgegeven die moet worden voorspeld. Als er een doelwaarde is opgegeven, worden metrische gegevens alleen verzameld voor de opgegeven waarde.

Als een waarde niet is opgegeven of null is, worden de metrische gegevens berekend voor de meest waarschijnlijke status voor elke voorspelling.

De standaardwaarde is null.

Er wordt een fout gegenereerd tijdens de validatie als de opgegeven waarde niet geldig is voor het opgegeven kenmerk of als de formule niet het juiste type is voor het opgegeven kenmerk.

(optioneel)

doeldrempel
Dubbel groter dan 0 en kleiner dan 1. Geeft de minimale waarschijnlijkheidsscore aan die moet worden verkregen voor de voorspelling van de opgegeven doelstatus die als juist moet worden geteld.

Een voorspelling met een waarschijnlijkheid die kleiner is dan of gelijk is aan deze waarde, wordt als onjuist beschouwd.

Als er geen waarde is opgegeven of null is, wordt de meest waarschijnlijke status gebruikt, ongeacht de waarschijnlijkheidsscore.

De standaardwaarde is null.

Opmerking

SQL Server Analysis Services genereert geen fout als u de drempelwaarde voor de status instelt op 0.0, maar u moet deze waarde nooit gebruiken. In feite betekent een drempelwaarde van 0,0 dat voorspellingen met een waarschijnlijkheid van 0 procent als juist worden geteld.

(optioneel)

testlijst
Een tekenreeks die testopties aangeeft.

Opmerking Deze parameter is gereserveerd voor toekomstig gebruik.

(optioneel)

Retourtype

De rijenset die wordt geretourneerd, bevat scores voor elke partitie in elk model.

In de volgende tabel worden de kolommen in de rijenset beschreven.

Kolomnaam Description
Modelnaam De naam van het model dat is getest.
Attribuutnaam De naam van de voorspelbare kolom.
AttributeState Een opgegeven doelwaarde in de voorspelbare kolom. Als deze waarde null is, is de meest waarschijnlijke voorspelling gebruikt.

Als deze kolom een waarde bevat, wordt de nauwkeurigheid van het model alleen beoordeeld op basis van deze waarde.
PartitionIndex Een op 1 gebaseerde index die aangeeft welke partitie de resultaten van toepassing zijn.
partitiegrootte Een geheel getal dat aangeeft hoeveel gevallen er in elke partitie zijn opgenomen.
Test Categorie van de test die is uitgevoerd. Zie Metingen in het rapport kruisvalidatie voor een beschrijving van de categorieƫn en de tests die in elke categorie zijn opgenomen.
Maatregel De naam van de meting die door de test wordt geretourneerd. Metingen voor elk model zijn afhankelijk van het type voorspelbare waarde. Zie Kruisvalidatie (Analysis Services - Data Mining) voor een definitie van elke meting.

Zie Metingen in het rapport Kruisvalidatie voor een lijst met metingen die worden geretourneerd voor elk voorspelbaar type.
Waarde De waarde van de opgegeven testmeting.

Opmerkingen

Gebruik SystemGetAccuracyResults (Analysis Services - Data Mining) om metrische gegevens voor de volledige gegevensset te retourneren.

Als het mijnbouwmodel al in vouwen is gepartitioneerd, kunt u de verwerking omzeilen en alleen de resultaten van kruisvalidatie retourneren met behulp van SystemGetAccuracyResults (Analysis Services - Data Mining).

Voorbeelden

In het volgende voorbeeld ziet u hoe u een mijnbouwstructuur partitioneert voor kruisvalidatie in twee vouwen en vervolgens twee mijnbouwmodellen test die zijn gekoppeld aan de mijnbouwstructuur. [v Target Mail]

Regel drie van de code bevat de mijnbouwmodellen die u wilt testen. Als u de lijst niet opgeeft, worden alle niet-clusteringmodellen gebruikt die aan de structuur zijn gekoppeld. Regel vier van de code geeft het aantal partities op. Omdat er geen waarde is opgegeven voor maximaal aantal gevallen, worden alle gevallen in de mijnbouwstructuur gebruikt en gelijkmatig verdeeld over de partities.

Regel vijf geeft het voorspelbare kenmerk, Fietskoper en regel zes geeft de waarde aan die moet worden voorspeld, 1 (wat "ja, zal kopen").

De NULL-waarde in regel zeven geeft aan dat er geen minimale waarschijnlijkheidsbalk moet worden voldaan. Daarom wordt de eerste voorspelling met een niet-nul waarschijnlijkheid gebruikt bij het beoordelen van de nauwkeurigheid.

CALL SystemGetCrossValidationResults(  
[v Target Mail],  
[Target Mail DT], [Target Mail NB],  
2,  
'Bike Buyer',  
1,  
NULL  
)  

Voorbeeldresultaten:

Modelnaam Attribuutnaam AttributeState PartitionIndex partitiegrootte Test Maatregel Waarde
Doel-e-mail-DT Fietskoper 1 1 500 Classification Juist positief 144
Doel-e-mail-DT Fietskoper 1 1 500 Classification Foutpositief 105
Doel-e-mail-DT Fietskoper 1 1 500 Classification Terecht negatief 186
Doel-e-mail-DT Fietskoper 1 1 500 Classification Fout-negatief 65
Doel-e-mail-DT Fietskoper 1 1 500 Waarschijnlijkheid Logboekscore -0.619042807138345
Doel-e-mail-DT Fietskoper 1 1 500 Waarschijnlijkheid Lift 0.0740963734002671
Doel-e-mail-DT Fietskoper 1 1 500 Waarschijnlijkheid Wortel gemiddelde kwadratische fout 0.346946279977653
Doel-e-mail-DT Fietskoper 1 2 500 Classification Juist positief 162
Doel-e-mail-DT Fietskoper 1 2 500 Classification Foutpositief 86
Doel-e-mail-DT Fietskoper 1 2 500 Classification Terecht negatief 165
Doel-e-mail-DT Fietskoper 1 2 500 Classification Fout-negatief 87
Doel-e-mail-DT Fietskoper 1 2 500 Waarschijnlijkheid Logboekscore -0.654117781086519
Doel-e-mail-DT Fietskoper 1 2 500 Waarschijnlijkheid Lift 0.038997399132084
Doel-e-mail-DT Fietskoper 1 2 500 Waarschijnlijkheid Wortel gemiddelde kwadratische fout 0.342721344892651

Requirements

Kruisvalidatie is alleen beschikbaar in SQL Server Enterprise vanaf SQL Server 2008.

Zie ook

SystemGetCrossValidationResults
SystemGetAccuracyResults (Analysis Services - Data Mining)
SystemGetClusterCrossValidationResults (Analysis Services - Data Mining)
SystemGetClusterAccuracyResults (Analysis Services - Data Mining)