Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Van toepassing op:
SQL Server 2019 en eerder Analysis Services
Azure Analysis Services
Fabric/Power BI Premium
Belangrijk
Data mining werd verouderd verklaard in SQL Server 2017 Analysis Services en is nu stopgezet in SQL Server 2022 Analysis Services. Documentatie wordt niet bijgewerkt voor afgeschafte en stopgezette functies. Zie Analysis Services-compatibiliteit met eerdere versies voor meer informatie.
Partitioneert de mijnbouwstructuur in het opgegeven aantal kruissecties, traint een model voor elke partitie en retourneert vervolgens metrische gegevens over nauwkeurigheid voor elke partitie.
Opmerking
Deze opgeslagen procedure kan niet worden gebruikt voor het kruisvalideren van clusteringmodellen of modellen die zijn gebouwd met behulp van het Microsoft Time Series-algoritme of het algoritme Microsoft Sequence Clustering. Als u clusteringmodellen kruislings wilt valideren, kunt u de afzonderlijke opgeslagen procedure SystemGetClusterCrossValidationResults (Analysis Services - Data Mining) gebruiken.
Syntaxis
SystemGetCrossValidationResults(
<mining structure>
[, <mining model list>]
,<fold count>
,<max cases>
,<target attribute>
[,<target state>]
[,<target threshold>]
[,<test list>])
Arguments
mijnbouwstructuur
Naam van een mijnbouwstructuur in de huidige database.
(required)
mijnmodellijst
Door komma's gescheiden lijst met mijnbouwmodellen die moeten worden gevalideerd.
Als een modelnaam tekens bevat die niet geldig zijn in de naam van een id, moet de naam tussen vierkante haken worden geplaatst.
Als er geen lijst met mijnbouwmodellen is opgegeven, wordt kruisvalidatie uitgevoerd voor alle modellen die zijn gekoppeld aan de opgegeven structuur en die een voorspelbaar kenmerk bevatten.
Opmerking
Als u clusteringmodellen kruislings wilt valideren, moet u een afzonderlijke opgeslagen procedure, SystemGetClusterCrossValidationResults (Analysis Services - Data Mining) gebruiken.
(optioneel)
aantal vouwen
Geheel getal dat het aantal partities aangeeft waarin de gegevensset moet worden gescheiden. De minimumwaarde is 2. Het maximum aantal vouwen is het maximumaantal gehele getallen of het aantal gevallen, afhankelijk van wat lager is.
Elke partitie bevat ongeveer dit aantal gevallen: maximumaantal cases/.
Er is geen standaardwaarde.
Opmerking
Het aantal vouwen is sterk van invloed op de tijd die nodig is om kruisvalidatie uit te voeren. Als u een getal selecteert dat te hoog is, kan de query erg lang worden uitgevoerd en kan de server in sommige gevallen niet meer reageren of een time-out hebben.
(required)
max. cases
Geheel getal dat het maximum aantal gevallen aangeeft dat kan worden getest op alle vouwen.
Een waarde van 0 geeft aan dat alle gevallen in de gegevensbron worden gebruikt.
Als u een waarde opgeeft die groter is dan het werkelijke aantal gevallen in de gegevensset, worden alle gevallen in de gegevensbron gebruikt.
Er is geen standaardwaarde.
(required)
doelkenmerk
Tekenreeks die de naam van het voorspelbare kenmerk bevat. Een voorspelbaar kenmerk kan een kolom, geneste tabelkolom of geneste tabelsleutelkolom van een mijnbouwmodel zijn.
Opmerking
Het bestaan van het doelkenmerk wordt alleen tijdens runtime gevalideerd.
(required)
doelstatus
Formule waarmee de waarde wordt opgegeven die moet worden voorspeld. Als er een doelwaarde is opgegeven, worden metrische gegevens alleen verzameld voor de opgegeven waarde.
Als een waarde niet is opgegeven of null is, worden de metrische gegevens berekend voor de meest waarschijnlijke status voor elke voorspelling.
De standaardwaarde is null.
Er wordt een fout gegenereerd tijdens de validatie als de opgegeven waarde niet geldig is voor het opgegeven kenmerk of als de formule niet het juiste type is voor het opgegeven kenmerk.
(optioneel)
doeldrempel
Dubbel groter dan 0 en kleiner dan 1. Geeft de minimale waarschijnlijkheidsscore aan die moet worden verkregen voor de voorspelling van de opgegeven doelstatus die als juist moet worden geteld.
Een voorspelling met een waarschijnlijkheid die kleiner is dan of gelijk is aan deze waarde, wordt als onjuist beschouwd.
Als er geen waarde is opgegeven of null is, wordt de meest waarschijnlijke status gebruikt, ongeacht de waarschijnlijkheidsscore.
De standaardwaarde is null.
Opmerking
SQL Server Analysis Services genereert geen fout als u de drempelwaarde voor de status instelt op 0.0, maar u moet deze waarde nooit gebruiken. In feite betekent een drempelwaarde van 0,0 dat voorspellingen met een waarschijnlijkheid van 0 procent als juist worden geteld.
(optioneel)
testlijst
Een tekenreeks die testopties aangeeft.
Opmerking Deze parameter is gereserveerd voor toekomstig gebruik.
(optioneel)
Retourtype
De rijenset die wordt geretourneerd, bevat scores voor elke partitie in elk model.
In de volgende tabel worden de kolommen in de rijenset beschreven.
| Kolomnaam | Description |
|---|---|
| Modelnaam | De naam van het model dat is getest. |
| Attribuutnaam | De naam van de voorspelbare kolom. |
| AttributeState | Een opgegeven doelwaarde in de voorspelbare kolom. Als deze waarde null is, is de meest waarschijnlijke voorspelling gebruikt. Als deze kolom een waarde bevat, wordt de nauwkeurigheid van het model alleen beoordeeld op basis van deze waarde. |
| PartitionIndex | Een op 1 gebaseerde index die aangeeft welke partitie de resultaten van toepassing zijn. |
| partitiegrootte | Een geheel getal dat aangeeft hoeveel gevallen er in elke partitie zijn opgenomen. |
| Test | Categorie van de test die is uitgevoerd. Zie Metingen in het rapport kruisvalidatie voor een beschrijving van de categorieƫn en de tests die in elke categorie zijn opgenomen. |
| Maatregel | De naam van de meting die door de test wordt geretourneerd. Metingen voor elk model zijn afhankelijk van het type voorspelbare waarde. Zie Kruisvalidatie (Analysis Services - Data Mining) voor een definitie van elke meting. Zie Metingen in het rapport Kruisvalidatie voor een lijst met metingen die worden geretourneerd voor elk voorspelbaar type. |
| Waarde | De waarde van de opgegeven testmeting. |
Opmerkingen
Gebruik SystemGetAccuracyResults (Analysis Services - Data Mining) om metrische gegevens voor de volledige gegevensset te retourneren.
Als het mijnbouwmodel al in vouwen is gepartitioneerd, kunt u de verwerking omzeilen en alleen de resultaten van kruisvalidatie retourneren met behulp van SystemGetAccuracyResults (Analysis Services - Data Mining).
Voorbeelden
In het volgende voorbeeld ziet u hoe u een mijnbouwstructuur partitioneert voor kruisvalidatie in twee vouwen en vervolgens twee mijnbouwmodellen test die zijn gekoppeld aan de mijnbouwstructuur. [v Target Mail]
Regel drie van de code bevat de mijnbouwmodellen die u wilt testen. Als u de lijst niet opgeeft, worden alle niet-clusteringmodellen gebruikt die aan de structuur zijn gekoppeld. Regel vier van de code geeft het aantal partities op. Omdat er geen waarde is opgegeven voor maximaal aantal gevallen, worden alle gevallen in de mijnbouwstructuur gebruikt en gelijkmatig verdeeld over de partities.
Regel vijf geeft het voorspelbare kenmerk, Fietskoper en regel zes geeft de waarde aan die moet worden voorspeld, 1 (wat "ja, zal kopen").
De NULL-waarde in regel zeven geeft aan dat er geen minimale waarschijnlijkheidsbalk moet worden voldaan. Daarom wordt de eerste voorspelling met een niet-nul waarschijnlijkheid gebruikt bij het beoordelen van de nauwkeurigheid.
CALL SystemGetCrossValidationResults(
[v Target Mail],
[Target Mail DT], [Target Mail NB],
2,
'Bike Buyer',
1,
NULL
)
Voorbeeldresultaten:
| Modelnaam | Attribuutnaam | AttributeState | PartitionIndex | partitiegrootte | Test | Maatregel | Waarde |
|---|---|---|---|---|---|---|---|
| Doel-e-mail-DT | Fietskoper | 1 | 1 | 500 | Classification | Juist positief | 144 |
| Doel-e-mail-DT | Fietskoper | 1 | 1 | 500 | Classification | Foutpositief | 105 |
| Doel-e-mail-DT | Fietskoper | 1 | 1 | 500 | Classification | Terecht negatief | 186 |
| Doel-e-mail-DT | Fietskoper | 1 | 1 | 500 | Classification | Fout-negatief | 65 |
| Doel-e-mail-DT | Fietskoper | 1 | 1 | 500 | Waarschijnlijkheid | Logboekscore | -0.619042807138345 |
| Doel-e-mail-DT | Fietskoper | 1 | 1 | 500 | Waarschijnlijkheid | Lift | 0.0740963734002671 |
| Doel-e-mail-DT | Fietskoper | 1 | 1 | 500 | Waarschijnlijkheid | Wortel gemiddelde kwadratische fout | 0.346946279977653 |
| Doel-e-mail-DT | Fietskoper | 1 | 2 | 500 | Classification | Juist positief | 162 |
| Doel-e-mail-DT | Fietskoper | 1 | 2 | 500 | Classification | Foutpositief | 86 |
| Doel-e-mail-DT | Fietskoper | 1 | 2 | 500 | Classification | Terecht negatief | 165 |
| Doel-e-mail-DT | Fietskoper | 1 | 2 | 500 | Classification | Fout-negatief | 87 |
| Doel-e-mail-DT | Fietskoper | 1 | 2 | 500 | Waarschijnlijkheid | Logboekscore | -0.654117781086519 |
| Doel-e-mail-DT | Fietskoper | 1 | 2 | 500 | Waarschijnlijkheid | Lift | 0.038997399132084 |
| Doel-e-mail-DT | Fietskoper | 1 | 2 | 500 | Waarschijnlijkheid | Wortel gemiddelde kwadratische fout | 0.342721344892651 |
Requirements
Kruisvalidatie is alleen beschikbaar in SQL Server Enterprise vanaf SQL Server 2008.
Zie ook
SystemGetCrossValidationResults
SystemGetAccuracyResults (Analysis Services - Data Mining)
SystemGetClusterCrossValidationResults (Analysis Services - Data Mining)
SystemGetClusterAccuracyResults (Analysis Services - Data Mining)