Inhoud van Mijnbouwmodel voor Associatiemodellen (Analysis Services - Gegevensmijnbouw)

Van toepassing op: SQL Server 2019 en eerder Analysis Services Azure Analysis Services Fabric/Power BI Premium

Belangrijk

Data mining werd verouderd verklaard in SQL Server 2017 Analysis Services en is nu stopgezet in SQL Server 2022 Analysis Services. Documentatie wordt niet bijgewerkt voor afgeschafte en stopgezette functies. Zie Analysis Services-compatibiliteit met eerdere versies voor meer informatie.

In dit onderwerp wordt de inhoud van het mijnbouwmodel beschreven die specifiek is voor modellen die gebruikmaken van het algoritme Microsoft Association Rules. Zie Mining Model Content (Analysis Services - Data Mining) voor een uitleg van algemene en statistische terminologie met betrekking tot het analyseren van modelinhoud die van toepassing is op alle modeltypen.

Inzicht in de structuur van een koppelingsmodel

Een koppelingsmodel heeft een eenvoudige structuur. Elk model heeft één bovenliggend knooppunt dat het model en de metagegevens vertegenwoordigt, en elk bovenliggend knooppunt heeft een platte lijst met itemsets en regels. De itemsets en regels zijn niet geordend in bomen; ze worden eerst geordend met itemsets en daarachter met regels, zoals wordt weergegeven in het volgende diagram.

structuur van modelinhoud voor associatiemodellen

Elke itemset bevindt zich in een eigen knooppunt (NODE_TYPE = 7). Het knooppunt bevat de definitie van de itemset, het aantal cases dat deze itemset en andere informatie bevat.

Elke regel bevindt zich ook in een eigen knooppunt (NODE_TYPE = 8). Een regel beschrijft een algemeen patroon voor de wijze waarop items worden gekoppeld. Een regel lijkt op een IF-THEN instructie. Aan de linkerkant van de regel wordt een bestaande voorwaarde of set voorwaarden weergegeven. Aan de rechterkant van de regel ziet u het item in uw gegevensset dat meestal is gekoppeld aan de voorwaarden aan de linkerkant.

Opmerking Als u de regels of itemsets wilt extraheren, kunt u een query gebruiken om alleen de gewenste knooppunttypen te retourneren. Zie Voorbeelden van koppelingsmodelquery's voor meer informatie.

Modelinhoud voor een koppelingsmodel

Deze sectie bevat alleen details en voorbeelden voor die kolommen in de inhoud van het mijnbouwmodel die relevant zijn voor koppelingsmodellen.

Zie Mining Model Content (Analysis Services - Data Mining) voor informatie over de kolommen voor algemeen gebruik in de schemarijset, zoals MODEL_CATALOG en MODEL_NAME.

MODEL_CATALOG
Naam van de database waarin het model is opgeslagen.

MODEL_NAME
Naam van het model.

ATTRIBUTE_NAME
De namen van de kenmerken die overeenkomen met dit knooppunt.

NODE_NAME
De naam van het knooppunt. Voor een koppelingsmodel bevat deze kolom dezelfde waarde als NODE_UNIQUE_NAME.

NODE_UNIQUE_NAME
De unieke naam van het knooppunt.

NODE_TYPE
Een koppelingsmodel voert alleen de volgende knooppunttypen uit:

Type-id van knooppunt Typologie
1 (model) Hoofd- of bovenliggende knooppunt.
7 (itemset) Een itemset of verzameling kenmerk-waardeparen. Examples:

Product 1 = Existing, Product 2 = Existing

or

Gender = Male.
8 (regel) Een regel die definieert hoe items zich met elkaar verhouden.

Voorbeeld:

Product 1 = Existing, Product 2 = Existing -> Product 3 = Existing.

NODE_CAPTION
Een label of een bijschrift dat is gekoppeld aan het knooppunt.

Knooppunt Itemset Een door komma's gescheiden lijst met items.

Regelknooppunt Bevat de linker- en rechterzijde van de regel.

CHILDREN_CARDINALITY
Geeft het aantal kinderen van het huidige knooppunt aan.

Parent node Geeft het totale aantal itemsets en regels weer.

Opmerking

Zie de NODE_DESCRIPTION voor het wortelknooppunt van het model om een uitsplitsing van het aantal itemsets en regels te verkrijgen.

Itemset of regelknooppunt Altijd 0.

PARENT_UNIQUE_NAME
De unieke naam van het bovenliggende knooppunt.

Parent node Altijd NULL.

Itemset of regelknooppunt Altijd 0.

NODE_DESCRIPTION
Een gebruiksvriendelijke beschrijving van de inhoud van het knooppunt.

Bovenliggend knooppunt Bevat een door komma's gescheiden lijst met de volgende informatie over het model:

Item Description
ITEMSET_COUNT Het aantal van alle itemsets in het model.
RULE_COUNT Het aantal regels in het model.
MIN_SUPPORT De minimale ondersteuning die is gevonden voor een enkele itemset.

Opmerking Deze waarde kan afwijken van de waarde die u hebt ingesteld voor de parameter MINIMUM _SUPPORT .
MAX_SUPPORT De maximale ondersteuning gevonden voor een enkele itemset.

Opmerking Deze waarde kan afwijken van de waarde die u hebt ingesteld voor de parameter MAXIMUM_SUPPORT .
MIN_ITEMSET_SIZE De grootte van de kleinste itemset, weergegeven als een aantal items.

Een waarde van 0 geeft aan dat de ontbrekende status als een onafhankelijk item is behandeld.

Opmerking De standaardwaarde van de parameter MINIMUM_ITEMSET_SIZE is 1.
MAX_ITEMSET_SIZE Geeft de grootte aan van de grootste itemset die is gevonden.

Opmerking Deze waarde wordt beperkt door de waarde die u hebt ingesteld voor de parameter MAX_ITEMSET_SIZE bij het maken van het model. Deze waarde mag deze waarde nooit overschrijden; het kan echter minder zijn. De standaardwaarde is 3.
MIN_PROBABILITY De minimale kans die is gedetecteerd voor een enkele itemset of regel in het model.

Voorbeeld: 0.400390625

Opmerking Voor itemsets is deze waarde altijd groter dan de waarde die u hebt ingesteld voor de parameter MINIMUM_PROBABILITY toen u het model maakte.
MAX_PROBABILITY De maximale kans die is gedetecteerd voor een enkele itemset of regel in het model.

Voorbeeld: 1

Opmerking Er is geen parameter om de maximale waarschijnlijkheid van itemsets te beperken. Als u items wilt verwijderen die te vaak voorkomen, gebruikt u in plaats daarvan de parameter MAXIMUM_SUPPORT .
MIN_LIFT De minimale hoeveelheid lift die door het model wordt geleverd voor elke itemset.

Voorbeeld: 0.14309369632511

Opmerking: als u de minimale lift kent, kunt u bepalen of de lift voor een bepaalde itemset significant is.
MAX_LIFT De maximale hoeveelheid lift die door het model wordt geleverd voor elke itemset.

Voorbeeld: 1.95758227647523 Opmerking Wetende dat de maximale lift u kan helpen bepalen of de lift voor een bepaalde itemset significant is.

Knooppunt Itemset Itemset-knooppunten bevatten een lijst met de items die worden weergegeven als een door komma's gescheiden tekenreeks.

Voorbeeld:

Touring Tire = Existing, Water Bottle = Existing

Dit betekent dat toerbanden en waterflessen samen zijn gekocht.

Regelknooppunt Regelknooppunten bevatten een linker- en rechterkant van de regel, gescheiden door een pijl.

Voorbeeld: Touring Tire = Existing, Water Bottle = Existing -> Cycling cap = Existing

Dit betekent dat als iemand een toerband en een waterfles kocht, ze ook waarschijnlijk een fietskapje zouden kopen.

NODE_RULE
Een XML-fragment dat de regel of itemset beschrijft die is ingesloten in het knooppunt.

Bovenliggend knooppunt Leeg.

Knooppunt Itemset Leeg.

Regelknooppunt Het XML-fragment bevat aanvullende nuttige informatie over de regel, zoals ondersteuning, betrouwbaarheid en het aantal items, en de id van het knooppunt dat de linkerkant van de regel aangeeft.

MARGINAL_RULE
Lege.

NODE_PROBABILITY
Een waarschijnlijkheids- of betrouwbaarheidsscore die is gekoppeld aan de itemset of regel.

Bovenliggend knooppunt Altijd 0.

Knooppunt Itemset Waarschijnlijkheid van de itemset.

Regelknooppunt Betrouwbaarheidswaarde voor de regel.

MARGINAL_PROBABILITY
Hetzelfde als NODE_PROBABILITY.

NODE_DISTRIBUTION
De tabel bevat zeer verschillende informatie, afhankelijk van of het knooppunt een itemset of een regel is.

Bovenliggend knooppunt Leeg.

Knooppunt Itemset Een lijst van elk item in de itemset samen met een waarschijnlijkheids- en ondersteuningswaarde. Als de itemset bijvoorbeeld twee producten bevat, wordt de naam van elk product weergegeven, samen met het aantal gevallen waarin elk product is opgenomen.

Regelknooppunt Bevat twee rijen. De eerste rij toont het kenmerk aan de rechterkant van de regel, het voorspelde item, samen met een betrouwbaarheidsscore.

De tweede rij is uniek voor koppelingsmodellen; deze bevat een aanwijzer naar de itemset aan de rechterkant van de regel. De aanwijzer wordt in de kolom ATTRIBUTE_VALUE weergegeven als de id van de itemset die alleen het rechteritem bevat.

Als de regel bijvoorbeeld is If {A,B} Then {C}, bevat de tabel de naam van het item {C}en de id van het knooppunt dat de itemset voor item C bevat.

Deze aanwijzer is handig omdat u kunt bepalen op basis van het itemset-knooppunt hoeveel gevallen in alle gevallen het product aan de rechterkant bevatten. De gevallen die aan de regel If {A,B} Then {C} zijn onderworpen, zijn een subset van de gevallen die in de itemset voor {C}worden vermeld.

NODE_SUPPORT
Het aantal gevallen dat dit knooppunt ondersteunt.

Bovenliggend knooppunt Aantal gevallen in het model.

Knooppunt Itemset Het aantal gevallen waarin alle items van de itemset voorkomen.

Regelknooppunt Het aantal gevallen waarin alle items die in de regel zijn opgenomen aanwezig zijn.

MSOLAP_MODEL_COLUMN
Bevat verschillende informatie, afhankelijk van of het knooppunt een itemset of regel is.

Bovenliggend knooppunt Leeg.

Knooppunt Itemset Leeg.

Regelknooppunt De id van de itemset die de items aan de linkerkant van de regel bevat. Als de regel bijvoorbeeld is If {A,B} Then {C}, bevat deze kolom de id van de itemset die alleen {A,B}bevat.

MSOLAP_NODE_SCORE
Bovenliggend knooppunt Leeg.

Knooppunt Itemset Urgentiescore voor de itemset.

Regelknooppunt Urgentiescore voor de regel.

Opmerking

De urgentie wordt anders berekend voor itemsets en regels. Zie Microsoft Association Algorithm Technical Reference voor meer informatie.

MSOLAP_NODE_SHORT_CAPTION
Lege.

Zie ook

Analysemodelinhoud (Analysis Services - Gegevensanalyse)
Microsoft Association Algorithm
Voorbeelden van query's voor koppelingsmodellen