Query's voor gegevensanalyse

Van toepassing op: SQL Server 2019 en eerder Analysis Services Azure Analysis Services Fabric/Power BI Premium

Belangrijk

Data mining werd verouderd verklaard in SQL Server 2017 Analysis Services en is nu stopgezet in SQL Server 2022 Analysis Services. Documentatie wordt niet bijgewerkt voor afgeschafte en stopgezette functies. Zie Analysis Services-compatibiliteit met eerdere versies voor meer informatie.

Query's voor gegevensanalyse zijn nuttig voor veel doeleinden. U kunt:

  • Pas het model toe op nieuwe gegevens om enkele of meerdere voorspellingen te doen. U kunt invoerwaarden opgeven als parameters of in een batch.

  • Bekijk een statistische samenvatting van de gegevens die worden gebruikt voor training.

  • Extraheer patronen en regels of genereer een profiel van de typische case die een patroon in het model vertegenwoordigt.

  • Regressieformules en andere berekeningen extraheren die patronen uitleggen.

  • Haal de cases op die passen bij een bepaald patroon.

  • Details ophalen over afzonderlijke gevallen die in het model worden gebruikt, inclusief gegevens die niet worden gebruikt in analyse.

  • Een model opnieuw trainen door nieuwe gegevens toe te voegen of kruisvoorspelling uit te voeren.

Deze sectie bevat een overzicht van de informatie die u nodig hebt om aan de slag te gaan met query's voor gegevensanalyse. Hierin worden de typen query's beschreven die u kunt maken op basis van gegevensanalyseobjecten, worden de queryhulpprogramma's en querytalen geïntroduceerd en vindt u koppelingen naar voorbeelden van query's die u kunt maken op basis van modellen die zijn gebouwd met behulp van de algoritmen die zijn geleverd in SQL Server Data Mining.

Informatie over query's voor gegevensanalyse

Hulpprogramma's en interfaces voor queries

Query's voor verschillende modeltypen

Requirements

Begrip van data mining-queries

SQL Server Analysis Services Data Mining ondersteunt de volgende typen query's:

Voordat u query's maakt, raden we u aan vertrouwd te raken met de verschillen tussen modellen die zijn gemaakt met elk van de gegevensanalysealgoritmen die worden geleverd door SQL Server.

Hulpprogramma's en interfaces voor query's

U kunt query's voor gegevensanalyse interactief bouwen met behulp van een van de queryhulpprogramma's van SQL Server. De grafische opbouwfunctie voor voorspellingsquery's is beschikbaar in zowel SQL Server Data Tools als SQL Server Management Studio. Als u de opbouwfunctie voor voorspellingsquery's nog niet eerder hebt gebruikt, raden we u aan de stappen in de zelfstudie Basisgegevensanalyse uit te voeren om vertrouwd te raken met de interface. Zie Een query maken met behulp van de opbouwfunctie voor voorspellingsquery's voor een beknopt overzicht van de stappen.

De opbouwfunctie voor voorspellingsquery's is handig voor het starten van query's die u later gaat aanpassen. U kunt eenvoudig gegevensbronnen toevoegen en toewijzen aan kolommen en vervolgens overschakelen naar de DMX-weergave en de query aanpassen door een WHERE-component of andere functies toe te voegen.

Zodra u bekend bent met gegevensanalysemodellen en het bouwen van query's, kunt u ook rechtstreeks query's schrijven met behulp van Data Mining Extensions (DMX). DMX is een querytaal die vergelijkbaar is met Transact-SQL en die u van veel verschillende clients kunt gebruiken. DMX is het hulpprogramma van keuze voor het maken van zowel aangepaste voorspellingen als complexe query's. Voor een inleiding tot DMX, zie Zelfstudies: Data Mining-modellen maken en opvragen met DMX (Analysis Services - Data Mining).

DMX-editors zijn beschikbaar in zowel SQL Server Data Tools als SQL Server Management Studio. U kunt de opbouwfunctie voor voorspellingsquery's ook gebruiken om uw query's te starten en vervolgens de weergave te wijzigen in de teksteditor en de DMX-instructie naar een andere client te kopiëren. Zie Data Mining Query Tools voor meer informatie.

U kunt DMX-instructies programmatisch opstellen en vanaf uw client naar de SQL Server Analysis Services-server verzenden met behulp van AMO of XMLA. DMX is echter de taal die u moet gebruiken om query's te maken op basis van een mijnbouwmodel.

U kunt ook query's uitvoeren op de metagegevens, statistieken en bepaalde inhoud van het model met behulp van DYNAMISCHE beheerweergaven (DMV's) die zijn gebaseerd op de rijensets van het gegevensanalyseschema. Met deze DMV's kunt u eenvoudig informatie over het model ophalen door SELECT-instructies te typen; U kunt echter geen voorspellingen maken. Zie Dynamische beheerweergaven (DMV's) gebruiken om Analysis Services te bewaken voor meer informatie over DMV's die worden ondersteund door SQL Server Analysis Services.

Ten slotte kunt u query's voor gegevensanalyse maken voor gebruik in Integration Services-pakketten, met behulp van de gegevensanalysequerytaak of de transformatie van de gegevensanalysequery. De controlestroomtaak ondersteunt meerdere typen DMX-query's, terwijl de gegevensstroomtransformatie alleen query's ondersteunt die werken met gegevens in de gegevensstroom, wat betekent dat query's die gebruikmaken van de syntaxis van PREDICTION JOIN.

Query's voor verschillende modeltypen

Het algoritme dat werd gebruikt toen het model werd gemaakt, heeft een grote invloed op het type informatie dat u kunt ophalen uit een gegevensanalysequery. De reden voor de verschillen is dat elk algoritme de gegevens op een andere manier verwerkt en verschillende soorten patronen opslaat. Sommige algoritmen maken bijvoorbeeld clusters; anderen maken bomen. Daarom moet u mogelijk gespecialiseerde voorspellings- en queryfuncties gebruiken, afhankelijk van het type model waarmee u werkt.

De volgende lijst bevat een overzicht van de functies die u kunt gebruiken in query's:

  • Algemene voorspellingsfuncties: De functie Predict is polymorf, wat betekent dat deze werkt met alle modeltypen. Met deze functie wordt automatisch het type model gedetecteerd waarmee u werkt en wordt u gevraagd om aanvullende parameters. Zie Predict (DMX) voor meer informatie.

    Waarschuwing

    Niet alle modellen worden gebruikt om voorspellingen te doen. U kunt bijvoorbeeld een clusteringmodel maken dat geen voorspelbaar kenmerk heeft. Zelfs als een model geen voorspelbaar kenmerk heeft, kunt u voorspellingsquery's maken die andere typen nuttige informatie uit het model retourneren.

  • Aangepaste voorspellingsfuncties: Elk modeltype biedt een set voorspellingsfuncties die zijn ontworpen voor het werken met de patronen die door dat algoritme zijn gemaakt.

    De functie Lag is bijvoorbeeld beschikbaar voor tijdreeksmodellen, zodat u de historische gegevens kunt bekijken die voor het model worden gebruikt. Voor clusteringmodellen zijn functies zoals ClusterDistance zinvoller.

    Zie de volgende koppelingen voor meer informatie over de functies die worden ondersteund voor elk modeltype:

    U kunt ook VBA-functies aanroepen of uw eigen functies maken. Zie Functions (DMX) voor meer informatie.

  • Algemene statistieken: Er zijn een aantal functies die kunnen worden gebruikt met vrijwel elk modeltype, dat een standaardset beschrijvende statistieken retourneert, zoals standaarddeviatie.

    De functie PredictHistogram retourneert bijvoorbeeld een tabel met alle statussen van de opgegeven kolom.

    Zie Algemene voorspellingsfuncties (DMX) voor meer informatie.

  • Aangepaste statistieken: Er worden aanvullende ondersteunende functies geboden voor elk modeltype om statistieken te genereren die relevant zijn voor de specifieke analytische taak.

    Wanneer u bijvoorbeeld met een clusteringmodel werkt, kunt u de functie PredictCaseLikelihood gebruiken om de waarschijnlijkheidsscore te retourneren die is gekoppeld aan een bepaald geval en cluster. Als u echter een lineair regressiemodel hebt gemaakt, bent u meer geïnteresseerd in het ophalen van de coëfficiënt en het snijpunt, wat u kunt doen met behulp van een inhoudsquery.

  • Modelinhoudsfuncties: De inhoud van alle modellen wordt weergegeven in een gestandaardiseerde indeling waarmee u informatie kunt ophalen met een eenvoudige query. U maakt query's op de modelinhoud met behulp van DMX. U kunt ook een bepaald type modelinhoud ophalen met behulp van de rijensets van het gegevensanalyseschema.

    In de modelinhoud verschilt de betekenis van elke rij of elk knooppunt van de tabel die wordt geretourneerd, afhankelijk van het type algoritme dat is gebruikt om het model te bouwen, evenals het gegevenstype van de kolom. Zie Inhoudsquery's (Gegevensanalyse) voor meer informatie.

Requirements

Voordat u een query kunt maken op basis van een model, moet het gegevensanalysemodel zijn verwerkt. Voor het verwerken van SQL Server Analysis Services-objecten zijn speciale machtigingen vereist. Zie Verwerkingsvereisten en overwegingen (Data Mining) voor meer informatie over het verwerken van miningmodellen.

Voor het uitvoeren van query's voor een gegevensanalysemodel zijn verschillende machtigingsniveaus vereist, afhankelijk van het type query dat u uitvoert. Drillthrough voor case- of structuurgegevens vereist doorgaans bijvoorbeeld extra machtigingen, die kunnen worden ingesteld op het object van de mijnbouwstructuur of het miningmodelobject.

Als uw query echter gebruikmaakt van externe gegevens en instructies zoals OPENROWSET of OPENQUERY bevat, moet de database waarop u query's uitvoert deze instructies inschakelen en moet u gemachtigd zijn voor de onderliggende databaseobjecten.

Zie Security Overview (Data Mining) voor meer informatie over de beveiligingscontexten die nodig zijn voor het uitvoeren van query's voor gegevensanalyse

In deze sectie

In de onderwerpen in deze sectie wordt elk type data mining-query in meer detail geïntroduceerd, en zijn er verwijzingen naar gedetailleerde voorbeelden van het maken van query's voor data mining-modellen.

Voorspellingsquery's (gegevensanalyse)

Inhoudsquery's (gegevensanalyse)

Drillthrough-query's (gegevensanalyse)

Query's voor gegevensdefinities (gegevensanalyse)

Hulpprogramma's voor query's voor gegevensanalyse

Gebruik deze koppelingen voor meer informatie over het maken en werken met query's voor gegevensanalyse.

Tasks Links
Bekijk zelfstudies en walkthroughs over queries voor data-analyse. Les 6: Maken en werken met voorspellingen (zelfstudie voor eenvoudige gegevensanalyse)

DMX-zelfstudie voor voorspelling van Time Series
Queryhulpprogramma's voor gegevensanalyse gebruiken in SQL Server Management Studio en SQL Server Data Tools Een DMX-query maken in SQL Server Management Studio

Een voorspellingsquery maken met de opbouwfunctie voor voorspellingsquery's

Voorspellingsfuncties toepassen op een model

Een voorspellingsquery handmatig bewerken
Werken met externe gegevens die worden gebruikt in voorspellingsquery's Kiezen en toewijzen van invoergegevens voor een voorspellingsquery

Invoergegevens voor een voorspellingsquery kiezen en koppelen
Werken met de resultaten van query's De resultaten van een voorspellingsquery weergeven en opslaan
DMX- en XMLA-querysjablonen gebruiken die worden geleverd in Management Studio Een Singleton-voorspellingsquery maken op basis van een sjabloon

Een gegevensanalysequery maken met XMLA

Analysis Services-sjablonen gebruiken in SQL Server Management Studio
Meer informatie over inhoudsquery's en voorbeelden bekijken Een inhoudsquery maken in een miningmodel

Een query uitvoeren op de parameters die worden gebruikt om een mijnbouwmodel te maken

Inhoudsquery's (gegevensanalyse)
Queryopties instellen en querymachtigingen en problemen oplossen De time-outwaarde voor query's voor gegevensanalyse wijzigen
De data mining-onderdelen gebruiken in Integration Services Querytaak voor gegevensanalyse

Gegevensanalysequerytransformatie

Zie ook

Algoritmen voor gegevensanalyse (Analysis Services - Gegevensanalyse)
Mijnbouwmodelinhoud (Analysis Services - Data Mining)