Kolumndistributioner (datautvinning)

Gäller för: SQL Server 2019 och tidigare Analysis Services Azure Analysis Services Fabric/Power BI Premium

Viktigt!

Datautvinningen upphörde i SQL Server 2017 Analysis Services och upphörde nu i SQL Server 2022 Analysis Services. Dokumentationen uppdateras inte för inaktuella och utgångna funktioner. Mer information finns i Analysis Services bakåtkompatibilitet.

I Microsoft SQL Server SQL Server Analysis Services kan du definiera kolumndistributioner i en gruvstruktur för att påverka hur algoritmer bearbetar data i dessa kolumner när du skapar gruvmodeller. För vissa algoritmer är det användbart att definiera fördelningen av kontinuerliga kolumner innan du bearbetar modellen, om kolumnerna är kända för att innehålla vanliga fördelningar av värden. Om du inte definierar distributionerna kan de resulterande gruvmodellerna ge mindre exakta förutsägelser än om distributionerna definierades, eftersom algoritmerna har mindre information att tolka data från.

De algoritmer som är tillgängliga i SQL Server Analysis Services stöder följande distributionstyper:

Normal
Värdena för den kontinuerliga kolumnen utgör ett histogram med en normal fördelning.

Histogram med normalfördelning

Lognormal
Värdena för den kontinuerliga kolumnen utgör ett histogram, där kurvan är långsträckt i den övre änden och är skev mot den nedre änden.

Histogram med lognormalfördelning

Uniform
Värdena för den kontinuerliga kolumnen utgör en platt kurva, där alla värden är lika sannolika.

Histogram med enhetlig fördelning

Mer information om de algoritmer som SQL Server Analysis Services tillhandahåller finns i Data Mining Algorithms (Analysis Services – Data Mining).

Se även

Innehållstyper (datautvinning)
Gruvstrukturer (Analysis Services – datautvinning)
Diskretiseringsmetoder (datautvinning)
Distributioner (DMX)
Kolumner för gruvstruktur