関連付けモデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)

適用対象: SQL Server 2019 以前の Analysis Services Azure Analysis Services Fabric/Power BI Premium

Important

データ マイニングは SQL Server 2017 Analysis Services で非推奨となり、現在は SQL Server 2022 Analysis Services で廃止されました。 非推奨および廃止された機能については、ドキュメントは更新されません。 詳細については、「 Analysis Services の下位互換性」を参照してください。

このトピックでは、Microsoft アソシエーション ルール アルゴリズムを使用するモデルに固有のマイニング モデル コンテンツについて説明します。 すべてのモデルの種類に適用されるマイニング モデル コンテンツに関連する一般的な用語と統計用語の説明については、「 マイニング モデル コンテンツ (Analysis Services - データ マイニング)」を参照してください。

アソシエーション モデルの構造について

アソシエーション モデルには単純な構造があります。 各モデルには、モデルとそのメタデータを表す単一の親ノードがあり、各親ノードにはアイテムセットとルールのフラットなリストがあります。 アイテムセットとルールはツリーに編成されず、次の図に示すように、最初にアイテムセットとルールが並べ替えられます。

アソシエーション モデルのモデル コンテンツの構造

各アイテムセットは、独自のノード (NODE_TYPE = 7) に含まれています。 ノードには、アイテムセットの定義、このアイテムセットを含むケースの数、およびその他の情報が含まれます。

各ルールは、独自のノードにも含まれます (NODE_TYPE = 8)。 ルールは、項目の関連付け方法に関する一般的なパターンを記述します。 ルールは、IF-THEN ステートメントに似ています。 ルールの左側には、既存の条件または一連の条件が表示されます。 ルールの右側には、通常は左側の条件に関連付けられているデータ セット内の項目が表示されます。

メモ ルールまたはアイテムセットのいずれかを抽出する場合は、クエリを使用して、必要なノードの種類のみを返すことができます。 詳細については、「 アソシエーション モデル クエリの例」を参照してください。

アソシエーションモデルのコンテンツ

このセクションでは、関連付けモデルに関連するマイニング モデル コンテンツ内の列についてのみ、詳細と例を示します。

MODEL_CATALOGやMODEL_NAMEなど、スキーマ行セットの汎用列の詳細については、「 マイニング モデル コンテンツ (Analysis Services - データ マイニング)」を参照してください。

MODEL_CATALOG
モデルが格納されているデータベースの名前。

MODEL_NAME
モデルの名前。

ATTRIBUTE_NAME
このノードに対応する属性の名前。

NODE_NAME
ノード名。 関連付けモデルの場合、この列にはNODE_UNIQUE_NAMEと同じ値が含まれます。

NODE_UNIQUE_NAME
ノードの一意の名前。

Node_type
アソシエーション モデルでは、次のノード タイプのみが出力されます。

ノードの種類 ID タイプ
1 (モデル) ルート ノードまたは親 ノード。
7 (アイテムセット) 項目セット、または属性値ペアのコレクション。 例 :

Product 1 = Existing, Product 2 = Existing

又は

Gender = Male
8 (ルール) 項目の相互関係を定義するルール。

例:

Product 1 = Existing, Product 2 = Existing -> Product 3 = Existing

NODE_CAPTION
ノードに関連付けられているラベルまたはキャプション。

アイテムセット ノード 項目のコンマ区切りのリスト。

ルール ノード ルールの左側と右側が含まれます。

CHILDREN_CARDINALITY
現在のノードの子の数を示します。

親ノード アイテムセットの合計数とルールを示します。

アイテムセットとルールの数の内訳を取得するには、モデルのルート ノードのNODE_DESCRIPTIONを参照してください。

アイテムセットまたはルール ノード 常に 0。

PARENT_UNIQUE_NAME
ノードの親の一意の名前。

親ノード 常に NULL。

アイテムセットまたはルール ノード 常に 0。

NODE_DESCRIPTION
ノードの内容のわかりやすい説明。

親ノード モデルに関する次の情報のコンマ区切りの一覧が含まれています。

Item Description
アイテムセット数 モデル内のすべてのアイテムセットの数。
RULE_COUNT モデル内のすべてのルールの数。
MIN_SUPPORT 1 つのアイテムセットに対して検出された最小サポート。

メモ この値は 、MINIMUM _SUPPORT パラメーターに設定した値とは異なる場合があります。
MAX_SUPPORT 1 つのアイテムセットに対して検出された最大サポート数。

メモ この値は、 MAXIMUM_SUPPORT パラメーターに設定した値とは異なる場合があります。
MIN_ITEMSET_SIZE 項目の数として表される最小のアイテムセットのサイズ。

値 0 は 、Missing 状態が独立した項目として扱われたことを示します。

メモMINIMUM_ITEMSET_SIZE パラメーターの既定値は 1 です。
MAX_ITEMSET_SIZE 見つかった最大のアイテムセットのサイズを示します。

メモ この値は、モデルの作成時に MAX_ITEMSET_SIZE パラメーターに設定した値によって制限されます。 この値は、その値を超えてはいけません。しかし、それは少なくなる可能性があります。 既定値は、3 です。
最小確率 モデル内の 1 つのアイテムセットまたはルールに対して検出された最小確率。

例: 0.400390625

メモ アイテムセットの場合、この値は、モデルの作成時に MINIMUM_PROBABILITY パラメーターに設定した値よりも常に大きくなります。
MAX_確率 モデル内の 1 つのアイテムセットまたはルールに対して検出された最大確率。

例: 1

メモ アイテムセットの最大確率を制限するパラメーターはありません。 頻度が高すぎる項目を削除する場合は、代わりに MAXIMUM_SUPPORT パラメーターを使用します。
MIN_LIFT 任意のアイテムセットに対してモデルによって提供されるリフトの最小量。

例: 0.14309369632511

注: 最小リフトを知ることは、1 つのアイテムセットのリフトが重要かどうかを判断するのに役立ちます。
MAX_LIFT 任意のアイテムセットに対してモデルが提供するリフトの最大量。

例: 1.95758227647523 最大リフトを知ることは、1 つのアイテムセットのリフトが重要かどうかを判断するのに役立ちます。

アイテムセット ノード アイテムセット ノードには、コンマ区切りのテキスト文字列として表示される項目の一覧が含まれています。

例:

Touring Tire = Existing, Water Bottle = Existing

これは、ツーリングタイヤとウォーターボトルが一緒に購入されたことを意味します。

ルール ノード ルール ノードには、ルールの左側と右側が矢印で区切って含まれています。

例: Touring Tire = Existing, Water Bottle = Existing -> Cycling cap = Existing

これは、誰かがツーリングタイヤとウォーターボトルを購入した場合、彼らはまた、サイクリングキャップを購入する可能性が高かったことを意味します。

NODE_RULE
ノードに埋め込まれているルールまたはアイテムセットを記述する XML フラグメント。

親ノード 空白。

アイテムセット ノード 空白。

ルール ノード XML フラグメントには、サポート、信頼度、項目数、ルールの左側を表すノードの ID など、ルールに関する追加情報が含まれています。

MARGINAL_RULE
空白。

NODE_PROBABILITY
アイテムセットまたはルールに関連付けられている確率または信頼度スコア。

親ノード 常に 0。

アイテムセット ノード アイテムセットの確率。

ルール ノード ルールの信頼度値。

MARGINAL_PROBABILITY
NODE_PROBABILITYと同じです。

NODE_DISTRIBUTION
このテーブルには、ノードがアイテムセットかルールかに応じて、非常に異なる情報が含まれています。

親ノード 空白。

アイテムセット ノード アイテムセット内の各項目を確率とサポート値と共に一覧表示します。 たとえば、アイテムセットに 2 つの製品が含まれている場合、各製品の名前が、各製品を含むケースの数と共に一覧表示されます。

ルール ノード 2 つの行が含まれています。 最初の行には、予測された項目であるルールの右側の属性と信頼度スコアが表示されます。

2 行目は関連付けモデルに固有です。これには、ルールの右側にあるアイテムセットへのポインターが含まれています。 ポインターは、右側の項目のみを含むアイテムセットの ID として、ATTRIBUTE_VALUE列で表されます。

たとえば、ルールが If {A,B} Then {C}されている場合、テーブルにはアイテム {C}の名前と、アイテム C のアイテムセットを含むノードの ID が含まれます。

このポインターは、すべてのケースに右側の製品が含まれているケースの数をアイテムセット ノードから判断できるため便利です。 ルール If {A,B} Then {C} の対象となるケースは、 {C}のアイテムセットにリストされているケースのサブセットです。

NODE_SUPPORT
このノードをサポートするケースの数。

親ノード モデル内のケースの数。

アイテムセット ノード アイテムセット内のすべての項目を含むケースの数。

ルール ノード ルールに含まれるすべての項目を含むケースの数。

MSOLAP_MODEL_COLUMN
ノードがアイテムセットかルールかに応じて異なる情報が含まれます。

親ノード 空白。

アイテムセット ノード 空白。

ルール ノード ルールの左側にある項目を含むアイテムセットの ID。 たとえば、ルールが If {A,B} Then {C}されている場合、この列には、 {A,B}のみを含むアイテムセットの ID が含まれます。

MSOLAP_NODE_SCORE
親ノード 空白。

アイテムセット ノード アイテムセットの重要度スコア。

ルール ノード ルールの重要度スコア。

重要度はアイテムセットとルールに対して異なる方法で計算されます。 詳細については、「 Microsoft アソシエーション アルゴリズムテクニカル リファレンス」を参照してください

MSOLAP_NODE_SHORT_CAPTION
空白。

こちらもご覧ください

マイニング モデル コンテンツ (Analysis Services - データ マイニング)
Microsoft アソシエーション アルゴリズム
アソシエーション モデル クエリの例