Freigeben über


Einkaufskorbanalyse (Tabellenanalysetools für Excel)

Einkaufskorb-Werkzeug Einkaufskorb-Tool

Mit dem Tool „Einkaufskorbanalyse“ können Sie Muster in Ihren Daten finden associations. Eine Assoziation kann Ihnen aufzeigen, welche Artikel häufig gleichzeitig gekauft werden. Im Data Mining ist diese Technik eine bekannte Methode, die als Marktkorbanalyse bezeichnet wird, die verwendet wird, um das Einkaufsverhalten von Kunden in sehr großen Datasets zu analysieren. Marketer können die Informationen verwenden, um verwandte Produkte für Kunden zu empfehlen und verwandte Produkte zu bewerben, indem sie sie in enger Nähe auf Webseiten, in Katalogen oder im Regal platzieren.

Um die Einkaufskorbanalyse zu verwenden, müssen die zu analysierenden Elemente durch eine Transaktions-ID verknüpft sein. Wenn Sie beispielsweise alle Bestellungen analysieren, die über eine Website empfangen wurden, verfügt jede Bestellung über eine Auftrags-ID oder Transaktions-ID, die einem oder mehreren gekauften Artikeln zugeordnet ist.

Wenn der Assistent die Analyse der Daten abgeschlossen hat, erstellt er zwei neue Arbeitsblätter: Einkaufswagen-Elementgruppen und Einkaufswagen-Regeln.

Das Arbeitsblatt " Einkaufskorbelementgruppen" enthält eine Liste der Elemente, die häufig in Transaktionen zusammen angezeigt werden. Diese allgemeinen Gruppierungen werden als Itemsets bezeichnet. Das Arbeitsblatt enthält auch Statistiken, z. B. Support und Lift, um die Bedeutung des Itemsets zu verstehen. Wenn Preisinformationen verfügbar sind, erstellt das Arbeitsblatt auch eine Summe des Werts aller verwandten Elemente, um einen Hinweis auf den Gesamtwert der Transaktionen zu geben.

Sie können die Spalten im Bericht filtern und sortieren. Sie können z. B. nur die Itemsets mit 2 oder mehr Produkten anzeigen oder die Itemsets nach durchschnittlichen Korbwert bestellen.

Das Arbeitsblatt "Einkaufskorbregeln " verwendet die statistiken, die aus der Analyse abgeleitet wurden, um Regeln zur Beziehung von Elementen zu erstellen. Eine Regel könnte zum Beispiel sein, dass Kunden, die Produkt A kaufen, mit hoher Wahrscheinlichkeit auch Produkt B kaufen. Die Regeln können zur Erstellung von Empfehlungen genutzt werden. Jede Regel enthält unterstützende Statistiken, mit denen Sie die potenzielle Stärke der Regel bewerten können, sodass Sie eine Empfehlung nur vornehmen können, wenn die Regel einen bestimmten Wahrscheinlichkeitsschwellenwert überschreitet.

Verwenden des Einkaufskorbanalysetools

  1. Öffnen Sie eine Excel-Tabelle, die entsprechende Daten enthält. Klicken Sie in der Beispielarbeitsmappe auf das Arbeitsblatt "Zuordnen".

  2. Klicken Sie auf "Einkaufskorbanalyse".

  3. Wählen Sie im Dialogfeld "Einkaufskorbanalyse " die Spalte aus, die die Transaktions-ID enthält, und wählen Sie dann die Spalte aus, die die zu analysierenden Elemente oder Produkte enthält.

  4. Optional können Sie eine Spalte hinzufügen, die Produktwerte enthält.

  5. Klicken Sie auf"Erweitert", um das Dialogfeld " Erweiterte Parametereinstellung " zu öffnen. Erhöhen Sie den Wert für die Minimale Unterstützung , um die Anzahl der Produkte zu verringern, die als Itemsets gruppiert sind. Erhöhen Sie die Mindestregelwahrscheinlichkeit , um sehr häufige Itemsets herauszufiltern.

Anforderungen

Damit Sie das Tool " Einkaufskorbanalyse " verwenden können, müssen Ihre Daten in einer Excel-Tabelle gespeichert sein und die folgenden Spalten enthalten:

  • Spalte, die eine eindeutige ID enthält, die die Transaktion darstellt. Die ID kann numerisch oder textisch sein, solange der Wert in jeder Zeile eindeutig ist.

  • Spalte, die das element oder produkt enthält, das Sie analysieren.

  • Eine optionale numerische Spalte, die den Preis oder den Wert der einzelnen Artikel darstellt. Diese Spalte wird verwendet, um den Wert der Itemsets zu aggregieren, in denen jedes Produkt gefunden wird, und sie können Ihnen helfen, den Gesamtwert bestimmter Transaktionen zu verstehen.

Wie Elemente zugeordnet sind

Die einzelnen Elemente, die Sie analysieren, müssen nach einem Bezeichner gruppiert werden, der den Fall, die Transaktion oder die Gelegenheit darstellt. Daher würden Sie diese Transaktions-ID-Spalte als Bezeichner und nicht als Kunden-ID oder Produkt-ID-Nummer auswählen.

Wenn das Tool die Produkte in jeder Transaktion untersucht, wird für jede gefundene Kombination von Elementen ein Itemset erstellt. Wenn ein Kunde z. B. drei Artikel auf einem einzigen Besuch gekauft hat, gibt es 7 mögliche Artikelgruppen: jedes Produkt selbst, jedes Produkt gruppiert mit einem anderen Produkt und die Kombination aller drei Produkte.

Hinweis

Sie können die Itemsets herausfiltern, die einzelne Elemente enthalten, aber das Tool muss diese analysieren, um aussagekräftige Statistiken für den Datensatz zu generieren.

Die Unterstützung für jedes Itemset wird als die Anzahl der Kunden berechnet, die ein Itemset kaufen. Wenn nur ein Kunde 3 Artikel mit 7 möglichen Itemsets gekauft hat, hat jedes der 7 Itemsets einen Supportwert von 1. Wenn die Anzahl der Kunden wächst und die Anzahl möglicher Kombinationen wächst, kann es viel länger dauern, den Bericht zu verarbeiten. Einige Itemsets könnten jedoch einen sehr kleinen Support haben. Daher können Sie die Zeit für die Erstellung des Berichts verringern, indem Sie die Anzahl der Elemente in jedem Itemset auf 3 oder weniger beschränken. Im Allgemeinen haben größere Itemsets viel niedrigere Unterstützung, sodass der Kompromiss akzeptabel ist.

Angeben der Mindestunterstützung und Regelwahrscheinlichkeit

Wenn Ihr Dataset größer wird, kann die Anzahl möglicher Elementgruppierungen und Regeln überwältigend werden. Sie können jedoch die Anzahl der Ergebnisse steuern, die vom Tool ausgegeben werden, um sich nur auf die wertvollsten Itemsets und Regeln zu konzentrieren. Sie legen diese Optionen im Dialogfeld "Erweiterte Parameter für den Einkaufskorb" fest.

Minimale Unterstützung

Die Minimale Unterstützung bedeutet die Anzahl der Transaktionen, die ein bestimmtes Itemset enthalten müssen, damit das Itemset als signifikant betrachtet wird. So könnten Sie beispielsweise nicht an einem Itemset interessiert sein, es sei denn, es wurde in mindestens 10 verschiedenen Transaktionen gekauft. Es gibt zwei Möglichkeiten zum Steuern des Schwellenwerts für die Bedeutung von Itemset, und beide verwenden den Parameter "Minimum support ".

Als absoluter Wert: Geben Sie eine Zahl ein, die die Anzahl der Transaktionen darstellt, die die Zielelemente enthalten. Wenn Sie beispielsweise "10" eingeben, werden alle Elemente, die in mindestens 10 Einkaufskörben angezeigt werden, in den Ergebnissen enthalten.

Als Prozentsatz: Geben Sie eine Zahl ein, die einen Prozentsatz der gesamten Auflistung von Itemsets darstellt. Wenn Sie beispielsweise "10" angeben, werden alle Itemsets gezählt, und das zielorientierte Itemset muss mindestens 10 Prozent der Gesamtzahl der Itemsets darstellen. Wenn Sie über ein sehr großes Dataset verfügen, können Sie mithilfe von Prozentsätzen anstelle einer Anzahl auf die wichtigsten Elementgruppierungen konzentrieren.

Hinweis

Denken Sie daran, dass sich die Anzahl der Itemsets von der Anzahl der Transaktionen in Ihren Daten unterscheidet. Jede Transaktion kann mehrere Itemsets enthalten; Die meisten Itemsets werden jedoch mehrmals über das Dataset hinweg wiederholt.

Regelwahrscheinlichkeit und Regel wichtigkeit

Die Wahrscheinlichkeit einer Regel beschreibt, wie wahrscheinlich das Ergebnis einer Regel ist. Die Regelwahrscheinlichkeit wird mithilfe der Häufigkeit der Itemsets berechnet, die eine Regel unterstützen. Wenn ein Itemset sehr selten auftritt, hat es eine geringe Wahrscheinlichkeit.

Regeln mit hoher Wahrscheinlichkeit sind jedoch möglicherweise nicht immer nützlich. Sie können auf Itemsets hinweisen, die häufig gekauft werden und daher keine zusätzliche Werbung benötigen. Die Bedeutung ist darauf ausgelegt, die Nützlichkeit einer Regel zu messen. Manchmal kann eine Regel sehr hohe Wahrscheinlichkeit haben, aber eine geringe Wichtigkeit, da die Vorhersage keine neuen Informationen bereitstellt. Wenn beispielsweise jedes Itemset einen bestimmten Status eines Attributs enthält, ist eine Regel, die voraussagt, dass dieser Zustand trivial ist, auch wenn die Wahrscheinlichkeit sehr hoch ist.

Sie sollten mit diesen Einstellungen experimentieren, um unterschiedliche Ergebnisse zu erzielen und festzustellen, welche Einstellung die interessantesten Regeln liefert.

Grundlegendes zu den Berichten

Das Tool "Shopping Basket Analysis " erstellt zwei ergänzende Berichte. Der erste Bericht mit dem Titel "Wichtige Gruppen von Elementen, die während der Analyse identifiziert wurden" enthält eine Liste aller gefundenen Itemsets. Sie können die neuen Tabellentools in Microsoft Excel verwenden, um die Daten zu sortieren, zu filtern und zu untersuchen.

Der zweite Bericht mit dem Titel "Einkaufskorbregeln" teilt Ihnen mit, welche Art von Rückschlüssen auf die im ersten Bericht aufgeführten Itemsets erfolgen können. Während die Liste der Itemsets nützlicher ist, um Ihre Daten zu untersuchen und zu verstehen, ist die Liste der Regeln nützlicher für die Erstellung von Vorhersagen und Empfehlungen.

Bericht über Warenkorbartikelgruppen

Dieser Bericht enthält eine Liste aller möglichen Kombinationen von Elementen, die in Ihrem Datensatz gefunden wurden. Wenn Ihre Transaktionsdaten beispielsweise Bestellungen enthalten, berechnet das Tool " Shopping Basket Analysis " für jeden Auftrag, wie oft der einzelne Artikel bestellt wurde, und berechnet dann alle Kombinationen dieses Artikels mit anderen Elementen.

Der Bericht listet die Itemsets in der Reihenfolge ihres Hebefaktors auf. Lift ist eine Bewertung, die Ihnen die Wichtigkeit des Itemsets angibt.

Spalte im Bericht Was sie erfahren
Gruppe von Elementen Listet die Itemsets oder eine Kombination von Elementen auf.
Gruppengröße Anzahl der Elemente im Itemset. Sie können nach diesem Feld filtern, um nur Paare von Elementen, einzelnen Elementen usw. anzuzeigen.
Unterstützung Anzahl der Fälle, in denen diese Kombination aufgetreten ist. Sie können nach dieser Spalte sortieren, um die am häufigsten verwendeten Itemsets anzuzeigen.
Durchschnittswert Eine Summe des Werts der Elemente in nur diesen Itemsets, dividiert durch die Unterstützung. Sie können nach dieser Spalte sortieren und filtern, um Produkte in verschiedenen Preisbereichen zu adressieren.
Durchschnittlicher Korbwert Die Summe der Werte aller Artikel in Bestellungen, die dieses Artikelset enthalten, dividiert durch den Unterstützungswert. Diese Statistik ist interessant, wenn sie mit dem Durchschnittswert des Itemsets gekoppelt ist.
Heben Eine Bewertung, die angibt, wie interessant dieses Itemset im gesamten Dataset ist. Der "Lift" wird berechnet, indem die Wahrscheinlichkeit, dass zwei Elemente zusammen auftreten, geteilt durch die Wahrscheinlichkeit, dass zwei Elemente unabhängig voneinander auftreten, berechnet wird. Wenn es also eine starke Korrelation zwischen den Elementen gibt, wird die Punktzahl der Lifte höher sein.

Bericht über Einkaufskorbregeln

Dieser Bericht enthält eine Reihe von Regeln, die erstellt wurden, indem die gefundenen Itemsets analysiert wurden. Wenn Ihre Transaktionsdaten beispielsweise ergeben haben, dass Produkte A und B häufig zusammen gekauft wurden, erstellt das Tool "Shopping Basket Analysis" eine Regel, die A aufgrund des Vorhandenseins von B oder B voraussagt.

Jede Regel ist einer Wahrscheinlichkeit zugeordnet, die von den unterstützenden Daten abgeleitet wird. Diese Wahrscheinlichkeiten sind nützlich, wenn Empfehlungen vorgenommen werden. So möchten Sie z. B. nur Regeln anzeigen, die mindestens eine 50 Prozent Wahrscheinlichkeit haben, auf der Grundlage vorhandener Daten genau zu sein.

Der Bericht listet die Itemsets in der Reihenfolge ihres Lift-Werts auf. Lift ist eine Bewertung, die Ihnen die Wichtigkeit des Itemsets angibt.

Spalte im Bericht Was sie erfahren
Vorhandene Elemente Listet die Elemente auf, die zum Erstellen einer Empfehlung erforderlich sind.

Im Data Mining werden diese Elemente auf der linken Seite der Zuordnungsregel angegeben.
Vorhergesagtes Element Listet das zu empfehlende Element auf.

Im Data Mining werden diese Elemente auf der rechten Seite der Zuordnungsregel angegeben.
Wahrscheinlichkeit Zeigt die Wahrscheinlichkeit an, dass diese Regel korrekt ist.
Unterstützung Gibt die Anzahl der Fälle in vorhandenen Daten an, die Nachweise für diese Regel liefern.
Regelwert Wenn Sie einen Wert für die Artikel im Einkaufskorb angeben, berechnet diese Spalte den Wert der Vorhersage anhand der Kosten der Artikel.
Aufzug Gibt die Stärke der Korrelation zwischen den Elementen in der ersten Spalte und den Elementen in der zweiten Spalte an. Auch als Wichtig bezeichnet.

Ein Lift von 0 bedeutet, dass es keine Korrelation gibt. Ein positiver Wert bedeutet, dass die Elemente in der ersten Spalte das Element in der zweiten Spalte vorhersehen. Je höher die Zahl, desto stärker die Korrelation.

Der Data Mining-Client für Excel, ein separates Add-In, das erweiterte Data Mining-Funktionen bereitstellt, enthält auch einen Assistenten, der Zuordnungsanalysen durchführt. Weitere Informationen finden Sie im Zuordnungsassistenten, Data Mining Client für Excel.

Weitere Informationen zum Algorithmus, der zur Durchführung dieser Analyse verwendet wird, finden Sie im Thema "Microsoft Association Algorithm" in SQL Server Books Online.

Siehe auch

Tabellenanalysetools für Excel