Algorytm skojarzenia firmy Microsoft

The Microsoft Association algorithm is an association algorithm provided by Analysis Services that is useful for recommendation engines.Aparat zalecenie zaleca produktów klientom na podstawie towarów zostały one już zakupionych lub w którym mają one wskazane zainteresowanie.The Microsoft Association algorithm is also useful for analiza koszyka zakupów. Na przykład analiza rynku Kosz zobacz Lekcja 3: Tworzenie scenariusza koszyk rynku (samouczek wyszukiwanie danych pośrednich) w samouczku wyszukiwanie danych.

Skojarzenia modeli są wbudowane w zestawów danych, zawierające identyfikatory zarówno dla indywidualnych przypadkach i elementy, które zawierają sprawy.Grupy towarów przypadek nosi nazwę itemset.W przypadku skojarzenia modelu składa się z szeregu itemsets i zasad, opisujących w jaki sposób te elementy są grupowane w przypadkach.Reguły, które identyfikuje algorytm mieszania można używać do przewidywania nabywcy prawdopodobnie przyszłych zakupów, na podstawie towarów, które już istnieją w koszyku danego nabywcy.Poniższy diagram przedstawia serii reguł w itemset.

A set of rules for an association model

Jak pokazano na rysunku, Microsoft Algorytm skojarzenia potencjalnie można znaleźć wiele reguł w zestawu danych. Algorytm wykorzystuje dwa parametry, obsługa i prawdopodobieństwo, do opisu itemsets i reguł, który generuje.Na przykład jeśli X i Y reprezentują dwa elementy, które mogą być w koszyka zakupów, parametr obsługi jest liczba przypadków do danych, które zawierają kombinację elementów, X i Y.Za pomocą parametru pomocy technicznej w połączeniu z parametrami zdefiniowanej przez użytkownika MINIMUM_SUPPORT i MAXIMUM_SUPPORT, Algorytm kontroluje liczbę itemsets, które są generowane. Parametr prawdopodobieństwa, również o nazwie zaufania, ułamkowa oznacza część przypadkach do danych, która zawiera X i zawierające Y.Za pomocą parametru prawdopodobieństwo w połączeniu z MINIMUM_PROBABILITY parametr algorytmu kontroluje liczbę reguł, które są generowane.

Przykład

The Adventure Works Cycle company is redesigning the functionality of its witryna sieci Web. Cel zmianom jest zwiększenie sprzedaży poprzez produktów.Ponieważ firma rekordów każdej transakcji sprzedaży w bazie danych transakcyjnych, można użyć Microsoft Określa algorytm skojarzenia do identyfikowania produktów, które mają tendencję do zakupu razem. Można je następnie przewidywania dodatkowe elementy, które klient może być zainteresowani, oparte na elementy, które są już w nabywcy zakupy koszyka.

Jak działa algorytmu

The Microsoft Association algorithm traverses a dataset to find items that appear together in a przypadek. Algorytm następnie grupuje w itemsets udostępnienia skojarzonych z nim elementy, które pojawiają się co najmniej kilka spraw, które są określone przez MINIMUM_SUPPORT parametr. Na przykład, może być itemset "Mountain 200 = istniejący Sport 100 = istniejący" i może mieć obsługę 710.Algorytm następnie generuje reguły z itemsets.Zasady te są używane do przewidywania obecność element w bazie danych, oparte na obecność inne określone elementy, które identyfikuje algorytm jako ważne.Może być na przykład regułę „ Jeśli sprzedaży 1000 = istniejące i Road butelki klatki = istniejących, a następnie wodna butelki = istniejące "i może mieć prawdopodobieństwo 0.812.W tym przykładzie algorytm Określa, że obecność w koszyku opona sprzedaży 1000 i klatki butelek wody przewiduje, że butelek wody będzie również prawdopodobnie w koszyku.

Aby bardziej szczegółowy opis algorytmu, wraz z listą parametrów Dostosowywanie zachowania algorytmu i kontrolowania wyniki model wyszukiwania zobacz Informacje techniczne algorytm skojarzenia firmy Microsoft.

Dane wymagane do skojarzenia modeli

Podczas przygotowywania danych do użycia w modelu reguł skojarzenia, należy zapoznać się wymagania dotyczące określonego algorytmu, potrzebny jest ilości danych i sposobu używania danych.

Wymagania dotyczące skojarzenia modelu reguły są następujące:

  • Pojedyncze key column   Each model must contain one numeric or text column that uniquely identifies each record.compound keys not permitted.

  • Pojedyncza przewidywalna kolumna   W przypadku skojarzenia modelu może mieć tylko jedną przewidywalna kolumna.Zazwyczaj jest kolumna klucz tabela zagnieżdżonej, takie jak zachowanej z listą produktów, które zostały zakupione.Wartości muszą być discrete lub discretized.

  • Kolumny danych wejściowych   .Wejściowy kolumny muszą być discrete.Dane wejściowe w przypadku skojarzenia modelu często znajduje się w dwóch tabelach.Na przykład jedna tabela może zawierać informacje o kliencie podczas drugiej tabeli zawiera zakupów nabywcy.Te dane do modelu można wprowadzić za pomocą tabela zagnieżdżonej.Aby uzyskać więcej informacji na temat tabele zagnieżdżone zobacz Zagnieżdżone tabele (Analysis Services — wyszukiwanie danych).

Aby uzyskać więcej informacji na temat typów zawartości i typy danych obsługiwane w przypadku skojarzenia modeli zobacz sekcję Wymagania dotyczące Informacje techniczne algorytm skojarzenia firmy Microsoft.

Wyświetlanie model skojarzenia

Aby poznać modelu, można użyć Przeglądarka Microsoft skojarzenia.Umożliwia wyświetlanie model skojarzenia Analysis Services przedstawia korelacji z różnymi kątami, tak aby lepiej zrozumieć relacje i reguły, które zostały znalezione w danych. The Itemset pane in the viewer provides a detailed breakdown of the most common combinations, or itemsets.The Rules pane presents a list of rules that have been generalized from the data, adds calculations of probability, and ranks the rules by relative importance.the dependency network viewer lets you visually explore how individual different items are connected.Aby uzyskać więcej informacji zobaczWyświetlanie model wyszukiwania z podglądem klastrowania firmy Microsoft.

Aby dowiedzieć się więcej szczegółów o itemsets i reguł, można przeglądać modelu w Podgląd zawartości drzewa rodzajowa firmy Microsoft.Zawartość przechowywaną modelu obejmuje obsługę każdego itemset, wynik dla każdej reguły i inne dane statystyczne.Aby uzyskać więcej informacji zobaczmodel wyszukiwania Zawartości dla skojarzenia modeli (Analysis Services — wyszukiwanie danych).

Tworzenie prognoz

Po przetworzeniu modelu można użyć reguł i itemsets dokonać prognoz.W modelu skojarzenia przewidywanie informuje, jaki element jest prawdopodobne, biorąc pod uwagę na obecność określonego elementu, a przewidywanie mogą zawierać takie informacje, jak to prawdopodobieństwo, pomocy technicznej lub znaczenie.Aby zapoznać się z przykładami sposobu tworzenia kwerend względem model skojarzenia Zobacz Podczas badania model skojarzenia (Analysis Services — wyszukiwanie danych).

Aby uzyskać ogólne informacje o tworzeniu kwerendy przed model wyszukiwanie danych zobacz Podczas badania modeli wyszukiwania danych (Analysis Services — wyszukiwanie danych).

Wydajność

Proces tworzenia itemsets i obliczania korelacji może być czasochłonne.Mimo że Microsoft Algorytm reguły skojarzenia korzysta z techniki optymalizacji aby zaoszczędzić miejsce i szybsze przetwarzanie, należy sprawdzić, które mogą wystąpić problemy z wydajnością, w warunkach, takich jak:

  • Dane zestaw jest duży z wielu pojedynczych elementów.

  • Rozmiar minimalny itemset ustawiono zbyt niski.

Aby zminimalizować czas przetwarzania i zmniejszyć złożoność itemsets, możesz spróbować grupowanie powiązanych zapasów według kategorii, zanim analizować dane.

Uwagi

  • Nie obsługuje korzystania z przewidywanego modelu Markup Language (PMML) do tworzenia modeli wyszukiwania.

  • Obsługuje przeglądanie szczegółowe.

  • Obsługuje korzystanie z modeli wyszukiwania OLAP.

  • Obsługuje tworzenie wymiary wyszukiwanie danych.