Artykuł
07/22/2011

Algorytm skojarzenia Microsoft

Microsoft Algorytm skojarzenia jest algorytm skojarzenia dostarczonych przez Usługi Analysis Services użyteczne dla silników zalecenia.Aparat zalecenie zaleca produktów klientom na podstawie towarów zostały już kupione lub w którym mają wykazało zainteresowania. Microsoft Algorytm skojarzenia jest również przydatne do analiza koszyka zakupów.Zobacz przykład analiza koszyka zakupów Lekcja 3: Tworzenie scenariusza koszyka rynku (samouczek wyszukiwania danych pośrednich) w samouczek wyszukiwania danych.

Skojarzenia modeli są wbudowane w zestawach danych, zawierające identyfikatory zarówno dla indywidualnych przypadków i elementy, które zawierają przypadkach.Nosi nazwę grupy towarów przypadek itemset.Modelu skojarzeń składa się z serii itemsets i reguł, które opisują, jak te elementy są grupowane w przypadkach.Reguły, które identyfikuje algorytm można przewidzieć nabywcy prawdopodobnie zakupów w przyszłości, na podstawie towarów, które już istnieją w koszyku nabywcy.Poniższy diagram przedstawia serii reguł w itemset.

Zestaw reguł dla modelu skojarzenia

Jak diagram przedstawia, Microsoft algorytm skojarzenia potencjalnie można znaleźć wiele reguł w zestawie danych.Algorytm wykorzystuje dwa parametry obsługi i prawdopodobieństwa, do opisania itemsets i reguł, które generuje.Na przykład jeśli x i y reprezentują dwa elementy, które mogą być w koszyk, parametr obsługi jest liczba przypadków w zestawie danych, które zawierają kombinację elementów, X i Y.Za pomocą parametru wsparcia w połączeniu z parametrów zdefiniowanych przez użytkownika MINIMUM_SUPPORT i MAXIMUM_SUPPORT, algorytm kontroluje liczbę itemsets, które są generowane.Parametr prawdopodobieństwa, a także o nazwie ufności, doby przypadków w zestawie danych, która zawiera x i y zawierają również.Za pomocą parametru prawdopodobieństwo w połączeniu z MINIMUM_PROBABILITY parametr algorytmu kontroluje liczbę reguł, które są generowane.

Przykład

Adventure Works Firmy cyklu jest zawierała funkcjonalność witryna sieci Web.Cel tok jest zwiększenie sprzedaży poprzez produktów.Ponieważ firma rekordów każdej sprzedaży w bazie danych transakcyjnych, można użyć Microsoft algorytm skojarzenia do identyfikowania zestawów produktów, które mają tendencję do zakupu razem.One następnie przewidzieć dodatkowe elementy, które klient może być zainteresowani, oparte na elementy, które są już w nabywcy koszyk.

Jak działa algorytm

Microsoft Algorytm skojarzenia przechodzi dataset, aby znaleźć elementy, które są wyświetlane razem przypadek.Algorytm następnie grupuje w dowolnej skojarzonych elementów wyświetlanych, co najmniej liczbę przypadków, które są określone przez itemsets MINIMUM_SUPPORT parametru.Na przykład itemset może być "górskich 200 = istniejący Sport 100 = istniejący" i może mieć obsługę 710.Algorytm generuje następnie reguł z itemsets.Zasady te są używane do przewidywania obecność element w bazie danych, na podstawie obecności innych szczególnych elements, identyfikujący algorytm jako ważne.Na przykład reguła może być "Jeśli Touring 1000 = istniejących i drogi bidon = istniejących, a następnie wody butelki = istniejących", a prawdopodobieństwo 0.812.W tym przykładzie algorytm Określa, że obecność w koszyku opona Touring 1000 i wody bidon przewiduje, że butelka wody także prawdopodobnie byłby w koszyku.

Dla bardziej szczegółowy opis algorytmu, wraz z listą parametrów zachowania algorytm dostosowywanie i kontrolowanie wyniki w model wyszukiwania, zobacz Algorytm skojarzenia Microsoft techniczne.

Dane wymagane do skojarzenia modeli.

Podczas przygotowywania danych do użycia w modelu reguł skojarzenia, należy zrozumieć wymagania dla określonego algorytmu, jak dużo danych jest wymagana i sposobu używania danych.

Wymagania dla skojarzenia modelu reguł są następujące:

A single key column Each model must contain one numeric or text column that uniquely identifies each record.compound keys not permitted.
Pojedyncza przewidywalna kolumnamodelu skojarzeń może mieć tylko jedną przewidywalna kolumna.Zazwyczaj jest kolumna klucz tabela zagnieżdżonej, takich jak zachowanej zawierającego listę produktów, które zostały zakupione.Wartości muszą być discrete lub discretized.
Wprowadzanie kolumny.Wejściowy kolumny muszą być dyskretnego.Dane wejściowe dla modelu skojarzeń często znajduje się w dwóch tabelach.Na przykład jedna tabela może zawierać informacje o odbiorcy podczas drugiej tabeli zawiera zakupów nabywcy.Dane te można wejściowe do modelu przy użyciu tabela zagnieżdżonej.Aby uzyskać więcej informacji dotyczących tabel zagnieżdżonych, zobacz Zagnieżdżone tabele (Analysis Services - wyszukiwania danych).

Aby uzyskać więcej informacji na temat typów zawartości i typy danych obsługiwane dla skojarzenia modeli, zobacz sekcję wymagania dotyczące Algorytm skojarzenia Microsoft techniczne.

Wyświetlanie modelu skojarzeń

Aby poznać modelu, można użyć Przeglądarka Microsoft skojarzenia.Podczas wyświetlania modelu skojarzeń Usługi Analysis Services przedstawia korelacji pod różnymi kątami, tak aby lepiej zrozumieć relacje i reguł, które zostały znalezione w danych.Itemset okienka w przeglądarce zawiera szczegółowy podział typowych kombinacji lub itemsets.The Rules pane presents a list of rules that have been generalized from the data, adds calculations of probability, and ranks the rules by relative importance.the dependency network viewer lets you visually explore how individual different items are connected.Aby uzyskać więcej informacji, zobacz Wyświetlanie modelu górnictwo Viewer klastrowania firmy Microsoft.

Jeśli chcesz dowiedzieć się więcej szczegółów o itemsets i reguł można przeglądać w modelu Ogólnej zawartości drzewa Podgląd programu Microsoft.Zawartość przechowywaną w modelu obejmuje wsparcie dla każdego itemset, wynik dla każdej reguły i innych informacji statystycznych.Aby uzyskać więcej informacji, zobacz Model zawartości dla skojarzenia modeli górnictwo (Analysis Services - wyszukiwania danych).

Tworzenie prognoz

Po przetworzeniu modelu można użyć reguł i itemsets aby prognoz.W modelu skojarzeń przewidywanie informuje, jaki element jest prawdopodobne, biorąc pod uwagę obecność określonego elementu i przewidywanie mogą zawierać takie informacje, jak prawdopodobieństwa, pomocy technicznej lub znaczenie.Przykłady sposobów tworzenia kwerend modelu skojarzeń, zobacz Badanie modelu skojarzeń (Analysis Services - wyszukiwania danych).

Aby uzyskać ogólne informacje o tworzeniu kwerendy danych model wyszukiwania, zobacz Badanie modeli wyszukiwania danych (Analysis Services - wyszukiwania danych).

Wydajność

Proces tworzenia itemsets i licząc korelacji może być czas-zużyciu.Chociaż Microsoft algorytm skojarzenie reguł używa techniki optymalizacji, aby zaoszczędzić miejsce i szybsze przetwarzanie, należy wiedzieć, że może wystąpić problemy z wydajnością, w warunkach, takich jak następujące:

Zestaw danych jest duży z wielu pojedynczych elementów.
Minimalny elementzestaw rozmiar jest zestaw zbyt niskie.

Aby zminimalizować czas przetwarzania i zmniejszyć złożoność itemsets, można spróbować grupowanie pokrewnych elementów według kategorii, zanim analizować dane.

Uwagi

Nie obsługuje korzystania z przewidywanych modelu Markup Language (PMML) do tworzenia modeli wyszukiwania.
Obsługuje przeglądanie szczegółowe.
Obsługuje korzystanie z modeli wyszukiwania OLAP.
Obsługuje tworzenie wymiary wyszukiwanie danych.