Artykuł
07/22/2011

Algorytm Bayes Microsoft Naive

The Microsoft Naive Bayes algorithm is a classification algorithm provided by Microsoft SQL Server Usługi Analysis Services for use in predictive modeling.Nazwa Naive Bayes wynika z fakt, że algorytm używa Bayes theorem, ale nie uwzględnia zależności konta, które mogą istnieć, a zatem jego założenia są określane jako naive.

Ten algorytm jest w praktyce mniej intensywna niż inne Microsoft Algorytmy i dlatego jest przydatne do szybkiego generowania modeli wyszukiwania wykrywanie relacje między wprowadzania kolumny i przewidywalny kolumn.Ten algorytm umożliwia wstępne explorations danych, a następnie później można stosować do tworzenia modeli wyszukiwania dodatkowych z innych algorytmów, które są w praktyce bardziej intensywnego i dokładniejsze wyniki.

Przykład

Jako stałe strategii promocyjnej dział marketingu firmy Adventure Works Cycle podjęła decyzję o miejsce docelowe potencjalnych klientów przy wysyłkową poza ulotki.Aby zmniejszyć koszty, mają wysyłać tylko do tych klientów, którzy mogą odpowiadać ulotki.Przedsiębiorstwo przechowuje informacje w bazie danych o demograficzne i odpowiedź na poprzednie korespondencji.Chcą używać tych danych, aby zobaczyć, jak demograficzne, takie jak wiek i lokalizacji może pomóc przewidzieć odpowiedzi do promocji, porównując potencjalnych klientów do klientów, którzy mają podobne cechy i z firmy, którzy kupili w przeszłości.W szczególności które chcą widzieć różnice między tych klientów, którzy kupują roweru i klientów, którzy nie.

Za pomocą Microsoft Naive Bayes algorytm dział marketingu szybko można przewidzieć wyniku profilu nabywcy i dlatego można określić, którzy są najprawdopodobniej odpowiedzieć na ulotki.Za pomocą Microsoft Naive Bayes podglądu w Business Intelligence Development Studio, mogą one również wizualnie zbadanie specjalnie kolumny danych wejściowych, które przyczyniają się do pozytywnej odpowiedzi do ulotki.

Jak działa algorytm

Microsoft Naive Bayes algorytm oblicza prawdopodobieństwo każdego Państwa w wejściowy kolumn, biorąc pod uwagę możliwe stany przewidywalna kolumna.Można użyć Microsoft Naive Bayes podglądu w Business Intelligence Development Studio Aby zobaczyć graficzną reprezentację jak algorytm rozprowadza Państwa, jak pokazano w poniższej grafiki.

Dystrybucja stanów prostego klasyfikatora Bayesa

Microsoft Naive Bayes Podgląd wyświetla każdej kolumna zestawu danych wejściowych i pokazuje, w jaki sposób są rozprowadzane Państwa każdej kolumna, biorąc pod uwagę każdemu Państwu przewidywalna kolumna.Ten widok umożliwia identyfikację wprowadzania kolumn, które są ważne dla rozróżnianie między Państwami przewidywalna kolumna.Na przykład kolumna wrócić odległość pokazano tutaj, jeśli klient commutes od jednego do dwóch mil do pracy, prawdopodobieństwo, że klient będzie kupić rower jest 0.387, a prawdopodobieństwo, że odbiorcy nie kupują bike 0.287.W tym przykładzie algorytm wykorzystuje dane liczbowe, pochodzące z klienta takie cechy jak odległość commute do przewidywania, czy klient będzie kupić rower.Aby uzyskać więcej informacji o korzystaniu z Microsoft Naive Bayes Podgląd, zobacz Wyświetlanie modelu górnictwo Viewer Microsoft Naive Bayes.

Dane wymagane dla modeli Naive Bayes

Podczas przygotowywania danych do użycia w modelu Naive Bayes szkolenia, należy zrozumieć wymagania dla algorytmu, jak dużo danych jest wymagana i sposobu używania danych.

Wymagania dla modelu Naive Bayes są następujące:

kolumna kluczkażdego modelu musi zawierać jedną kolumna liczbowe lub tekst, który unikatowo identyfikuje każdy rekord.Mieszanki klucze nie są dozwolone.
Wprowadzanie kolumnyW Naive Bayes modelu wszystkie kolumny muszą być discrete lub discretized kolumny.Informacje discretizing kolumn, zobacz Metody discretization (wyszukiwania danych).Dla modelu Naive Bayes jest ważne, aby zapewnić, że wejściowe atrybuty są niezależne od siebie.
Co najmniej jedną przewidywalna kolumnaprzewidywalne atrybut musi zawierać wartości discrete lub discretized.Wartości przewidywalna kolumna mogą być traktowane jako danych wejściowych i są często, aby znaleźć relacji między kolumnami.

Wyświetlanie modelu

Aby poznać modelu, można użyć Podgląd programu Microsoft Naive Bayes.Podgląd pokazuje powiązań wprowadzania atrybutów atrybut przewidywalne.Viewer zawiera także szczegółowe profil każdy klaster listę atrybutów, które odróżniają każdy klaster od innych i cech całego zestaw danych szkoleniowych.Aby uzyskać więcej informacji, zobacz Wyświetlanie modelu górnictwo Viewer Microsoft Naive Bayes.

Jeśli chcesz wiedzieć więcej szczegółów można przeglądać w modelu Drzewo zawartości Microsoft Generic Viewer (Projektant wyszukiwania danych).Aby uzyskać informacje dotyczące typu informacji przechowywanych w modelu, zobacz Górnictwo modelu zawartości dla modeli Naive Bayes (Analysis Services - wyszukiwania danych).

Tworzenie prognoz

Po przeszkoleni modelu wyniki są przechowywane jako zestaw wzorców, które można eksplorować lub za pomocą prognoz.

Można utworzyć kwerendy do zwrotu prognoz dotyczących nowych danych odnosi się do atrybut przewidywalny, lub można pobrać statystyki opisujące korelacji znalezione przez model.

Aby uzyskać informacje dotyczące sposobu tworzenia kwerend danych model wyszukiwania, zobacz Badanie modeli wyszukiwania danych (Analysis Services - wyszukiwania danych).Zobacz przykłady kwerend za pomocą modelu Naive Bayes Badanie Naive Bayes Model (Analysis Services - wyszukiwania danych).

Uwagi

Obsługuje korzystanie z przewidywanych modelu Markup Language (PMML) do tworzenia modeli wyszukiwania.
Obsługuje przeglądanie szczegółowe.
Nie obsługuje tworzenia wymiary wyszukiwanie danych.
Obsługuje korzystanie z modeli wyszukiwania OLAP.