Badanie Naive Bayes Model (Analysis Services - wyszukiwania danych)

Podczas tworzenia kwerendy danych model wyszukiwania, można utworzyć albo zawartości kwerendę, która zawiera szczegółowe informacje dotyczące wzorców wykryte w analizie, lub można utworzyć kwerendę przewidywanie używa desenie w modelu, aby prognoz dla nowych danych.Można także pobrać metadane dotyczących modelu za pomocą kwerendy przeciwko wyszukiwania danych zestaw zestaw wierszy schematu.W tej sekcji wyjaśniono, jak tworzyć te kwerendy dla modeli, które są oparte na algorytmie Microsoft Naive Bayes.

Kwerendy zawartości

Pobieranie metadane modelu przy użyciu DMX

Pobieranie podsumowanie danych szkolenia

Więcej informacji o atrybutach znajdowanie

Przy użyciu procedury składowane w systemie

Przewidywania kwerend

Przewidywaniu rezultatów przy użyciu kwerendy singleton

Uzyskiwanie prognoz z wartości prawdopodobieństwa i pomocy technicznej

Przewidywaniu skojarzenia

Znajdowanie informacji o modelu Naive Bayes

Model zawartości modelu Naive Bayes zawiera zagregowane informacje o dystrybucji wartości w dane szkolenia.Można także pobrać informacje o metadane modelu przez utworzenie kwerend zestawów wierszy schematu wyszukiwanie danych.

Przykładowa kwerenda 1: Pobieranie metadanych modelu przy użyciu DMX

Przez badanie zestaw wierszy schematu wyszukiwanie danych, można znaleźć metadane modelu.Gdy model został utworzony, gdy model ostatnio został przetworzony, nazwa może obejmować struktura wyszukiwania że zależy od modelu i nazwy kolumn są używane jako atrybut przewidywalne.Może również zwracać parametry, które były używane podczas tworzenia modelu.

SELECT MODEL_CATALOG, MODEL_NAME, DATE_CREATED, LAST_PROCESSED,
SERVICE_NAME, PREDICTION_ENTITY, FILTER
FROM $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'TM_NaiveBayes_Filtered'

Przykładowe wyniki:

MODEL_CATALOG

AdventureWorks

NAZWA_MODELU

TM_NaiveBayes_Filtered

DATE_CREATED

3/1/2008 19:15

LAST_PROCESSED

3/2/2008 20:00

SERVICE_NAME

Microsoft_Naive_Bayes

PREDICTION_ENTITY

Kupujący rowerów, roczny dochód

FILTER

[Region] = "Europa" LUB [Region] = "Ameryki Północnej"

Model używany w tym przykładzie jest oparty na modelu Naive Bayes, Utwórz w Samouczek wyszukiwania danych podstawowych, ale był modyfikowany przez dodanie drugiego atrybut przewidywalny i zastosowanie filtru do danych szkolenia.

Powrót do początku

Przykładowa kwerenda 2: Pobieranie podsumowanie danych szkolenia

W modelu Naive Bayes węzeł Statystyka marginalny przechowuje zagregowane informacje o dystrybucji wartości w dane szkolenia.Podsumowanie to jest wygodne i pozwala uniknąć tworzenia kwerend SQL danych szkolenia te same informacje.

W poniższym przykładzie użyto DMX kwerendy zawartości do pobierania danych z węzła (NODE_TYPE = 24).Ponieważ statystyki są przechowywane w tabela zagnieżdżonej, słowo kluczowe FLATTENED jest używana do ułatwiają wyświetlanie wyniki.

SELECT FLATTENED MODEL_NAME,
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, [SUPPORT], [PROBABILITY], VALUETYPE FROM NODE_DISTRIBUTION) AS t
FROM TM_NaiveBayes.CONTENT
WHERE NODE_TYPE = 26

Ostrzeżenie

Nazwy kolumn, obsługi i prawdopodobieństwa, należy ująć w nawiasy, aby odróżnić je od wyrażeń wielowymiarowych (MDX) zarezerwowanych słowa kluczowe takie same nazwy.

Wyniki częściowe:

NAZWA_MODELU

t.ATTRIBUTE_NAME

t.ATTRIBUTE_VALUE

t.support

t.PROBABILITY

t.VALUETYPE

TM_NaiveBayes

Kupujący Bike

Brak

0

0

1

TM_NaiveBayes

Kupujący Bike

0

8869

0.507263784

4

TM_NaiveBayes

Kupujący Bike

1

8615

0.492736216

4

TM_NaiveBayes

Płeć

Brak

0

0

1

TM_NaiveBayes

Płeć

P

8656

0.495081217

4

TM_NaiveBayes

Płeć

M

8828

0.504918783

4

Na przykład, wyniki te określić liczbę przypadków szkolenia dla każdej wartości discrete (VALUETYPE = 4), wraz z prawdopodobieństwem obliczaną, skorygowana dla brakujących wartości (VALUETYPE = 1).

Definicję wartości podane w tabela NODE_DISTRIBUTION w modelu Naive Bayes Górnictwo modelu zawartości dla modeli Naive Bayes (Analysis Services - wyszukiwania danych).Aby uzyskać informacje dotyczące sposobu obliczenia pomocy technicznej i prawdopodobieństwo dotyczy brakujących wartości, zobacz Brak wartości (Analysis Services - wyszukiwania danych).

Powrót do początku

Przykładowa kwerenda 3: Więcej informacji o atrybutach znajdowanie

Ponieważ model Naive Bayes często zawiera złożone informacje o relacje między różnymi atrybutami, najprostszym sposobem wyświetlania tych relacji jest użycie Podgląd programu Microsoft Naive Bayes.Można jednak utworzyć kwerendy DMX, aby zwrócić dane.

Poniższy przykład ilustruje sposób do zwracania informacji z modelu o określonego atrybut Region.

SELECT NODE_TYPE, NODE_CAPTION, 
NODE_PROBABILITY, NODE_SUPPORT, MSOLAP_NODE_SCORE
FROM TM_NaiveBayes.CONTENT
WHERE ATTRIBUTE_NAME = 'Region'

Ta kwerenda zwraca dwa typy węzłów: węzeł reprezentujący atrybut wejściowy (NODE_TYPE = 10) i węzłów dla każdej wartości atrybutu (NODE_TYPE = 11).Podpis węzła jest używany do identyfikowania węźle zamiast nazwy węzła, ponieważ podpis zawiera nazwę atrybut i wartość atrybut.

NODE_TYPE

NODE_CAPTION

NODE_PROBABILITY

NODE_SUPPORT

MSOLAP_NODE_SCORE

NODE_TYPE

10

Roweru kupującego -> regionu

1

17484

84.51555875

10

11

Roweru kupującego -> regionu = Brak

0

0

0

11

11

Roweru kupującego -> Region Ameryki Północnej =

0.508236102

8886

0

11

11

Roweru kupującego -> Region Pacyfiku =

0.193891558

3390

0

11

11

Roweru kupującego -> regionu Europy =

0.29787234

5208

0

11

Niektóre kolumny przechowywane w węzłach są takie same, można uzyskać od węzłów marginalny statystyki, takie jak ocena prawdopodobieństwa węzła i węzeł obsługuje wartości.Jednakże MSOLAP_NODE_SCORE jest wartością specjalną dostarczane tylko dla węzłów atrybutu wejściowych i wskazuje względną ważnością ten atrybut w modelu.Można wyświetlić wiele tych samych informacji w okienku zależności sieci podglądu; Przeglądarka nie zapewnia jednak wyniki.

Następująca kwerenda zwraca wyniki znaczenie wszystkich atrybutów w modelu:

SELECT NODE_CAPTION, MSOLAP_NODE_SCORE
FROM TM_NaiveBayes.CONTENT
WHERE NODE_TYPE = 10
ORDER BY MSOLAP_NODE_SCORE DESC

Przykładowe wyniki:

NODE_CAPTION

MSOLAP_NODE_SCORE

Roweru kupującego -> dzieci całkowita

181.3654836

Roweru kupującego -> wrócić odległość

179.8419482

Roweru kupującego -> angielskim edukacji

156.9841928

Roweru kupującego -> liczby dzieci w Główny

111.8122599

Roweru kupującego -> regionu

84.51555875

Roweru kupującego -> Stan cywilny

23.13297354

Roweru kupującego -> Angielski przewoźnika

2.832069191

Przeglądając zawartość modelu w Przeglądarka Microsoft ogólna zawartość drzewa, otrzymasz zorientować się jakie statystyki mogą być interesujące.Proste przykłady wykazano poniżej; częściej może być konieczne wykonać wielu kwerend lub zapisać wyniki i ich przetworzenia klient.

Powrót do początku

Przykładowa kwerenda 4: Za pomocą systemu procedur przechowywanych

W uzupełnieniu do pisania kwerend zawartości, można użyć niektórych usług Analysis Services procedury składowane w systemie badanie wyniki.Aby użyć systemowa procedura składowana, Nazwa procedura składowana ze słowem kluczowym wywołanie prefiksu:

CALL GetPredictableAttributes ('TM_NaiveBayes')

Wyniki częściowe:

ATTRIBUTE_NAME

NODE_UNIQUE_NAME

Kupujący Bike

100000001

Ostrzeżenie

Te procedury składowane w systemie są do wewnętrznej komunikacji między Analysis Services serwera i klient i powinno być używane tylko dla wygody podczas opracowywania i testowania modeli wyszukiwania.Podczas tworzenia kwerendy dotyczące systemu produkcyjnego należy zawsze pisać własne kwerendy przy użyciu DMX.

Aby uzyskać więcej informacji dotyczących usługi Analysis Services procedury składowane w systemie, zobacz Procedury przechowywane do wyszukiwania danych (Analysis Services - wyszukiwania danych).

Powrót do początku

Tworzenie prognoz za pomocą Naive modelu Bayes

Microsoft Bayes Naive algorytm jest zazwyczaj używana mniejsza do przewidywanie niż poszukiwanie relacje między atrybuty wejściowych i przewidywalny.Jednak model obsługuje funkcje przewidywanie przewidywanie i skojarzenia.

Przykładowa kwerenda 5: Przewidywaniu rezultatów przy użyciu kwerendy Singleton

Następujące zastosowania kwerendy pojedyncza kwerendy nową wartość i przewidywania, oparty na modelu, czy klient z tych cech może kupić rower.Najprostszym sposobem utworzenia kwerendy singleton na modelu regresja jest za pomocą Wprowadzania kwerendy Singleton okno dialogowe.Na przykład utworzyć następującą kwerendę DMX wybierając TM_NaiveBayes wzór, wybierając Kwerendy Singleton, i wybranie wartości z listy rozwijanej listy dla [Commute Distance] i Gender.

SELECT
  Predict([TM_NaiveBayes].[Bike Buyer])
FROM
  [TM_NaiveBayes]
NATURAL PREDICTION JOIN
(SELECT '5-10 Miles' AS [Commute Distance],
  'F' AS [Gender]) AS t

Przykład wyniki:

Wyrażenie

0

Funkcja przewidywanie zwraca najprawdopodobniej wartość, w tym przypadek 0, co oznacza ten typ klienta jest mało prawdopodobne, aby kupić rower.

Powrót do początku

Przykładowa kwerenda 6: Uzyskiwanie przewidywania prawdopodobieństwa i obsługa wartości

W uzupełnieniu do przewidywanie wyniku, często chcą wiedzieć, jak silne jest przewidywanie.Następująca kwerenda używa tej samej kwerendzie singleton w poprzednim przykładzie, ale dodaje funkcja przewidywanie PredictHistogram (DMX), aby zwrócić zagnieżdżoną tabela zawierającą statystyki wspierające przewidywanie.

SELECT
  Predict([TM_NaiveBayes].[Bike Buyer]),
  PredictHistogram([TM_NaiveBayes].[Bike Buyer])
FROM
  [TM_NaiveBayes]
NATURAL PREDICTION JOIN
(SELECT '5-10 Miles' AS [Commute Distance],
  'F' AS [Gender]) AS t

Przykład wyniki:

Kupujący Bike

OBSŁUGA $

PRAWDOPODOBIEŃSTWO $

$ADJUSTEDPROBABILITY

ODCHYLENIE $

FUNKCJA ODCH.STANDARDOWE $

0

10161.5714

0.581192599

0.010530981

0

0

1

7321.428768

0.418750215

0.008945684

0

0

  

0.999828444

5.72E-05

5.72E-05

0

0

Wiersz końcowy w tabela pokazuje dostosowań do obsługi i prawdopodobieństwa dla brakujących wartości.Wariancja i odchylenie standardowe wartości są zawsze 0, ponieważ modele Naive Bayes nie modelu ciągłej wartości.

Powrót do początku

Przykładowa kwerenda 7: Przewidywaniu skojarzenia

Algorytm Microsoft Naive Bayes może służyć do analizy skojarzenia Jeśli struktura wyszukiwania zawiera zagnieżdżoną tabela z atrybut przewidywalne jako klucz.Na przykład, można zbudować model Naive Bayes za pomocą struktura wyszukiwania utworzone w Lekcja 3: Tworzenie scenariusza koszyka rynku (samouczek wyszukiwania danych pośrednich) Samouczek wyszukiwanie danych.Model używany w tym przykładzie został zmodyfikowany, aby dodać informacje dotyczące dochodu i odbiorcy region przypadek tabela.

W poniższym przykładzie kwerenda pokazuje kwerendę singleton, która przewiduje produktów, które są związane z zakupów produktów, 'Road Tire Tube'.Zalecić produktów do określonego typu klient może użyć tych informacji.

SELECT   PredictAssociation([Association].[v Assoc Seq Line Items])
FROM [Association_NB]
NATURAL PREDICTION JOIN
(SELECT 'High' AS [Income Group],
  'Europe' AS [Region],
  (SELECT 'Road Tire Tube' AS [Model]) 
AS [v Assoc Seq Line Items]) 
AS t

Wyniki częściowe:

Model

Women's Mountain Shorts

Butelka po wodzie

Touring-3000

Touring-2000

Touring-1000

Powrót do początku

Lista funkcji

Wszystkie Microsoft obsługę algorytmów wspólny zestaw funkcji.Jednakże Microsoft Naive Bayes algorytm obsługuje dodatkowe funkcje, które są wymienione w poniższej tabela.

Aby uzyskać listę funkcji, które są wspólne dla wszystkich Microsoft algorytmy, zobacz Algorytm odniesienia (Analysis Services - wyszukiwania danych).Aby składni określonych funkcji, zobacz Odwołanie do funkcji rozszerzenia górnictwa (DMX) danych.