Artykuł
07/22/2011

Badanie modelu drzewa decyzji (Analysis Services - wyszukiwania danych)

Podczas tworzenia kwerendy danych model wyszukiwania, można utworzyć kwerendę zawartości, która zawiera szczegółowe informacje dotyczące wzorców wykryte w analizie, lub można utworzyć kwerendę przewidywanie używa desenie w modelu, aby prognoz dla nowych danych.Na przykład kwerendy zawartości dla modelu drzewa decyzji może dostarczyć statystyki dotyczące liczby przypadków w każdym poziom drzewa lub reguły, które rozróżnienia przypadków.Alternatywnie kwerendy przewidywanie mapuje modelu nowe dane w celu generowania zalecenia, klasyfikacje i tak dalej.Aby pobrać metadane dotyczących modelu kwerendy.

W tej sekcji wyjaśniono, jak tworzyć kwerendy dla modeli, które są oparte na Microsoft algorytm drzewa decyzji.

Kwerendy zawartości

Pobieranie parametrów modelu z zestawu wierszy schematu wyszukiwania danych

Uzyskiwanie szczegółowych informacji o drzew w modelu przy użyciu DMX

Pobieranie poddrzew z modelu

Przewidywania kwerend

Zwracanie prognoz z prawdopodobieństwa

Przewidywaniu skojarzenia z modelu drzewa decyzji

Pobieranie formuły regresji z modelu drzewa decyzji

Znajdowanie informacji o modelu drzewa decyzji

Do tworzenia kwerend znaczenie zawartości modelu drzewa decyzji, należy zrozumieć strukturę zawartości modelu i typy węzłów, które przechowują rodzaj informacji.Aby uzyskać więcej informacji, zobacz Model zawartości dla modeli drzewa decyzji górnictwo (Analysis Services - wyszukiwania danych).

Przykładowa kwerenda 1: Pobieranie parametrów modelu z zestawu wierszy schematu wyszukiwania danych

Przez badanie zestaw wierszy schematu wyszukiwanie danych, można znaleźć metadane dotyczące modelu, takie jak utworzenia go, gdy model ostatnio został przetworzony, nazwa struktura wyszukiwania że zależy od modelu i nazwę kolumna używane jako atrybut przewidywalne.Może również zwracać parametry, które były używane podczas modelu została utworzona.

select MINING_PARAMETERS 
from $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'TM_Decision Tree'

Przykładowe wyniki:

MINING_PARAMETERS

COMPLEXITY_PENALTY = 0,5 MAXIMUM_INPUT_ATTRIBUTES = 255, MAXIMUM_OUTPUT_ATTRIBUTES = 255, MINIMUM_SUPPORT = 10, SCORE_METHOD = 4 SPLIT_METHOD = 3, FORCE_REGRESSOR =

Powrót do początku

Przykładowa kwerenda 2: Zwracanie szczegółowe informacje o modelu zawartości przy użyciu DMX

Następująca kwerenda zwraca niektóre podstawowe informacje dotyczące algorytmów, które zostały utworzone podczas tworzenia modelu Samouczek wyszukiwania danych podstawowych.Każdej struktury drzewa jest przechowywana w własny węzła.Ponieważ ten model zawiera pojedynczy atrybut przewidywalny, istnieje tylko jeden węzeł drzewa.Jednak jeśli przy użyciu algorytmu algorytmów tworzenia modelu skojarzeń, może występować setki drzew, jeden dla każdego produktu.

Ta kwerenda zwraca wszystkie węzły typu 2, które węzły najwyższego poziom drzewa reprezentujący określonego atrybut przewidywalne.

Ostrzeżenie

kolumna, CHILDREN_CARDINALITY, musi być ujęty w nawiasy, aby odróżnić go od słowo kluczowe MDX zarezerwowane tej samej nazwy.

SELECT MODEL_NAME, NODE_NAME, NODE_CAPTION, 
NODE_SUPPORT, [CHILDREN_CARDINALITY]
FROM TM_DecisionTrees.CONTENT
WHERE NODE_TYPE = 2

Przykład wyniki:

NAZWA_MODELU	NAZWA_WĘZŁA	NODE_CAPTION	NODE_SUPPORT	CHILDREN_CARDINALITY
TM_DecisionTree	000000001	Wszystko	12939	5

Co wyniki te informacje?W modelu drzewa decyzji Kardynalność określonego węzła informuje ile bezpośrednie elementy podrzędne węzła ma.Kardynalność dla tego węzła jest 5, co oznacza, że model podzielony zapełnianie miejsce docelowe potencjalnych nabywców bike 5 podgrup.

Następujące pokrewne kwerenda zwraca podrzędność dla tych pięciu podgrupy, wraz z dystrybucji atrybuty i wartości w węzłach podrzędność.Ponieważ statystyki, takie jak obsługa, prawdopodobieństwa oraz odchylenie są przechowywane w tabela zagnieżdżonej NODE_DISTRIBUTION, w tym przykładzie użyto FLATTENED słowa kluczowego do wyprowadzenia kolumny tabela zagnieżdżonej.

Ostrzeżenie

kolumna tabela zagnieżdżonej SUPPORT, musi być ujęty w nawiasy, aby odróżnić go od zarezerwowane słowo kluczowe tej samej nazwy.

SELECT FLATTENED NODE_NAME, NODE_CAPTION,
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, [SUPPORT]
FROM NODE_DISTRIBUTION) AS t
FROM TM_DecisionTree.CONTENT
WHERE [PARENT_UNIQUE_NAME] = '000000001'

Przykład wyniki:

NAZWA_WĘZŁA	NODE_CAPTION	T.ATTRIBUTE_NAME	T.ATTRIBUTE_VALUE	OBSŁUGA
00000000100	Liczba samochodów własnością = 0	Kupujący Bike	Brak	0
00000000100	Liczba samochodów własnością = 0	Kupujący Bike	0	1067
00000000100	Liczba samochodów własnością = 0	Kupujący Bike	1	1875
00000000101	Liczba samochodów własnością = 3	Kupujący Bike	Brak	0
00000000101	Liczba samochodów własnością = 3	Kupujący Bike	0	678
00000000101	Liczba samochodów własnością = 3	Kupujący Bike	1	473

Z tych wyniki można stwierdzić, klientów, którzy zakupione bike ([Bike Buyer] = 1), klienci 1067 miał 0 samochodów i 473 klientów była 3 samochodów.

Powrót do początku

Przykładowa kwerenda 3: Pobieranie poddrzew z modelu

Załóżmy, że odnajdowanie więcej o klientów, którzy kupić rower.Dodatkowe szczegóły kontaktach można przeglądać za pomocą IsDescendant (DMX) funkcja w kwerendzie, jak pokazano w następującym przykładzie.Kwerenda zwraca liczbę nabywców bike pobierając liść węzły (NODE_TYPE = 4) z drzewa zawierający klientów, którzy są ponad 42 roku życia.Kwerenda ogranicza wierszy z tabela zagnieżdżonej do tych, z których kupujący Bike = 1.

SELECT FLATTENED NODE_NAME, NODE_CAPTION,NODE_TYPE,
(
SELECT [SUPPORT] FROM NODE_DISTRIBUTION WHERE ATTRIBUTE_NAME = 'Bike Buyer' AND ATTRIBUTE_VALUE = '1'
) AS t
FROM TM_DecisionTree.CONTENT
WHERE ISDESCENDANT('0000000010001')
AND NODE_TYPE = 4

Przykład wyniki:

NAZWA_WĘZŁA	NODE_CAPTION	t.support
000000001000100	Roczny dochód >= 26000 i < 42000	266
00000000100010100	Suma dzieci = 3	75
0000000010001010100	Liczba dzieci w Główny = 1	75

Powrót do początku

Dokonywania przewidywań przy użyciu modelu drzewa decyzji

Ponieważ drzewo decyzyjne mogą być używane do różnych zadań, w tym klasyfikacji, regresja i skojarzenia nawet podczas tworzenia kwerendy przewidywanie na modelu drzewo decyzyjne ma wiele dostępnych opcji.Cel, dla którego został utworzony model zrozumieć wyniki przewidywanie należy zrozumieć.Następujące próbki kwerend ilustrują trzy różne scenariusze:

Zwracanie przewidywanie modelu klasyfikacji, wraz z prawdopodobieństwem przewidywanie są poprawne, a następnie filtrowanie wyniki według prawdopodobieństwa;
Tworzenie kwerendy singleton przewidywanie stowarzyszeń;
Pobieranie formuły regresja dla części drzewo decyzyjne, gdzie jest liniowy relacji między dane wejściowe i wyjściowe.

Przykładowa kwerenda 4: Zwracanie prognoz z prawdopodobieństwa

W następującej kwerendzie przykładowej wykorzystuje model drzewo decyzyjne, który został utworzony w Samouczek wyszukiwania danych podstawowych.Kwerenda przechodzi w nowy zestaw przykładowych danych z tabela dbo.ProspectiveBuyers w AdventureWorks2008R2 DW do przewidywania, której klienci w nowy zestaw danych zakupu rowerów.

Funkcja przewidywanie kwerendy PredictHistogram (DMX), która zwraca zagnieżdżona tabela zawiera przydatne informacje dotyczące prawdopodobieństwa wykrycia przez model.Końcowe klauzula WHERE kwerendy filtrów wyniki do zwrócenia tylko klienci, którzy są przewidywane jako prawdopodobne kupić rower, z prawdopodobieństwem większa niż 0%.

SELECT
  [TM_DecisionTree].[Bike Buyer],
  PredictHistogram([Bike Buyer]) as Results
From
  [TM_DecisionTree]
PREDICTION JOIN
  OPENQUERY([Adventure Works DW],
    'SELECT
      [FirstName],
      [LastName],
      [MaritalStatus],
      [Gender],
      [YearlyIncome],
      [TotalChildren],
      [NumberChildrenAtHome],
      [HouseOwnerFlag],
      [NumberCarsOwned]
    FROM
      [dbo].[ProspectiveBuyer]
    ') AS t
ON
  [TM_DecisionTree].[First Name] = t.[FirstName] AND
  [TM_DecisionTree].[Last Name] = t.[LastName] AND
  [TM_DecisionTree].[Marital Status] = t.[MaritalStatus] AND
  [TM_DecisionTree].[Gender] = t.[Gender] AND
  [TM_DecisionTree].[Yearly Income] = t.[YearlyIncome] AND
  [TM_DecisionTree].[Total Children] = t.[TotalChildren] AND
  [TM_DecisionTree].[Number Children At Home] = t.[NumberChildrenAtHome] AND
  [TM_DecisionTree].[House Owner Flag] = t.[HouseOwnerFlag] AND
  [TM_DecisionTree].[Number Cars Owned] = t.[NumberCarsOwned]
WHERE [Bike Buyer] = 1
AND PredictProbability([Bike Buyer]) >'.05'

Domyślnie Usługi Analysis Services zwraca zagnieżdżone tabele z etykietą kolumna wyrażenie.Etykieta można zmienić przez wygładzanie kolumna, która jest zwracana.Jeśli to zrobisz, alias (w tym przypadek wyniki) jest używana jako nagłówek kolumna, a wartość w tabela zagnieżdżonej.Aby wyświetlić wyniki w tabela zagnieżdżonej należy rozwinąć.

Przykład wyniki:

Kupujący Bike	Wyniki
1	Wyniki Kupujący BikeOBSŁUGA $PRAWDOPODOBIEŃSTWO $$ADJUSTEDPROBABILITYODCHYLENIE $FUNKCJA ODCH.STANDARDOWE $ 125400.6348492420456440.01356216828156200 014600.3649841745793770.0066133693255091500 00.0001665833749791770.00016658337497917700

Jeśli dostawca nie obsługuje hierarchicznych zestawów wierszy, takie jak pokazano tutaj, można użyć słowa kluczowego FLATTENED w kwerendzie do zwracania wyniki jako tabela, która zawiera wartości null, zamiast wartości kolumna powtarzających się.Aby uzyskać więcej informacji, zobacz Zagnieżdżone tabele (Analysis Services - wyszukiwania danych) lub Opis instrukcji Select (DMX).

Powrót do początku

Przykładowa kwerenda 5: Przewidywaniu skojarzenia z modelu drzewa decyzji

W następującej kwerendzie przykładowej opiera się na Association struktura wyszukiwania.Aby wykonać wraz z tym przykładzie, można dodać nowy model tej struktura wyszukiwaniai wybierz opcję Microsoft algorytmów jako algorytmu.Aby uzyskać więcej informacji na temat tworzenia Association struktura wyszukiwania, zobacz Lekcja 3: Tworzenie scenariusza koszyka rynku (samouczek wyszukiwania danych pośrednich).

W następującej kwerendzie przykładowej jest kwerendą singleton, które można tworzyć w łatwo Business Intelligence Development Studio Wybieranie pól, a następnie wybierając wartości tych pól z drop -niedziałający listy.

SELECT PredictAssociation([DT_Association].[v Assoc Seq Line Items],3)
FROM
  [DT_Association]
NATURAL PREDICTION JOIN
(SELECT (SELECT 'Patch kit' AS [Model]) AS [v Assoc Seq Line Items]) AS t

Oczekiwane wyniki:

Model
Rower górski 200
Mountain Tire Tube
Opona probówki do roweru turystycznego

Wyniki powiedz trzech najlepszych produktów zaleca klientom, którzy zakupili poprawka zestawu produktów.Możesz także podać wiele produktów jako dane wejściowe podczas formułować zalecenia, wpisując wartości lub za pomocą Singleton kwerendy wprowadzania okno dialogowe Dodawanie lub usuwanie wartości.W następującej kwerendzie przykładowej pokazuje, jak wiele wartości są dostarczane, po którym z przewidywanie.Wartości są połączone przez związek klauzula w instrukcja SELECT, która definiuje wartości wejściowych.

SELECT PredictAssociation([DT_Association].[v Assoc Seq Line Items],3)
From
  [DT_Association]
NATURAL PREDICTION JOIN
(SELECT (SELECT 'Racing Socks' AS [Model]
  UNION SELECT 'Women''s Mountain Shorts' AS [Model]) AS [v Assoc Seq Line Items]) AS t

Oczekiwane wyniki:

Model
Długie rękawy Logo Jersey
Mountain-400-W
Kamizelka klasyczne

Powrót do początku

Przykładowa kwerenda 6: Pobieranie formuły regresji z modelu drzewa decyzji

Podczas tworzenia modelu drzewo decyzyjne, który zawiera regresja ciągłego atrybut można użyć formuły regresja dokonać prognoz lub można wyodrębnić informacje o formuły regresja.Aby uzyskać więcej informacji o kwerendach modele regresja, zobacz Badanie modelu regresji liniowej (Analysis Services - wyszukiwania danych).

Jeśli model drzewa decyzji zawiera mieszaniny regresja węzłów i węzłów, dzielących discrete atrybutów lub zakresy, można utworzyć kwerendę zwracającą tylko węzeł regresja.Tabela NODE_DISTRIBUTION zawiera szczegóły formuły regresja.W tym przykładzie są spłaszczane kolumn i tabela NODE_DISTRIBUTION jest aliasu dla ich łatwiejszego oglądania.Jednak w tym modelu regressors nie stwierdzono odnoszą się Income z innymi atrybutami ciągłe.W takich przypadkach Usługi Analysis Services zwraca średnią wartość atrybut i odchylenia razem w modelu dla tego atrybut.

SELECT FLATTENED NODE_DISTRIBUTION AS t
FROM DT_Predict. CONTENT
WHERE NODE_TYPE = 25

Przykład wyniki:

t.ATTRIBUTE_NAME	t.ATTRIBUTE_VALUE	t.support	t.PROBABILITY	t.VARIANCE	t.VALUETYPE
Roczny dochód	Brak	0	0.000457142857142857	0	1
Roczny dochód	57220.8876687257	17484	0.999542857142857	1041275619.52776	3
	57220.8876687257	0	0	1041216662.54387	11

Aby uzyskać więcej informacji dotyczących typów wartości i statystyki, używane w modelach regresja, zobacz Górnictwo zawartości modelu regresji liniowej modeli (Analysis Services - wyszukiwania danych).

Powrót do początku

Lista funkcje prognozowania

Wszystkie Microsoft obsługę algorytmów wspólny zestaw funkcji.Jednakże Microsoft algorytm drzewa decyzji obsługuje dodatkowe funkcje wymienione w poniższej tabela.

IsDescendant (DMX)	PredictNodeId (DMX)
IsInNode (DMX)	PredictProbability (DMX)
PredictAdjustedProbability (DMX)	PredictStdev (DMX)
PredictAssociation (DMX)	PredictSupport (DMX)
PredictHistogram (DMX)	PredictVariance (DMX)