Podczas badania modelu drzewa decyzji (Analysis Services — wyszukiwanie danych)

Podczas tworzenia kwerendy przed model wyszukiwanie danych, można utworzyć kwerendę zawartości, która zawiera szczegółowe informacje dotyczące wzorców wykryte w analizie, lub można utworzyć kwerendę przewidywanie, która używa desenie w modelu, aby prognoz dla nowych danych.Na przykład kwerendy zawartości dla modelu drzewa decyzji może zapewniać statystyki dotyczące liczby przypadków na każdym poziomie drzewa lub reguł, które rozróżniania przypadkach.Można również kwerendy przewidywanie mapuje modelu do nowych danych w celu generowania zalecenia, klasyfikacje i tak dalej.Można również pobierać metadane dotyczące modelu przy użyciu kwerendy.

W tej sekcji wyjaśniono, jak tworzyć kwerendy dla modeli, które są oparte na Microsoft Algorytm drzewa decyzji.

  • Kwerendy zawartości

    Trwa pobieranie parametrów modelu z zestaw zestaw wierszy schematu wyszukiwanie danych

    Zwracanie szczegóły dotyczące drzewa w modelu przy użyciu DMX

    Zwracanie węzłów Regresja z modelu drzewo decyzyjne

  • Kwerendy przewidywanie

    Zwracanie prognoz i prawdopodobieństw

    Przewidywana skojarzenia z drzewo decyzyjne

Znajdowanie informacje o modelu drzewa decyzji

Aby utworzyć kwerendę znaczące na zawartość modelu drzewa decyzji, należy zapoznać się struktury modelu zawartości i typy węzłów, które są przechowywane jaki rodzaj informacji.Aby uzyskać więcej informacji zobaczmodel wyszukiwania Zawartości dla modeli drzewo decyzyjne (Analysis Services — wyszukiwanie danych).

Powrót do początku

Przykładowa kwerenda 1: Trwa pobieranie parametrów modelu z zestaw zestaw wierszy schematu wyszukiwanie danych

Za pomocą kwerend wysyłanych do zestaw zestaw wierszy schematu wyszukiwanie danych, można znaleźć metadane dotyczące modelu, takie jak jego utworzenia, podczas ostatniego przetworzenia modelu, nazwa struktura wyszukiwania na podstawie modelu i nazwę kolumna, używane jako atrybut przewidywalne.Można także wrócić parametrów, które były używane, gdy najpierw została utworzona w modelu.

select MINING_PARAMETERS 
from $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'TM_Decision Tree'

Przykładowe wyniki:

MINING_PARAMETERS

COMPLEXITY_PENALTY = 0,5 MAXIMUM_INPUT_ATTRIBUTES = 255 MAXIMUM_OUTPUT_ATTRIBUTES = 255 MINIMUM_SUPPORT = 10 SCORE_METHOD = 4 SPLIT_METHOD = 3 FORCE_REGRESSOR =

Powrót do początku

Przykładowa kwerenda 2: Zwracanie szczegóły dotyczące drzewa w modelu przy użyciu DMX

Następująca kwerenda zwraca niektóre podstawowe informacje o modelu drzewo decyzyjne, utworzone w Podstawowe wyszukiwanie danych — samouczek. Ta kwerenda zwraca wszystkie węzły typu 2, czyli węzłów najwyższego poziom w drzewie, która reprezentuje określonego atrybut przewidywalne.Ponieważ ten model zawiera pojedynczy atrybut przewidywalny, istnieje tylko jeden węzeł drzewa.Niemniej jednak jeśli tworzysz model skojarzenia za pomocą algorytmu algorytmów, mogą występować setki drzewa, jeden dla każdego produktu.

Uwaga

kolumna CHILDREN_CARDINALITY, muszą być ujęte w nawiasy, aby odróżnić go od słowo kluczowe MDX zarezerwowane o takiej samej nazwie.

SELECT MODEL_NAME, NODE_NAME, NODE_CAPTION, 
NODE_SUPPORT, [CHILDREN_CARDINALITY]
FROM TM_DecisionTrees.CONTENT
WHERE NODE_TYPE = 2

Przykład wyniki:

NAZWA_MODELU

NAZWA_WĘZŁA

NODE_CAPTION

NODE_SUPPORT

CHILDREN_CARDINALITY

TM_DecisionTree

000000001

All

12939

5

W modelu drzewa decyzji, relacja określonym węźle informuje ile bezpośrednie elementy podrzędne, ma w tym węźle.Dlatego Kardynalność dla węzła, zwracanych przez kwerendę poprzedniego informuje czy model podzielony zapełnianie miejsce docelowe potencjalnych nabywców roweru podgrup 5.W następującej kwerendzie powiązane zwraca elementy podrzędność dla tych pięciu podgrupy, łącznie z rozkładem atrybutów i wartości w węzłach podrzędność.Ponieważ statystyki, takie jak obsługa, prawdopodobieństwo i odchylenia są przechowywane w tabela zagnieżdżonej NODE_DISTRIBUTION, w tym przykładzie użyto FLATTENED słowo kluczowe do wyprowadzenia kolumny tabela zagnieżdżonej.

Uwaga

kolumna tabela zagnieżdżonej SUPPORT, muszą być ujęte w nawiasy, aby odróżnić go od zarezerwowanym słowem kluczowym o takiej samej nazwie.

SELECT FLATTENED NODE_NAME, NODE_CAPTION,
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, [SUPPORT]
FROM NODE_DISTRIBUTION) AS t
FROM TM_DecisionTree.CONTENT
WHERE [PARENT_UNIQUE_NAME] = '000000001'

Przykład wyniki:

NAZWA_WĘZŁA

NODE_CAPTION

T.ATTRIBUTE_NAME

T.ATTRIBUTE_VALUE

POMOC TECHNICZNA

00000000100

Liczba samochodów posiadane = 0

Rower kupujących

Brak

0

00000000100

Liczba samochodów posiadane = 0

Rower kupujących

0

1067

00000000100

Liczba samochodów posiadane = 0

Rower kupujących

1

1875

00000000101

Liczba samochodów posiadane = 3

Rower kupujących

Brak

0

00000000101

Liczba samochodów posiadane = 3

Rower kupujących

0

678

00000000101

Liczba samochodów posiadane = 3

Rower kupujących

1

473

Z tych wyniki, można stwierdzić, że klienci, którzy zakupione (rower[Bike Buyer] = 1), klienci 1067 miał 0 samochodów i 473 klientów były samochodów 3.

Załóżmy, że chce wykryć więcej o klientach, którzy kupują rowerów.Umożliwia wyświetlanie dodatkowych szczegółów dla każdego z sub-trees przy użyciu IsDescendant (DMX) Funkcja w kwerendzie, jak pokazano w poniższym przykładzie. Zwraca liczbę nabywców rowerów, pobierając węzłów liściowych (NODE_TYPE = 4) z drzewa, który zawiera klientów, którzy są ponad 42 roku życia.Kwerendy ogranicza wiersze z tabela zagnieżdżonej do tych gdzie kupujących Bike = 1.

SELECT FLATTENED NODE_NAME, NODE_CAPTION,NODE_TYPE,
(
SELECT [SUPPORT] FROM NODE_DISTRIBUTION WHERE ATTRIBUTE_NAME = 'Bike Buyer' AND ATTRIBUTE_VALUE = '1'
) AS t
FROM TM_DecisionTree.CONTENT
WHERE ISDESCENDANT('0000000010001')
AND NODE_TYPE = 4

Przykład wyniki:

NAZWA_WĘZŁA

NODE_CAPTION

t.SUPPORT

000000001000100

Dochód roczny >= 26000 i < 42000

266

00000000100010100

Całkowita liczba dzieci = 3

75

0000000010001010100

Liczba dzieci na Główny = 1

75

Powrót do początku

Przykładowa kwerenda 3: Zwracanie węzłów Regresja z model drzewo decyzyjne

Podczas tworzenia modelu drzewo decyzyjne, który zawiera regresja w atrybucie ciągłego tworzenie prognoz za pomocą formuły regresja, lub można wyodrębnić informacji o formule regresja.Aby uzyskać więcej informacji na temat kwerendy w modelach regresja zobacz Podczas badania modelu regresja liniowej (Analysis Services — wyszukiwanie danych).

Jeśli model zawiera węzły regresja i węzłów, które są podzielone na discrete atrybuty lub zakresy, można utworzyć kwerendę zwracającą tylko węzeł regresja.Tabela NODE_DISTRIBUTION zawiera szczegółowe informacje o formule regresja.W tym przykładzie są spłaszczane kolumn i tabela NODE_DISTRIBUTION jest aliasu dla ich łatwiejszego oglądania.Jednak w tym modelu nie regressors znaleziono powiązanie Przychód z innych atrybutów stałego.W takich przypadkach Analysis Services Zwraca średnią wartość atrybut i Wariancja całkowita model dla tego atrybut.

SELECT FLATTENED NODE_DISTRIBUTION AS t
FROM DT_Predict. CONTENT
WHERE NODE_TYPE = 25

Przykład wyniki:

t.ATTRIBUTE_NAME

t.ATTRIBUTE_VALUE

t.SUPPORT

t.PROBABILITY

t.VARIANCE

t.VALUETYPE

Dochód roczny

Brak

0

0.000457142857142857

0

1

Dochód roczny

57220.8876687257

17484

0.999542857142857

1041275619.52776

3

  

57220.8876687257

0

0

1041216662.54387

11

Aby uzyskać więcej informacji na temat typów wartości i statystyk, używane w modelach regresja zobacz model wyszukiwania Zawartości dla modeli regresji liniowej (Analysis Services — wyszukiwanie danych).

Powrót do początku

Tworzenie przy użyciu modelu prognoz

Ponieważ drzewo decyzyjne, mogą być używane do różnych zadań, takich jak klasyfikacji, regresja, a nawet skojarzenia, podczas tworzenia kwerendy przewidywanie na modelu drzewo decyzyjne ma wiele dostępnych opcji.Należy zrozumieć cel, dla którego został utworzony modelu zrozumieć wyniki z przewidywanie.Następujące przykłady kwerendy przedstawiono trzy różne scenariusze:

  • Zwracanie przewidywanie dla modelu klasyfikacji, wraz z prawdopodobieństwem przewidywanie są poprawne, a następnie filtrowanie wyniki według prawdopodobieństwa;

  • Tworzenie kwerendy pojedynczych do przewidywania skojarzenia;

  • Pobieranie formuły regresja dla części drzewo decyzyjne, gdzie jest liniowy relację między dane wejściowe i wyjściowe.

Powrót do początku

Przykładowa kwerenda 4: Zwracanie prognoz i prawdopodobieństw

W następującej kwerendzie przykładowej korzysta z modelu drzewo decyzyjne, który został utworzony w Podstawowe wyszukiwanie danych — samouczek i przechodzi przykładowe dane tabela w AdventureWorks DW, dbo.ProspectiveBuyers do modelu do przewidywania, której klienci na liście zakupu rowerów. Kwerenda zawiera funkcja prognozowania PredictHistogram (DMX), która zwraca zagnieżdżonej tabela, która zawiera użyteczne informacje na temat prawdopodobieństw, odnalezione przez model. Prognoz są filtrowane, dodając klauzulę WHERE, aby zwrócić tylko tych, którzy są przewidziane jako nabywców roweru może z prawdopodobieństwem większej niż 50 %.

SELECT
  [TM_DecisionTree].[Bike Buyer],
  PredictHistogram([Bike Buyer]) as Results
FROM
  [TM_DecisionTree]
PREDICTION JOIN
  OPENQUERY([Adventure Works DW],
    'SELECT
      [FirstName],
      [LastName],
      [MaritalStatus],
      [Gender],
      [YearlyIncome],
      [TotalChildren],
      [NumberChildrenAtHome],
      [HouseOwnerFlag],
      [NumberCarsOwned]
    FROM
      [dbo].[ProspectiveBuyer]
    ') AS t
ON
  [TM_DecisionTree].[First Name] = t.[FirstName] AND
  [TM_DecisionTree].[Last Name] = t.[LastName] AND
  [TM_DecisionTree].[Marital Status] = t.[MaritalStatus] AND
  [TM_DecisionTree].[Gender] = t.[Gender] AND
  [TM_DecisionTree].[Yearly Income] = t.[YearlyIncome] AND
  [TM_DecisionTree].[Total Children] = t.[TotalChildren] AND
  [TM_DecisionTree].[Number Children At Home] = t.[NumberChildrenAtHome] AND
  [TM_DecisionTree].[House Owner Flag] = t.[HouseOwnerFlag] AND
  [TM_DecisionTree].[Number Cars Owned] = t.[NumberCarsOwned]
WHERE [Bike Buyer] = 1
AND PredictProbability([Bike Buyer]) >'.05'

Domyślnie Analysis Services Zwraca zagnieżdżone tabele z etykietą kolumna wyrażenie. Wygładzanie kolumna, która jest zwracana można zmienić tej etykiety.Jeśli to zrobisz, alias (w tym przypadek Wyniki) jest używana jako nagłówek kolumna, a wartości w tabela zagnieżdżonej.Należy rozwinąć, aby wyświetlić wyniki w tabela zagnieżdżonej.

Przykład wyniki:

Rower kupujących

Wyniki

1

Wyniki

Rower kupującychOBSŁUGA $PRAWDOPODOBIEŃSTWO $$ ADJUSTEDPROBABILITYODCHYLENIE $$ ODCH.STANDARDOWE
125400.6348492420456440.01356216828156200
014600.3649841745793770.0066133693255091500
00.0001665833749791770.00016658337497917700

Jeśli dostawca nie obsługuje hierarchicznych zestawów wierszy, takie jak przedstawione tutaj wyniki, umożliwia FLATTENED słowo kluczowe w kwerendzie zwraca wyników jako tabela, która zawiera wartości null w miejscach występowania wartości kolumna powtarzających się.Aby uzyskać więcej informacji zobacz Zagnieżdżone tabele (Analysis Services — wyszukiwanie danych) lub Opis instrukcja SELECT (DMX).

Powrót do początku

Przykładowa kwerenda 5: Przewidywana skojarzenia z algorytm

Przy użyciu następującej kwerendy, utworzyć kopię modelu skojarzeń samouczka i zmieniać algorytmu w algorytmie algorytmów.Aby uzyskać więcej informacji zobaczLekcja 3: Tworzenie scenariusza koszyk rynku (samouczek wyszukiwanie danych pośrednich).

W następującej kwerendzie przykładowej jest pojedyncza kwerendy, które można łatwo tworzyć w Business Intelligence Development Studio Wybieranie pól, a następnie wybierając wartości dla tych pól z listy rozwijanej.

SELECT PredictAssociation([DT_Association].[v Assoc Seq Line Items],3)
FROM
  [DT_Association]
NATURAL PREDICTION JOIN
(SELECT (SELECT 'Patch kit' AS [Model]) AS [v Assoc Seq Line Items]) AS t

Oczekiwane wyniki:

Model

Rower górski 200

Mountain Tire Tube

Tube opona do roweru turystycznego

Wyniki powiedz trzech najlepszych produktów zaleca klientom, którzy zakupili poprawki zestawu produktów.Można również dołączyć wiele produktów jako danych wejściowych po wprowadzeniu zalecenia, wpisując wartości lub przy użyciu Pojedyncza Query wprowadzania , okno dialogowe i dodawanie lub usuwanie wartości.W następującej kwerendzie przykładowej pokazuje, jak wiele wartości są dostarczane, na którym należy przewidywanie.Wartości są połączone przy użyciu klauzula UNION w instrukcja SELECT, która definiuje wartości wejściowych.

SELECT PredictAssociation([DT_Association].[v Assoc Seq Line Items],3)
From
  [DT_Association]
NATURAL PREDICTION JOIN
(SELECT (SELECT 'Racing Socks' AS [Model]
  UNION SELECT 'Women''s Mountain Shorts' AS [Model]) AS [v Assoc Seq Line Items]) AS t

Oczekiwane wyniki:

Model

Tuleja długo Logo Jersey

Mountain-400-W

Klasyczny Vest

Powrót do początku

Lista przewidywanie funkcje

Wszystkie Microsoft algorytmy obsługują wspólny zestaw funkcji. Jednak Microsoft Algorytm drzewa decyzji obsługuje dodatkowe funkcje wymienione w poniższej tabela.

Aby uzyskać listę funkcji, które są wspólne dla wszystkich Microsoft algorytmy, zobacz Mapowanie funkcji do kwerendy typy (DMX). Aby zapoznać się ze składnią określonych funkcji zobacz Odwołanie do funkcja wyszukiwanie danych rozszerzeń (DMX).

Historia zmian

Microsoft Learning

Dodano łącza w temacie Aby ułatwić przeglądanie próbek kwerendy.

Przykładowe węzła regresja przeniesione do odpowiedniej sekcji na kwerendy zawartości.