Górnictwo modelu zawartości (Analysis Services - wyszukiwania danych)

Po zaprojektowane i przetwarzane modelu górnictwa, używając danych z podstawowych struktura wyszukiwania, model górnictwo jest pełny i zawiera górnictwa modelu zawartości.Przewidywania lub analizowania danych, można użyć tej zawartości.

Górnictwo modelu zawartości zawiera metadane dotyczące modelu, statystyki dotyczące danych i wykrytych przez algorytm wyszukiwania wzorców.W zależności od algorytmu, który został użyty zawartość modelu może zawierać formuły regresja, definicje reguł i itemsets lub wag i innych informacji statystycznych.

Niezależnie od algorytmu, który został użyty model wyszukiwania zawartości jest przedstawiany w standardowej strukturze.Można przeglądać strukturę w ogólnej zawartości drzewa Podgląd firmy Microsoft, w Business Intelligence Development Studio, a następnie przełącz się do jednego z niestandardowych odbiorcom Zobacz, jak informacje są interpretowane i wyświetlane graficznie, dla każdego typu modelu. Można również utworzyć kwerendy przeciwko model wyszukiwania zawartości za pomocą dowolnego klient, który obsługuje zestaw wierszy schematu MINING_MODEL_CONTENT.Aby uzyskać więcej informacji, zobacz Badanie modeli wyszukiwania danych: Tematy dotyczące wykonywania określonych zadań (Analysis Services - wyszukiwania danych).

W tej sekcji opisano podstawową strukturę zawartość dla wszystkich rodzajów modeli wyszukiwania.Opisuje typy węzłów, które są wspólne dla wszystkich model wyszukiwania zawartości i zawiera wskazówki dotyczące interpretacji informacji.

Struktura modelu wydobycia, zawartość

Węzły

Wyszukiwania zawartości typu algorytmu modelu

Narzędzia do przeglądania zawartości modelu górnictwo

Narzędzia do badania zawartości modelu górnictwo

Struktura modelu wydobycia, zawartość

Zawartość każdego modelu jest przedstawiany jako seria węzłów.Węzeł jest obiekt model wyszukiwania zawiera metadane i informacje o części modelu.Węzły są ułożone w hierarchii.Dokładne rozmieszczenie węzłów w hierarchii i znaczenie hierarchii, zależy od użytego algorytmu.Na przykład jeśli tworzysz model drzewa decyzji modelu może zawierać wiele drzew, wszystkie podłączone do głównego modelu; Utwórz model sieci neuronowe, modelu mogą zawierać jeden lub więcej sieci plus węzeł Statystyka.

Pierwszy węzeł w każdym modelu jest nazywany węzła głównego, lub modelu nadrzędnego węzła.Każdy model ma węzła głównego (NODE_TYPE = 1).Węzeł główny zazwyczaj zawiera niektóre metadane dotyczące modelu, a liczba węzłów podrzędność, ale niewiele dodatkowe informacje dotyczące wzorców wykryte przez model.

W zależności od tego, który algorytm używany do tworzenia modelu węzła głównego ma różną liczbę węzłów podrzędność.Węzły podrzędne mają różne znaczenie i innej zawartości, w zależności od algorytmu i głębokość i stopnia złożoności danych.

Powrót do początku

Węzły

W model wyszukiwania, węzeł jest ogólnego kontener, który przechowuje informacje o wszystkich lub części modelu.Struktura każdego węzła jest zawsze taka sama i zawiera kolumny zdefiniowane przez wyszukiwania danych zestaw zestaw wierszy schematu.Aby uzyskać więcej informacji, zobacz DMSCHEMA_MINING_MODEL_CONTENT wierszy.

Każdy węzeł zawiera metadane dotyczące węźle, w tym identyfikator, który jest unikatowy w obrębie każdego modelu identyfikator węzła nadrzędnego, a liczba węzłów podrzędność, które ma węzła.Metadane identyfikuje modelu, do której należy dany węzeł i przechowywania tego konkretnego modelu wykaz bazy danych.Dodatkową zawartość w węźle różni się w zależności od typu algorytm używany do tworzenia modelu i mogą być następujące:

  • Liczba przypadków w dane szkolenia obsługuje określonego prognozowanej wartości.

  • Statystyki, takie jak średnia, odchylenie standardowe lub WARIANCJA.

  • Współczynniki i formuły.

  • Definicja reguły i boczne wskaźniki.

  • Fragmenty XML opisujących części modelu.

Lista typów węzłów

Poniższa tabela zawiera listę różnych typów węzłów, które są dostępne w przypadku modeli wyszukiwanie danych.Ponieważ każdy algorytm przetwarza informacje inaczej, każdy model generuje tylko kilka określonych typów węzłów.Jeśli zmienisz algorytm może zmienić typ węzłów.Ponadto jeśli użytkownik ponownie przetwórz model, może zmienić zawartość każdego węzła.

Ostrzeżenie

Jeśli jest używana usługa wyszukiwanie danych innego niż te przewidziane w usługach Analysis Services programu SQL Server 2008 lub utworzyć własny dodatek algorytmy, mogą być dostępne typy dodatkowego węzła niestandardowe.

IDENTYFIKATOR NODE_TYPE

Etykieta węzła

Zawartość węzła

1

Model

Metadane i główny węzeł zawartości.Dotyczy to wszystkich typów modelu.

2

Drzewa

Węzeł główny drzewa klasyfikacji.Stosuje się do modeli drzewo decyzyjne.

3

Wnętrze

Wnętrze podzielić węzeł w drzewie.Stosuje się do modeli drzewo decyzyjne.

4

Rozkład

Terminal węzła drzewa.Stosuje się do modeli drzewo decyzyjne.

5

Klaster

Klastrów wykrytych przez algorytm.Dotyczy klastrowanie modeli i klastrowanie modeli sekwencji.

6

Nieznany

Typ nieznany węzeł.

7

ItemSet

Itemset wykrytych przez algorytm.Dotyczy skojarzenia modeli lub sekwencji klastrowanie modeli.

8

AssociationRule

Stowarzyszenie reguła wykryty przez algorytm.Dotyczy skojarzenia modeli lub sekwencji klastrowanie modeli.

9

PredictableAttribute

Atrybut przewidywalne.Dotyczy to wszystkich typów modelu.

10

InputAttribute

Atrybut danych wejściowych.Stosuje się do drzewa decyzji i modele Naïve Bayes.

11

InputAttributeState

Statystyka Państwa atrybut wejściowy.Stosuje się do drzewa decyzji i modele Naïve Bayes.

13

Sekwencja

Węzeł najwyższego poziomu dla składnika modelu Markov klastra sekwencji.Dotyczy sekwencji klastrowanie modeli.

14

Przejścia

Macierz transformacji Markov.Dotyczy sekwencji klastrowanie modeli.

15

Szereg czasowy

Węzeł główny non czas serii drzewa.Stosuje się do czas serii tylko modele.

16

TsTree

Węzeł główny drzewa serii czas odpowiadający szeregu czasowego przewidywalne.Stosuje się do czas modele serii i tylko wtedy, gdy model został utworzony przy użyciu parametru MIESZANYCH.

17

NNetSubnetwork

Jeden sub-network.Stosuje się do sieci neuronowe modeli.

18

NNetInputLayer

Grupa zawiera węzły wprowadzania warstwy.Stosuje się do sieci neuronowe modeli.

19

NNetHiddenLayer

Grupy, które zawiera węzły, które opisują warstwy ukryte.Stosuje się do sieci neuronowe modeli.

21

NNetOutputLayer

Grupy, które zawiera węzły wyjściowe warstwy.Stosuje się do sieci neuronowe modeli.

21

NNetInputNode

Węzeł w wejściowy warstwy, która pasuje do wprowadzania atrybut z odpowiednimi państwami.Stosuje się do sieci neuronowe modeli.

22

NNetHiddenNode

Węzeł w ukrytej warstwie.Stosuje się do sieci neuronowe modeli.

23

NNetOutputNode

Węzeł w warstwie danych wyjściowych.Ten węzeł zwykle będzie pasował do atrybut wyjścia i odpowiednich państw.Stosuje się do sieci neuronowe modeli.

24

NNetMarginalNode

Marginalna statystykę zestaw szkoleniowy.Stosuje się do sieci neuronowe modeli.

25

RegressionTreeRoot

Katalog główny drzewa regresja.Dotyczy regresja liniowej modeli i modele drzewa decyzji, które zawiera atrybuty ciągłego wprowadzania.

26

NaiveBayesMarginalStatNode

Marginalna statystykę zestaw szkoleniowy.Stosuje się do modeli Naïve Bayes.

27

ArimaRoot

Węzeł główny modelu ARIMA.Stosuje się tylko do tych czas modeli serii algorytm ARIMA.

28

ArimaPeriodicStructure

Struktura okresowych w modelu ARIMA.Stosuje się tylko do tych czas modeli serii algorytm ARIMA.

29

ArimaAutoRegressive

Współczynnik pojedynczy termin w modelu ARIMA Autoregressive.

Stosuje się tylko do tych czas modeli serii algorytm ARIMA.

30

ArimaMovingAverage

Przenoszenie średni współczynnik dla jednego terminu w modelu ARIMA.Stosuje się tylko do tych czas modeli serii algorytm ARIMA.

1000

CustomBase

Punkt początkowy dla typów węzłów niestandardowe.Typy węzłów niestandardowe muszą być liczbami całkowitymi większej wartości niż ta stała.Stosuje się do modeli utworzonych przy użyciu algorytmów niestandardowych dodatku plug-in.

Identyfikator węzła, nazwisko, podpis i opis

Węzeł główny każdego modelu zawsze ma unikatowy identyfikator (NODE_UNIQUE_NAME) 0.Wszystkie identyfikatory węzeł są przypisywane automatycznie przez usługi Analysis Services i nie można modyfikować.

Węzeł główny dla każdego modelu zawiera również pewne podstawowe metadane dotyczące modelu.metadane zawiera osobny model bazy danych usług Analysis Services (MODEL_CATALOG), schemat (MODEL_SCHEMA), a nazwa modelu (nazwa_modelu).Jednakże informacje powtarza się w wszystkie węzły modelu, więc nie trzeba zbadać węzła głównego uzyskać metadane.

Oprócz nazwy używane jako identyfikator unikatowy, każdy węzeł dysponuje nazwę (nazwa_węzła).Ta nazwa jest automatycznie tworzony przez algorytm w celach wyświetlania i nie może być edytowany.

Ostrzeżenie

Algorytm klastrowania firmy Microsoft umożliwia użytkownikom przypisać przyjazne nazwy każdego klastra.Jednak te przyjazne nazwy nie są zachowywane na serwerze, a jeśli użytkownik ponownie przetwórz model, algorytm generuje nowe nazwy klastra.

Podpis i Opis dla każdego węzła są generowane automatycznie przez algorytm i etykiet, aby ułatwić zrozumienie zawartości węzła.Tekst wygenerowany dla każdego pole zależy od typu modelu.W niektórych przypadkach nazwisko, podpis i opis może zawierać ten sam ciąg, ale w niektórych modelach opis może zawierać dodatkowe informacje.Zobacz temat typ modelu szczegóły realizacji.

Ostrzeżenie

Serwera Analysis Services obsługuje, zmiana nazwy węzłów tylko w przypadku tworzenia modeli przy użyciu niestandardowe algorytm dodatek, który implementuje zmianę nazwy.Podczas tworzenia dodatku algorytm umożliwiające zmienianie nazw należy zastąpić metody.

Węzeł nadrzędne, podrzędne węzła i Kardynalność węzła

Związek między nadrzędnym i podrzędność węzły w strukturze drzewa jest określana przez wartość z kolumna PARENT_UNIQUE_NAME.Ta wartość jest przechowywana w podrzędność węzła i informuje o identyfikator węzła nadrzędnego.Niektóre przykłady sposobu użycia tych informacji może być:

  • PARENT_UNIQUE_NAME, który jest NULL oznacza, że węzeł jest węzłem modelu.

  • Jeśli wartość PARENT_UNIQUE_NAME jest równa 0, węzeł musi być bezpośrednio podrzędny węzeł najwyższego poziomu w modelu.Wynika to identyfikator węzła głównego jest zawsze 0.

  • Za pomocą funkcji w ramach kwerendy danych górnictwa rozszerzenia (DMX) elementy podrzędne lub nadrzędne określonego węzła.Aby uzyskać więcej informacji o korzystaniu z funkcji w kwerendach, zobacz Badanie modeli wyszukiwania danych (Analysis Services - wyszukiwania danych).

Kardynalność odnosi się do liczby elementów w zestaw.W kontekście przetworzonych model wyszukiwania, liczebność informuje liczby dzieci w określonym węźle.Na przykład, jeśli model drzewo decyzyjne ma węzła dla [roczny dochód] i węzeł ma dwa węzły podrzędność, jedną dla warunku [roczny dochód] = wysoki i jedną dla warunku [roczny dochód] = niski, wartość CHILDREN_CARDINALITY dla węzła [roczny dochód] byłoby 2.

Ostrzeżenie

W Usługi Analysis Services, tylko węzły podrzędność natychmiastowe są uwzględniane przy obliczaniu Kardynalność węzła.Jednak utworzyć niestandardowy algorytm dodatku, można przeciążenia CHILDREN_CARDINALITY do zliczania Kardynalność inaczej.Może to być przydatne, na przykład, jeśli chciał liczba całkowita liczba elementy podrzędne, nie tylko bezpośrednie elementy podrzędne.

Chociaż Kardynalność jest liczony w taki sam sposób dla wszystkich modeli, jak interpretować lub użyj wartości Kardynalność różni się w zależności od typu modelu.Na przykład w klastrowanie modelu Kardynalność węzłem informuje całkowita liczba klastrów, które zostały znalezione.W innych typach modeli Kardynalność zawsze może być zestaw wartości w zależności od typu węzła.Aby uzyskać więcej informacji dotyczących sposobu interpretowania Kardynalność zobacz temat about typu modelu.

Ostrzeżenie

Niektóre modele, takich jak przez algorytm sieci neuronowe Microsoft dodatkowo zawierają typ węzła specjalne, która zapewnia Statystyki opisowe informacje o danych szkolenia dla całego modelu.Z definicji węzły te nigdy mieć węzłów podrzędność.

Węzła dystrybucyjnego

Kolumna NODE_DISTRIBUTION zawiera zagnieżdżoną tabela, że w wielu węzłów zawiera ważne i szczegółowe informacje dotyczące wzorców wykrytych przez algorytm.Dokładne statystyki zawarte w tej tabela zmienia się w zależności od typu modelu, pozycja węzła w drzewie i czy atrybut przewidywalne ciągłą wartość numeryczną lub dyskretnych wartości; może jednak zawierać minimalne i maksymalne wartości atrybut, wag przypisanych do wartości liczby przypadków w węźle Współczynniki użyte w formule regresja i środki statystyczne odchylenie standardowe i WARIANCJA.Aby uzyskać więcej informacji dotyczących sposobu interpretowania węzła dystrybucji zobacz temat dla określonego typu typ modelu, który pracuje z.

Ostrzeżenie

Tabela NODE_DISTRIBUTION może być puste, w zależności od typu węzła.Na przykład niektóre węzły służą tylko do organizowania kolekcja węzły podrzędność i jest węzłów podrzędność, które zawierają szczegółowe statystyki.

Tabela zagnieżdżona, NODE_DISTRIBUTION, zawsze zawiera następujące kolumny.Zawartość każdej kolumna zależy od typu modelu.Aby uzyskać więcej informacji o typach określonego modelu, zobacz Górnictwa modelu zawartości typu algorytmu.

  • ATTRIBUTE_NAME
    Zawartość zależy od algorytmu.Może być nazwa kolumna, takie jak atrybut przewidywalny, reguły, itemset lub fragment informacji wewnętrznych algorytmu, taki jak część formuły.

    Ta kolumna może zawierać również parę atrybut wartość.

  • ATTRIBUTE_VALUE
    Wartość atrybut o nazwie w ATTRIBUTE_NAME.

    Jeśli nazwa atrybut jest kolumną, następnie przypadek najprostszą ATTRIBUTE_VALUE zawiera jeden z dyskretnych wartości kolumna.

    W zależności od tego, jak algorytm przetwarza wartości, ATTRIBUTE_VALUE może również zawierać flaga, informujący o tym, czy istnieje wartość atrybut (Existing), lub czy ma wartość null (Missing).

    Na przykład, jeśli model jest zestaw do znajdowania klientów, którzy kupili określonego towaru, co najmniej raz, kolumna ATTRIBUTE_NAME może zawierać parę atrybut wartość, która definiuje przedmiot wspólnego zainteresowania, takich jak Model = 'Water bottle', i zawiera tylko słowo kluczowe w kolumnie ATTRIBUTE_VALUE Existing lub Missing.

  • OBSŁUGA
    Liczba przypadków, które mają tę parę atrybut wartość lub zawierające to itemset lub reguły.

    Ogólnie, dla każdego węzła wartość obsługi informuje liczbie spraw w kształceniu, zestaw są zawarte w bieżącym węźle.W większości typów modelu obsługi reprezentuje dokładna liczba przypadków.Obsługa wartości są przydatne, ponieważ dystrybucji danych można przeglądać w ramach spraw szkolenia bez konieczności kwerendy danych szkolenia.Serwer usług Analysis Services używa również te przechowywane wartości do obliczenia prawdopodobieństwa przechowywanych w stosunku do poprzedniego prawdopodobieństwa, czy wnioskowanie jest silne i słabe.

    Na przykład, w drzewie klasyfikacji obsługi wartość wskazuje liczbę przypadków, w których opisane kombinację atrybutów.

    drzewo decyzyjne sumę pomocy technicznej na każdym poziom kwot drzewa do obsługi jego nadrzędnym węźle.Na przykład, jeśli model zawierający 1200 sprawy jest jednakowo podzielone według płci i następnie dzielona równomiernie przez trzy wartości do dochodu — niski, średni i wysoki — węzły podrzędność węzła (2), które są węzłami (4) (5) i (6) Suma zawsze tego samego numeru przypadkach jako węzeł (2).

    Identyfikator węzła i atrybuty węzła

    Licznik obsługi

    (1) Modelu głównego

    1200

    (2) Płci = męska

    (3) Płci = kobieta

    600

    600

    (4) Płci = samców i dochód = wysoki

    (5) Płci = samców i dochód = średni

    (6) Płci = samców i dochód = niski

    200

    200

    200

    (7) Płci = samic i dochodu = wysoki

    (8) Płci = samic i dochodu = średni

    (9) Płci = samic i dochodu = niski

    200

    200

    200

    Dla klastrowanie , numer modelu dla wsparcia ważone można dołączyć prawdopodobieństw należących do wielu klastrów.Wiele członkostwa klastra jest domyślna metoda klastrowanie.W tym scenariuszu ponieważ każdego przypadek niekoniecznie nienależących do klastra jeden i tylko jeden obsługi tych modeli może nie zwiększają 100 procent wszystkich klastrów.

  • PRAWDOPODOBIEŃSTWO
    Wskazuje prawdopodobieństwa dla tego określonego węzła w obrębie całego modelu.

    Ogólnie prawdopodobieństwa reprezentuje wsparcia dla określonej wartości, podzielonej przez całkowitą liczbę przypadków w węźle (NODE_SUPPORT).

    Jednak prawdopodobieństwo jest nieznacznie dostosowane do wyeliminowania bias spowodowane przez brak wartości w danych.

    [Na przykład, jeśli bieżące wartości całkowita dzieci] są "Jeden" i "Dwa", aby uniknąć tworzenia modelu, który przewiduje było niemożliwe, nie mają elementów podrzędnych lub mieć trzy elementy podrzędne.W celu zapewnienia, że brakuje wartości nietypowymi, ale nie uniemożliwia, algorytm zawsze dodaje 1 do liczby rzeczywiste wartości dla każdego atrybut.

    Przykład:

    Prawdopodobieństwo [całkowita dzieci jedną =] = [liczba przypadków, gdy całkowita dzieci = jeden] + 1 / [liczba wszystkich przypadkach] + 3

    Prawdopodobieństwo [całkowita dzieci dwóch =] = [liczba przypadków, gdy całkowita dzieci dwóch =] + 1 / [liczba wszystkich przypadkach] + 3

    Ostrzeżenie

    Korekta 3 jest obliczana przez dodanie 1 do całkowitej liczby istniejących wartości n.

    Po dostosowaniu prawdopodobieństwa dla wszystkich wartości nadal dodawać do 1.Prawdopodobieństwo wartości bez danych (w tym przykładzie [całkowita dzieci = "Zero", "Trzy" lub pewną inną wartość]), rozpoczyna się od bardzo niskie zera poziomi powoli rośnie w kilku przypadkach są dodawane.

  • ODCHYLENIE
    Wskazuje odchylenie wartości w węźle.Z definicji odchylenie jest zawsze 0 dla wartości dyskretnego.Jeśli model obsługuje wartości ciągłego, odchylenie jest obliczana jako σ (sigma) przy użyciu mianownik n, lub liczba przypadków w węźle.

    Istnieją dwie definicje ogólne używany do reprezentowania odchylenie standardowe (StDev).Jedną metodę obliczania odchylenia standardowego uwzględnia bias konta, a inna metoda oblicza odchylenie standardowe bez użycia bias.Ogólnie rzecz biorąc algorytmów wyszukiwanie danych firmy Microsoft nie używać bias computing odchylenie standardowe.

    Wartość wyświetlana w tabela NODE_DISTRIBUTION jest rzeczywista wartość dla wszystkich atrybutów dyskretnych i discretized i średniej ciągłej wartości.

  • VALUE_TYPE
    Wskazuje typ danych wartości lub atrybut i użycie wartości.Niektórych typów wartości dotyczą tylko niektórych typów modeli:

    IDENTYFIKATOR VALUE_TYPE

    Etykieta wartości

    Nazwa Typ wartości

    1

    Brak

    Wskazuje, że dane przypadek nie zawierają wartość tego atrybut.Missing Państwo jest obliczana oddzielnie od atrybutów, które mają wartości.

    2

    Istniejące

    Wskazuje, że przypadek dane zawierają wartość tego atrybut.

    3

    Ciągłe

    Wskazuje, że wartość atrybut jest wartością liczbową ciągłe i może być reprezentowany przez średnią, wraz z WARIANCJA i odchylenie standardowe.

    4

    Dyskretne

    Wskazuje wartość numeryczną lub tekst, który jest traktowany jako osobny.

    Uwaga dyskretnych wartości mogą być także brak; Jednakże są obsługiwane inaczej podczas obliczeń.Aby uzyskać informacje, zobacz Brak wartości (Analysis Services - wyszukiwania danych).

    5

    Discretized

    Wskazuje, że atrybut zawiera wartości liczbowe, które zostały discretized.Wartość będzie sformatowany ciąg znakowy opisujący pakiety discretization.

    6

    Istniejące

    Indicates that the attribute has continuous numeric values and that values have been supplied in the data, vs.values that are missing or inferred.

    7

    Współczynnik

    Wskazuje wartość numeryczną, która reprezentuje współczynnik.

    Współczynnik jest wartość, która jest stosowana przy obliczaniu wartości zmiennej zależnej.Na przykład jeśli model tworzy formułę regresja, która przewiduje przychodów oparte na wiek, współczynnik jest używany w formułę, która odnosi się do wieku do dochodu.

    8

    Wynik zysk

    Wskazuje wartość numeryczną, która reprezentuje wynik zysk dla atrybut.

    9

    Statystyki

    Wskazuje wartość numeryczną, która reprezentuje statystyki regressor.

    10

    Unikatowa nazwa węzła

    Wskazuje, że wartość nie być obsługiwane nie jako wartości liczbowe lub ciąg, ale jako identyfikator unikatowy innego węzła zawartości w modelu.

    Na przykład model sieci neuronowe identyfikatory zapewniają wskaźniki z węzłów w warstwie danych wyjściowych do węzłów w ukrytej warstwie i z węzłów w ukrytej warstwie węzły w wejściowy warstwy.

    11

    Punkt przecięcia

    Wskazuje wartość numeryczną, która reprezentuje punkt przecięcia z osią w formule regresja.

    12

    Okresowość

    Wskazuje, że wartość oznacza okresowe struktury modelu.

    Dotyczy tylko czas modeli serii, które zawierają ARIMA model.

    UwagaUwaga:
    algorytm serii czasowych firmy Microsoft Automatycznie wykrywa okresowe struktur w oparciu o dane szkolenia.W rezultacie terminy końcowe modelu może zawierać wartości okresowości, które nie podaje jako parametr podczas tworzenia modelu.

    13

    Kolejność Autoregressive

    Wskazuje, że wartość reprezentuje liczbę serii autoregressive.

    Dotyczy czas modeli serii algorytm ARIMA.

    14

    Przenoszenie zamówienia średnia

    Reprezentuje wartość, która reprezentuje liczbę ze średnich w serii.

    Dotyczy czas modeli serii algorytm ARIMA.

    15

    Różnica zamówienia

    Wskazuje, że wartość reprezentuje wartość wskazującą, ile razy serii jest zróżnicowana.

    Dotyczy czas modeli serii algorytm ARIMA.

    16

    Boolean

    Reprezentuje typ wartość logiczna.

    17

    Inne

    Reprezentuje wartość niestandardowe określone przez algorytm.

    18

    Ciąg prerendered

    Reprezentuje wartość niestandardowego, który renderuje algorytm jako ciąg.Formatowanie nie został zastosowany przez model obiektów.

    Typy wartości są uzyskiwane z ADMOMD.Wyliczanie netto.Aby uzyskać więcej informacji, zobacz MiningValueType.

Wynik węzła

Znaczenie wynik węzła różni się w zależności od typu modelu i mogą być określone dla wybranego typu węzła.Aby uzyskać informacje dotyczące sposobu obliczania NODE_SCORE dla każdego typu modelu i węzła, zobacz Górnictwa modelu zawartości typu algorytmu.

Węzeł prawdopodobieństwa i prawdopodobieństwo marginalny

Model górnictwa zestaw zestaw wierszy schematu zawiera kolumny NODE_PROBABILITY i MARGINAL_PROBABILITY dla wszystkich typów modelu.Te kolumny zawierają wartości tylko w węzłach, gdzie wartość prawdopodobieństwa jest znaczące.Węzeł główny model zawiera nigdy wynik prawdopodobieństwa.

W tych węzłów, które zapewniają wyniki prawdopodobieństwa prawdopodobieństwo węzła i prawdopodobieństwa marginalny reprezentują różnych obliczeń.

  • Marginalna prawdopodobieństwo jest prawdopodobieństwo osiągnięcia z nadrzędnego węzła.

  • Węzeł prawdopodobieństwo jest prawdopodobieństwo osiągnięcia węzła z katalogu głównego.

  • Węzeł prawdopodobieństwo jest zawsze mniejsza lub równa marginalny prawdopodobieństwo.

Na przykład jeśli zapełnianie wszystkich klientów drzewo decyzyjne jest jednakowo podzielona według płci (i nie ma żadnych wartości), prawdopodobieństwo węzły podrzędność powinny być 0,5.Jednakże, załóżmy, że węzłach dla płci jest dzielona równomiernie przez poziomów dochodu — wysoki, średni i niski.W tym przypadek wynik każdej MARGINAL_PROBABILITY podrzędność węzeł powinien być zawsze.33, ale wartość NODE_PROBABILTY będzie produktu prawdopodobieństw wszystkich prowadzących do tego węzła i dlatego zawsze mniej niż MARGINAL_PROBABILITY wartość.

Poziom węzła i atrybut i wartość

Marginalna prawdopodobieństwa

Prawdopodobieństwo węzła

Modelu głównego

Wszystkich klientów miejsce docelowe

1

1

Podział według płci klientów docelowych

.5

.5

Klientów docelowych podzielić według płci i dzielenie ponownie trzy sposoby przy przychód

.33

.5 * .33 = .165

Węzeł reguły i reguły marginalny

Model górnictwa zestaw zestaw wierszy schematu obejmuje również kolumnach NODE_RULE i MARGINAL_RULE dla wszystkich typów modelu.Te kolumny zawierają fragmenty danych XML, które mogą być używane do serializacji modelu lub stanowią część struktury modelu.Kolumny te mogą być puste dla niektórych węzłów, jeśli wartość byłoby bez znaczenia.

Dwa rodzaje reguł XML są dostarczone, podobnie jak dwa rodzaje wartości prawdopodobieństwa.Fragment XML w MARGINAL_RULE definiuje atrybut i wartość dla bieżącego węzła należy fragment XML w NODE_RULE opisuje ścieżka do bieżącego węzła z modelu głównego.

Powrót do początku

Wyszukiwania zawartości typu algorytmu modelu

Każdy algorytm przechowuje różne rodzaje informacji jako część jego zawartości schemat.Na przykład Microsoft algorytm klastrowania generuje wiele węzłów podrzędność, z których każdy reprezentuje możliwości klastra.Każdy węzeł klastra zawiera reguły, które opisują cechy współużytkowane przez elementy w klastrze.Natomiast Microsoft regresji liniowej algorytm nie zawiera żadnych węzłów podrzędność; Zamiast tego węzła nadrzędnego modelu zawiera równanie, które opisano zależność liniowa wykryte przez analizę.

Poniższa tabela zawiera łącza do tematów, dla każdego typu algorytmu.

  • Model zawartości tematy: Wyjaśnić znaczenie każdego typu węzła dla każdego typu algorytmu i dostarczenia wytycznych, o którym węzły są większości zainteresowanie typu określonego modelu.

  • Wykonywanie kwerend tematy: Zawierają przykłady kwerend typu określonego modelu i wskazówki dotyczące interpretacji wyniki.

Algorytm lub typ modelu

Model zawartości

Badanie modeli wyszukiwania

Skojarzenia modeli reguł

Model zawartości dla skojarzenia modeli górnictwo (Analysis Services - wyszukiwania danych)

Badanie modelu skojarzeń (Analysis Services - wyszukiwania danych)

Klastrowanie modeli

Model zawartości dla modeli drzewa decyzji górnictwo (Analysis Services - wyszukiwania danych)

Badanie modelu klastrowania (Analysis Services - wyszukiwania danych)

Decyzja drzewa modelu

Model zawartości dla modeli drzewa decyzji górnictwo (Analysis Services - wyszukiwania danych)

Badanie modelu drzewa decyzji (Analysis Services - wyszukiwania danych)

Modele regresja liniowej

Górnictwo zawartości modelu regresji liniowej modeli (Analysis Services - wyszukiwania danych)

Badanie modelu regresji liniowej (Analysis Services - wyszukiwania danych)

Logistyczne regresja modeli

Model zawartości dla modeli regresją górnictwo (Analysis Services - wyszukiwania danych)

Badanie modelu regresji liniowej (Analysis Services - wyszukiwania danych)

Modele Naïve Bayes

Górnictwo modelu zawartości dla modeli Naive Bayes (Analysis Services - wyszukiwania danych)

Badanie Naive Bayes Model (Analysis Services - wyszukiwania danych)

Modele sieci neuronowe

Model zawartości dla sieci neuronowe modeli górnictwo (Analysis Services - wyszukiwania danych)

Badanie modelu sieci neuronowe (Analysis Services-wyszukiwania danych)

Sekwencja klastrowanie

Model zawartości sekwencji klastrowanie modeli górnictwo (Analysis Services - wyszukiwania danych)

Badanie sekwencji klastrowanie modelu (Analysis Services - wyszukiwania danych)

Czas modeli serii

Model zawartości dla serii czas modeli górnictwo (Analysis Services - wyszukiwania danych)

Badanie Model serii czas (Analysis Services - wyszukiwania danych)

Narzędzia do przeglądania zawartości modelu górnictwo

Podczas przeglądania lub eksplorowania modelu w Business Intelligence Development Studio, można wyświetlać informacje w Ogólnej zawartości drzewa Podgląd programu Microsoft, który jest dostępny zarówno w Business Intelligence Development Studio i SQL Server Management Studio.

Microsoft Wyświetla rodzajowy przeglądarka zawartości kolumny, reguły, właściwości, atrybutów, węzły i innej zawartości z modelu przy użyciu tych samych informacji, która jest dostępna w zawartości zestaw zestaw wierszy schematu modelu górnictwa.Zawartość zestaw wierszy schematu jest ogólne ramy dla przedstawiania szczegółowe informacje na temat zawartości modelu wyszukiwanie danych. Model zawartości można wyświetlić w każdy klient, który obsługuje hierarchicznych zestawów wierszy.Podgląd w Business Intelligence Development Studio zorganizowane w podglądzie tabela HTML, reprezentujący wszystkie modele w spójny format, co ułatwia zrozumienie struktury tworzonych wzorów.Aby uzyskać więcej informacji, zobacz Wyświetlanie szczegółów modelu z podglądem drzewa zawartości Microsoft Generic.

Powrót do początku

Narzędzia do badania zawartości modelu górnictwo

Aby pobrać model wyszukiwania zawartości, należy utworzyć na zapytanie dane model wyszukiwania.

Najprostszym sposobem utworzenia kwerendy zawartości jest wykonanie następujących DMX instrukcja w SQL Server Management Studio:

SELECT * FROM [<mining model name>].CONTENT

Aby uzyskać więcej informacji, zobacz Badanie modeli wyszukiwania danych (Analysis Services - wyszukiwania danych).

model wyszukiwania zawartości można również kwerendy przy użyciu zestawów wierszy schematu wyszukiwanie danych.Zestaw wierszy schematu jest standardowej strukturze, której klienci używają do odnajdowanie, przeglądanie i kwerendami struktur górnictwa i modeli.Kwerendy z zestawów wierszy schematu, przy użyciu XMLA, języka Transact-SQL lub instrukcji DMX.

W SQL Server 2008, możesz również dostęp do informacji w wyszukiwanie danych zestawów wierszy schematu połączeń do serwera Analysis Services, otwierając i kwerenda tabele systemowe.Aby uzyskać więcej informacji za pomocą instrukcji SELECT, aby wierszy schematu wyszukiwanie danych kwerendy, zobacz Narzędzia do rozwiązywania problemów (Analysis Services - wyszukiwania danych).

Powrót do początku