Mining Model Content (Analysis Services - Data Mining)

Po zostały zaprojektowane i przetwarzania model wyszukiwania przy użyciu danych z podstawową struktura wyszukiwania model wyszukiwania została zakończona i zawiera Zawartość modeli wyszukiwania.Zawartość ta umożliwia tworzenie prognoz i analizowania danych.

model wyszukiwania zawartości zawiera metadane dotyczące modelu, statystyki dotyczące danych i wzorców wykrytych przez algorytm wyszukiwania.W zależności od algorytmu, który został użyty zawartość modelu może zawierać formuły regresja, definicje reguł i itemsets lub wag i inne dane statystyczne.

Niezależnie od algorytmu, który został użyty model wyszukiwania zawartości są prezentowane w postaci standardowych.Można przeglądać strukturę w rodzajowy zawartości drzewa Podgląd firmy Microsoft, pod warunkiem że w Business Intelligence Development Studio, a następnie przełącz się do jednego z niestandardowych przeglądarki, aby zobaczyć, jak informacje są interpretowane i wyświetlane w postaci graficznej dla każdego typu modelu. Można również utworzyć kwerendy przed model wyszukiwania zawartości za pomocą dowolnego klient, który obsługuje MINING_MODEL_CONTENT zestaw wierszy schematu.Aby uzyskać więcej informacji zobaczPodczas badania modeli wyszukiwanie danych: Jak to zrobić tematy (Analysis Services — wyszukiwanie danych).

W tej części opisano strukturę podstawową zawartość dla wszystkich rodzajów modeli wyszukiwania.Zamieszczono w nim również informacje na temat typów węzłów, które są wspólne dla wszystkich model wyszukiwania zawartości i zawiera wskazówki dotyczące interpretacji danych.

Struktura model wyszukiwania zawartości

Węzły

Zawartość model wyszukiwania przez typ algorytmu

Narzędzia do przeglądania zawartości model wyszukiwania

Narzędzia do Kwerenda model wyszukiwania zawartości

Struktura model wyszukiwania zawartości

Zawartość każdego modelu jest przedstawiany jako serii węzły.Węzeł jest obiektem w model wyszukiwania, który zawiera metadane i informacje o części modelu.Węzły są ułożone w hierarchii.Dokładne rozmieszczenie węzłów w hierarchii i rozumieniu hierarchii, zależy od algorytmu, który zostanie użyty.Na przykład jeśli tworzysz model do drzewa decyzji, model może zawierać wiele drzew, wszystkie podłączone do modelu głównego, jeśli tworzysz model sieci neuronowe modelu może zawierać jeden lub więcej sieci oraz węzeł Statystyka.

Nazywa się pierwszym węzłem w każdym modelu węzeł główny, or the Model obiektu nadrzędnego. węzła.Każdy model ma węzła głównego (NODE_TYPE = 1).Węzeł główny zazwyczaj zawiera niektóre metadane dotyczące modelu oraz liczby węzłów podrzędność, ale nieco dodatkowe informacje dotyczące wzorców wykryte przez model.

W zależności od tego, który algorytm używany do tworzenia modelu węzła głównego ma różną liczbę węzłów podrzędność.Węzły podrzędność mają inne znaczenie i zawierać inną zawartość w zależności od algorytmu głębokość i złożoności danych.

Powrót do początku

Węzły

W modelu górnictwo węzeł jest kontener ogólnego przeznaczenia, który przechowuje informacji o wszystkich lub części modelu.Struktura każdy węzeł jest zawsze taka sama, a zawiera w kolumnach wyznaczonych przez zestaw wierszy schematu wyszukiwanie danych.Aby uzyskać więcej informacji zobaczZestaw wierszy DMSCHEMA_MINING_MODEL_CONTENT.

Każdy węzeł zawiera metadane dotyczące węzła, w tym identyfikator, który jest unikatowy w obrębie każdego modelu, identyfikator węzła nadrzędnego, a także liczby węzłów podrzędność, który węzeł ma.Metadane identyfikuje modelu, do której należy dany węzeł i przechowywania określonego modelu wykaz bazy danych.Dodatkowa zawartość w węźle różni się w zależności od typu algorytm używany do tworzenia modelu i mogą być następujące:

  • Liczba przypadków danych szkoleniowych, które obsługuje określoną wartość przewidywane.

  • Statystyki, takie jak średnia, odchylenie standardowe lub WARIANCJA.

  • Współczynniki i formuły.

  • Definicja reguły i wskaźniki boczne.

  • Fragmenty XML opisujących częścią modelu.

Lista typów węzłów

Poniższa tabela zawiera listę różnych typów węzłów, które są dane wyjściowe w modeli wyszukiwanie danych.Ponieważ każdy algorytm przetwarza informacje inaczej, każdy model generuje tylko kilka określonych rodzajów węzłów.Jeśli zmienisz algorytm typów węzłów mogą ulec zmianie.Ponadto jeśli użytkownik ponownie przetworzyć modelu, zawartość każdego węzła mogą ulec zmianie.

Uwaga

Jeśli używasz usługa wyszukiwanie danych inne niż te, w usługach Analysis Services programu SQL Server 2008 lub utworzyć własny dodatek algorytmów, typy dodatkowych węzłów niestandardowe mogą być dostępne.

IDENTYFIKATOR NODE_TYPE

Etykieta węzła

Węzeł spis treści

1

Model

Metadane i katalog główny węzeł zawartości.Ma zastosowanie do wszystkich typów modeli.

2

Drzewa

Węzeł główny drzewa klasyfikacji.Stosuje się do modeli drzewo decyzyjne.

3

Wnętrze

Wnętrze podzielić węzeł w drzewie.Stosuje się do modeli drzewo decyzyjne.

4

Rozkład

Terminali węzła drzewa.Stosuje się do modeli drzewo decyzyjne.

5

Klaster

Klaster wykrytych przez algorytm.Stosuje się do usługi klastrowania modeli i klastrowanie modeli sekwencji.

6

Nieznany

Typ nieznany węzeł.

7

ItemSet

Itemset wykrytych przez algorytm.Stosuje się do skojarzenia modeli lub sekwencji klastrowanie modeli.

8

AssociationRule

Reguła skojarzenia wykrytych przez algorytm.Stosuje się do skojarzenia modeli lub sekwencji klastrowanie modeli.

9

PredictableAttribute

Atrybut przewidywalne.Ma zastosowanie do wszystkich typów modeli.

10

InputAttribute

Atrybut danych wejściowych.Stosuje się do drzewa decyzji i Naïve Bayes modeli.

11

InputAttributeState

Statystyka stany atrybut wejściowy.Stosuje się do drzewa decyzji i Naïve Bayes modeli.

13

Sekwencja

Węzeł najwyższego poziomu dla składnika modelu Markov klastra sekwencji.Stosuje się do kolejności klastrowanie modeli.

14

Przejścia

Markov przejścia macierzy.Stosuje się do kolejności klastrowanie modeli.

15

TimeSeries

Inne niż główne węzeł drzewa serii czas.Dotyczy tylko modele serii czas.

16

TsTree

Węzeł główny drzewa serii czas odpowiadający do szeregu czasowego przewidywalne.Stosuje się do czas serii modeli, i tylko wtedy, gdy model został utworzony za pomocą parametru mieszanego.

17

NNetSubnetwork

Jeden sub-network.Stosuje się do sieci neuronowe modeli.

18

NNetInputLayer

Grupa, do której należą węzłów wejściowych warstwy.Stosuje się do sieci neuronowe modeli.

19

NNetHiddenLayer

Grupy, który zawiera węzły, które opisują ukrytej warstwie.Stosuje się do sieci neuronowe modeli.

21

NNetOutputLayer

Grupy, które zawiera węzły w warstwie danych wyjściowych.Stosuje się do sieci neuronowe modeli.

21

NNetInputNode

Węzeł w wejściowym warstwy, która pasuje do atrybut wprowadzania odpowiednich stanów.Stosuje się do sieci neuronowe modeli.

22

NNetHiddenNode

Węzeł w ukrytej warstwie.Stosuje się do sieci neuronowe modeli.

23

NNetOutputNode

Węzeł w warstwie danych wyjściowych.Ten węzeł zwykle będzie pasował do atrybut danych wyjściowych i odpowiadające im stanów.Stosuje się do sieci neuronowe modeli.

24

NNetMarginalNode

Marginalna statystykę zestaw szkoleniowy.Stosuje się do sieci neuronowe modeli.

25

RegressionTreeRoot

Katalog główny drzewa regresja.Dotyczy regresja liniowej modeli i modele drzewa decyzji, które zawiera ciągłego wprowadzania atrybuty.

26

NaiveBayesMarginalStatNode

Marginalna statystykę zestaw szkoleniowy.Stosuje się do modeli Naïve Bayes.

27

ArimaRoot

Węzeł główny ARIMA modelu.Dotyczy tylko tych czas serii modele, które za pomocą algorytmu ARIMA.

28

ArimaPeriodicStructure

Struktura okresowych w modelu ARIMA.Dotyczy tylko tych czas serii modele, które za pomocą algorytmu ARIMA.

29

ArimaAutoRegressive

Współczynnik Autoregressive jeden składnik w modelu typu ARIMA.

Dotyczy tylko tych czas serii modele, które za pomocą algorytmu ARIMA.

30

ArimaMovingAverage

Przenoszenie współczynnik średnia pojedynczy termin w modelu ARIMA.Dotyczy tylko tych czas serii modele, które za pomocą algorytmu ARIMA.

1000

CustomBase

Punkt początkowy dla typów węzłów niestandardowych.Typy węzłów niestandardowe muszą być liczbami całkowitymi przekracza wartość tej stała.Stosuje się do modeli utworzonych przy użyciu algorytmów, niestandardowego dodatku typu plug-in.

Identyfikator węzła, nazwa, etykieta i opis

Węzeł główny każdego modelu zawsze ma unikatowy (identyfikatorNODE_UNIQUE_NAME) 0.Wszystkie identyfikatory węzła są przypisywane automatycznie poprzez Analysis Services i nie mogą być modyfikowane.

Węzeł katalogu głównego dla każdego modelu zawiera także pewne podstawowe metadane dotyczące modelu.Te metadane zawiera bazy danych usług Analysis Services, gdy model jest przechowywana)MODEL_CATALOG), schemat (MODEL_SCHEMA), a nazwa modelu (NAZWA_MODELU).Jednak te informacje powtarza się w wszystkich węzłów z modelu, dzięki czemu nie trzeba zbadać węzła głównego w celu uzyskania tych metadane.

Oprócz nazwę używaną jako identyfikator unikatowy, każdy węzeł dysponuje Nazwa (NAZWA_WĘZŁA).Ta nazwa jest automatycznie tworzona przez algorytm w celach wyświetlania i nie można edytować.

Uwaga

Algorytm klastrowania firmy Microsoft pozwala użytkownikom na przypisywanie przyjazne nazwy dla każdego klastra.Jednak te przyjazne nazwy nie są zachowywane na serwerze, a jeśli można ponownie przetworzyć modelu, algorytm spowoduje wygenerowanie nowej nazwy klastra.

The caption and description for each node are automatically generated by the algorithm, and serve as labels to help you understand the content of the node.Wygenerowany dla każdego pole tekst zależy od typu modelu.W niektórych przypadkach nazwisko, podpis i opis może zawierać ten sam ciąg, ale w niektórych modelach opis może zawierać dodatkowe informacje.Zobacz temat dotyczący typu poszczególnych modelu szczegóły implementacji.

Uwaga

Serwer usług analiz obsługuje zmianę nazwy węzłów tylko w przypadku konstruowania modeli przy użyciu niestandardowe algorytm dodatek, który implementuje zmiany nazwy.Umożliwia zmianę nazwy, należy zastąpić metody podczas tworzenia dodatku algorytmu.

Węzeł rodzice, elementy podrzędne węzła i Kardynalność węzła

Relacje między nadrzędnym i podrzędność węzłów w strukturze drzewa zależy od wartości kolumna PARENT_UNIQUE_NAME.Ta wartość jest przechowywana w węzła podrzędnego i pozwalają określić identyfikator węzła nadrzędnego.Te informacje mogą być użycia należy wykonać kilka przykładów:

  • PARENT_UNIQUE_NAME, który ma wartość NULL oznacza, że węzeł jest węzeł najwyższego poziomu w modelu.

  • Jeśli wartość PARENT_UNIQUE_NAME wynosi 0, węzeł musi być bezpośrednio obiektu podrzędnego z węzeł najwyższego poziomu w modelu.Dzieje się tak, ponieważ identyfikator węzła głównego jest zawsze 0.

  • Za pomocą funkcji wewnątrz kwerendy DMX (wyszukiwanie danych rozszerzenia) znaleźć obiekty podrzędne lub nadrzędne określonym węźle.Aby uzyskać więcej informacji o korzystaniu z funkcji w kwerendach zobacz Podczas badania modeli wyszukiwania danych (Analysis Services — wyszukiwanie danych).

Relacja odnosi się do liczby elementów zestaw.W kontekście przetworzonych model wyszukiwania, liczebność pozwalają liczby dzieci w określonym węźle.Na przykład, jeśli modelu drzewo decyzyjne ma węzła dla [roczny dochód], a ten węzeł ma dwa węzły podrzędność, jeden dla warunku [roczny dochód] = wysoki, a drugi warunek, [roczny dochód] = niski, wartość CHILDREN_CARDINALITY dla węzła [roczny dochód] może być 2.

Uwaga

W Analysis Services, tylko bezpośrednie podrzędność węzły są uwzględniane przy obliczaniu relacja węzła. Jednak tworzenia niestandardowych algorytm dodatek mogą przeciążać CHILDREN_CARDINALITY policzyć Kardynalność inaczej.Może to być przydatne, na przykład, jeżeli chce się zliczyć całkowitą liczbę elementów podrzędnych, nie tylko bezpośrednie elementy podrzędne.

Mimo że Kardynalność jest liczony w taki sam sposób, w przypadku wszystkich modeli, w jaki sposób interpretowania lub użyj wartości Kardynalność różni się w zależności od typu modelu.Na przykład w klastrowanie modelu, relacja węzeł najwyższego poziomu pozwalają całkowita liczba klastrów, które zostały wykryte.W przypadku innych typów modeli Kardynalność zawsze może mieć wartość zestaw, w zależności od typu węzła.Aby uzyskać więcej informacji dotyczących sposobu interpretowania Kardynalność zobacz temat poświęcony typu pojedynczego modelu.

Uwaga

Niektóre modele, takie jak przez algorytm neuronowe sieci firmy Microsoft zawierają dodatkowo typ węzła specjalny, który zapewnia opisowy statystykę dotyczącą danych szkoleniowych dla całego modelu.Z definicji te węzły nigdy nie mają węzły podrzędność.

Węzeł dystrybucyjny

kolumna NODE_DISTRIBUTION znajduje się tabela zagnieżdżona, że w wielu węzłów zawiera ważne i szczegółowe informacje dotyczące wzorców wykrytych przez algorytm.Dokładne statystyki, znajdującego się w tej tabela zmieniają się w zależności od typu modelu, pozycja węzła w drzewie i przewidywalny atrybut jest, czy wartość liczbową ciągłego discrete wartość; jednak zawierają minimalnej i maksymalnej wartości atrybutu, Waga przypisana do wartości, liczbę przypadków, w węźle Współczynniki użyte w formule regresja i środki statystycznych, takich jak odchylenie standardowe i WARIANCJA.Aby uzyskać więcej informacji dotyczących sposobu interpretowania węzła dystrybucyjnego zobacz temat dla określonego typu typ modelu, w którym pracujesz.

Uwaga

Tabela NODE_DISTRIBUTION może być pusty, w zależności od typu węzła.Na przykład niektóre węzły służą tylko do organizowania kolekcja węzły podrzędność i jest węzły podrzędność, które zawierają szczegółowe dane statystyczne.

Tabela zagnieżdżona NODE_DISTRIBUTION, zawsze zawiera następujące kolumny.Zawartość każdego kolumna może się różnić w zależności od typu modelu.Aby uzyskać więcej informacji na temat typów określonego modelu zobacz Górnictwie model zawartości przez typ algorytmu.

  • ATTRIBUTE_NAME
    Zawartość może być różna w zależności od algorytmu.Może być nazwą kolumna, takie jak atrybut przewidywalny, reguły, an itemset lub fragment informacji wewnętrznych w algorytmie, taki jak część formuły.

    W tej kolumnie mogą również zawierać para atrybut wartość.

  • ATTRIBUTE_VALUE
    Wartość atrybut o nazwie w ATTRIBUTE_NAME.

    Jeśli nazwa atrybut jest kolumną, następnie przypadek większości proste ATTRIBUTE_VALUE zawiera discrete wartości dla tej kolumna.

    W zależności od tego, jak algorytm przetwarza wartości ATTRIBUTE_VALUE może również zawierać flaga, wskazująca, czy istnieje wartość (atrybutExisting), albo czy wartości null ()Missing).

    Na przykład jeśli model znaleźć klientów, którzy zakupili danego elementu, co najmniej raz, kolumna ATTRIBUTE_NAME może zawierać pary atrybut wartość, która definiuje element zainteresowania, takich jak Model = 'Water bottle', a kolumna ATTRIBUTE_VALUE będzie zawierać tylko słowo kluczowe Existing lub Missing.

  • POMOC TECHNICZNA
    Liczba przypadków, które zawierają tę parę atrybut wartość lub zawierają ten itemset lub reguły.

    Ogólnie rzecz biorąc dla każdego węzła wartość obsługi informuje liczbie spraw zestaw szkolenia są uwzględniane w bieżącym węźle.W większości typów modeli obsługa reprezentuje dokładną liczbę przypadków.Obsługa wartości są przydatne, ponieważ dystrybucji danych można wyświetlać we własnych spraw szkolenia, bez konieczności pobrania danych szkoleniowych.Serwer usług Analysis Services używa również tych wartości przechowywane do obliczania prawdopodobieństwa przechowywanych w stosunku do poprzednich prawdopodobieństwa, można określić, czy wnioskowanie jest mocne lub słabe.

    Na przykład w drzewie klasyfikacji, wartość obsługi wskazuje numer sprawy, które zostały opisane kombinację atrybutów.

    drzewo decyzyjne sumę pomocy technicznej przy każdym poziom kwot drzewa wsparcia ich węzła nadrzędnego.Na przykład, jeśli model zawiera przypadki 1200 jest dzielony równo według płci, a następnie podzielona równo przez trzy wartości dla wyników — niski, średni i wysoki — węzły podrzędność węzła (2), które są węzłami [4], [5] i [6], zawsze jest Suma na taką samą liczbę przypadków jako węzeł (2).

    Identyfikator węzła i atrybuty węzła

    Licznik pomocy technicznej

    (1) Główny model

    1200

    [2] Płeć = męska

    (3) Płci = gniazdowy

    600

    600

    (4) Płci = męski i zysk = wysoki

    (5) Płci = męski i zysk = średni

    (6) Płeć = męski i zysk = niski

    200

    200

    200

    (7) Płeć = gniazdowy i zysk = wysoki

    (8) Płci = gniazdowy i zysk = średni

    (9) Płeć = gniazdowy i zysk = niski

    200

    200

    200

    Dla klastrów modelu numer pomocy technicznej może ważone dołączyć prawdopodobieństw należących do wielu klastrów.Wiele członkostwa klastra jest ustawieniem domyślnym klastrowanie metoda.W tym scenariuszu ponieważ każdy przypadek nie musi koniecznie należy do klastra tylko jeden, obsługa w tych modeli może nie zwiększają do 100 procent wszystkich klastrów.

  • PRAWDOPODOBIEŃSTWO
    Wskazuje prawdopodobieństwa dla tego określonego węzła w obrębie całego modelu.

    Ogólnie rzecz biorąc prawdopodobieństwo reprezentuje pomocy technicznej dla określonej wartości, podzielona przez całkowitą liczbę przypadków, w ramach węzła (NODE_SUPPORT).

    Jednak prawdopodobieństwa jest korygowana nieco wyeliminować odchylenia spowodowane przez brak wartości w danych.

    Na przykład jeśli bieżące wartości [Suma elementy podrzędne] "Jeden" i "Druga", należy unikać tworzenia modelu, który przewiduje, że nie jest możliwe, aby mieć nie elementów podrzędnych lub ma trzy elementy podrzędne.W celu zapewnienia, że brakuje wartości improbable, ale nie uniemożliwia, algorytm zawsze dodaje 1 do liczby rzeczywistej wartości żadnych atrybut.

    Przykład:

    Prawdopodobieństwo [dzieci razem = jedna] = [liczba przypadków, gdy suma dzieci jedna =] + 1 / [liczba wszystkich przypadkach] + 3

    Prawdopodobieństwo [dzieci razem = 2] = [liczba przypadków, gdy całkowita dzieci = 2] + 1 / [liczba wszystkich przypadkach] + 3

    Uwaga

    Dostosowanie 3 jest obliczana przez dodanie 1 do całkowitej liczby istniejących wartości n.

    Po dostosowaniu prawdopodobieństw dla wszystkich wartości nadal dodawać do 1.Prawdopodobieństwo dla wartości bez danych (w tym przykładzie [dzieci razem = "Zero", "3" lub pewną inną wartość]), rozpoczyna się na bardzo niskim poziomie różna od zera i zwiększa się powoli podczas dodawania więcej przypadków.

  • ODCHYLENIE
    Wskazuje odchylenie od wartości w węźle.Z definicji odchylenie jest zawsze 0 dla wartości discrete.Jeśli model obsługuje wartości stałe, odchylenie jest obliczana jako Σ (sigma), przy użyciu mianownik nlub liczbę przypadków, w węźle.

    Istnieją dwie definicje ogólny używany do reprezentowania (odchylenie standardoweStDev). Jedną metodę obliczania odchylenia standardowego uwzględnia odchylenia konta, a inna metoda oblicza odchylenie standardowe bez użycia odchylenia.Ogólnie rzecz biorąc algorytmów wyszukiwanie danych firmy Microsoft nie należy używać odchylenia, podczas obliczania odchylenia standardowego.

    Wartość, która pojawia się w tabela NODE_DISTRIBUTION jest rzeczywista wartość dla wszystkich atrybutów discrete i discretized i średniej dla wartości stałe.

  • VALUE_TYPE
    Wskazuje typ danych atrybut lub wartości i użycie wartości.Niektóre typy wartości są stosowane tylko do niektórych typów modeli:

    IDENTYFIKATOR VALUE_TYPE

    Etykieta wartości

    Nazwa typu wartości

    1

    Brak

    Wskazuje, że dane przypadek nie zawiera wartości dla tego atrybut.The Missing state is calculated separately from attributes that have values.

    2

    Istniejące

    Wskazuje, że przypadków dane zawierają wartość tego atrybut.

    3

    Ciągłe

    Wskazuje, że wartość atrybut jest wartością liczbową ciągłe i dlatego może być reprezentowany przez średnią, wraz z wariancji i odchylenia standardowego.

    4

    Discrete

    Wskazuje wartość numeryczną lub tekst, który jest traktowany jako discrete.

    Uwaga   Discrete wartości mogą być również brak; jednak ich są obsługiwane w odmienny sposób podczas obliczeń.Aby uzyskać informacje Zobacz Brak wartości (Analysis Services — wyszukiwanie danych).

    5

    Discretized

    Wskazuje, że atrybut zawiera wartości liczbowe, które mają zostać discretized.Wartość będzie sformatowany ciąg znakowy opisujący pakiety discretization.

    6

    Istniejące

    Indicates that the attribute has continuous numeric values and that values have been supplied in the data, vs.values that are missing or inferred.

    7

    Współczynnik

    Wskazuje wartość liczbową przedstawiającą współczynnik.

    Współczynnik jest wartością, która jest stosowana przy obliczaniu wartości zmiennej zależnej.Na przykład jeśli model tworzy formuły regresja prognozuje dochodu oparte na wiek, współczynnik jest używany w formułę, której dotyczy przychód wieku.

    8

    Wynik zysku

    Wskazuje wartość numeryczną, która reprezentuje wynik zysku dla atrybut.

    9

    Statystyki

    Wskazuje wartość numeryczną, która reprezentuje statystykę listy regressor.

    10

    Unikatowa nazwa węzła

    Wskazuje, że wartość nie powinny być traktowane nie jako numerycznym lub ciąg znaków, ale jako identyfikator unikatowy innego węzła zawartości w modelu.

    Na przykład model sieci neuronowe identyfikatory zawierają wskaźniki z węzłów w warstwie danych wyjściowych do węzłów w ukrytej warstwie i z węzłów w ukrytej warstwie węzły w warstwie wprowadzania.

    11

    Punkt przecięcia z osią

    Wskazuje wartość numeryczną, która reprezentuje punkt przecięcia z osią w formule regresja.

    12

    Okresowość

    Wskazuje, że wartość oznacza okresowej struktury modelu.

    Ma zastosowanie tylko do czas serii modeli, które zawierają model ARIMA.

    NoteNote:
    algorytm serii czasowych firmy Microsoft automatycznie wykrywa okresowej struktury na podstawie danych szkoleniowych.W rezultacie terminy ostateczne modelu może zawierać wartości okresowości, które użytkownik nie dostarczył jako parametr podczas tworzenia modelu.

    13

    Kolejność Autoregressive

    Wskazuje, czy wartość odpowiada liczbie autoregressive serii.

    Stosuje się do czas serii modeli, w których za pomocą algorytmu ARIMA.

    14

    Przenoszenie zamówienia średnia

    Reprezentuje wartość, która reprezentuje liczbę średnich ruchomych w serii.

    Stosuje się do czas serii modeli, w których za pomocą algorytmu ARIMA.

    15

    Różnica zamówienia

    Wskazuje, że reprezentuje wartość wartość, która wskazuje, ile razy z serii numeracji jest zróżnicowana.

    Stosuje się do czas serii modeli, w których za pomocą algorytmu ARIMA.

    16

    Boolean

    Reprezentuje typ logiczny.

    17

    Inne

    Reprezentuje wartość niestandardowe zdefiniowane przez algorytm.

    18

    Ciąg prerendered

    Reprezentuje wartość niestandardowego renderujący algorytm jako ciąg znaków.Formatowanie nie została zastosowana za pomocą modelu obiektów.

    Typy wartości są obliczane na podstawie wyliczenia ADMOMD.NET.Aby uzyskać więcej informacji zobaczMiningValueType.

Wynik węzła

Znaczenie wynik węzła różni się w zależności od typu modelu i mogą być określone dla typu węzła również.Aby uzyskać informacje dotyczące sposobu obliczania NODE_SCORE dla każdego typu modelu i węzłów zobacz Zawartość model wyszukiwania przez typ algorytmu.

Prawdopodobieństwo węzła i prawdopodobieństwo Marginal

Zestaw wierszy schematu model wyszukiwania zawiera kolumny NODE_PROBABILITY i MARGINAL_PROBABILITY dla wszystkich typów modeli.Te kolumny zawierają wartości tylko w węzłach, gdzie znaczenie jest wartość prawdopodobieństwa.Węzeł główny model nigdy nie zawiera na przykład wynik prawdopodobieństwa.

W tych węzłów, które są dostępne wyniki prawdopodobieństwa prawdopodobieństwo węzła i marginalna prawdopodobieństw reprezentują różnych obliczeń.

  • Marginalna prawdopodobieństwa jest prawdopodobieństwo osiągnięcia węzeł ze swojej witryny nadrzędnej.

  • Prawdopodobieństwo węzła jest prawdopodobieństwo osiągnięcia węzła z katalogu głównego.

  • Prawdopodobieństwo węzła jest zawsze mniejsza niż lub równa marginalna prawdopodobieństwa.

Na przykład jeśli zapełnianie wszystkich odbiorców drzewo decyzyjne jest podzielona równo według płci (a nie ma żadnych wartości), prawdopodobieństwo węzły podrzędność powinny być 0,5.Jednak Załóżmy, że każdy z węzłów dla płci jest dzielony równo według poziomu dochodów — wysoki, średni i niski.W takim przypadek wynik MARGINAL_PROBABILITY dla każdego węzła podrzędnego powinien zawsze być.33, ale wartość NODE_PROBABILTY będą produktu prawdopodobieństw wszystkie prowadzące do tego węzła i w ten sposób zawsze mniej niż MARGINAL_PROBABILITY wartości.

Poziom węzła/atrybut i wartości

Marginalna prawdopodobieństwa

Prawdopodobieństwo węzła

Model główny

Wszystkich klientów miejsce docelowe

1

1

Podział według płci klientów miejsce docelowe

.5

.5

Klientów miejsce docelowe podzielić według płci i dzielenie ponownie trzy sposoby przy dochodu

.33

.5 * .33 = .165

Węzeł Zasady i reguły Marginal

Zestaw wierszy schematu model wyszukiwania zawiera także kolumny NODE_RULE i MARGINAL_RULE dla wszystkich typów modelu.Te kolumny zawierają fragmenty XML, które mogą być używane do serializacji modelu lub stanowić część struktury modelu.Kolumny te mogą być puste w przypadku niektórych węzłach, jeśli wartość jest pozbawione sensu.

Są dwa rodzaje reguł XML pod warunkiem, że, podobne do dwóch rodzajów wartości prawdopodobieństwa.Fragment XML w MARGINAL_RULE definiuje atrybut i wartość dla bieżącego węzła należy fragmentu XML w NODE_RULE opisuje ścieżka do bieżącego węzła z modelu głównego.

Powrót do początku

Zawartość model wyszukiwania przez typ algorytmu

Każdy algorytm przechowywane są różnego rodzaju informacje jako część jej zawartości schematu.Na przykład Microsoft Klastrowanie algorytm generuje wiele węzłów podrzędność, z których każdy reprezentuje możliwości klastra. Każdy węzeł klastra zawiera zarówno reguły, które opisują właściwości współużytkowane przez elementy w klastrze.Z drugiej strony Microsoft Algorytm regresja liniowej nie zawiera żadnych węzłów podrzędność; zamiast tego węzła nadrzędnego dla modelu zawiera równanie, które opisuje relację liniowej wykryte przez analizę.

Poniższa tabela zawiera łącza do tematów, dla każdego typu algorytmu.

  • Model zawartości tematów: Wyjaśnienie znaczenia każdego typu węzła dla każdego typu algorytmu i zapewnić wskazówki o tym, które węzły mogą być przydatne większość w typie określonym modelu.

  • Podczas badania tematów: Zawierają przykłady kwerend typu określonego modelu i wskazówki dotyczące interpretacji wyniki.

Algorytm lub typ modelu

Model zawartości

Podczas badania modele wyszukiwania

Skojarzenia modeli reguł

model wyszukiwania Zawartości dla skojarzenia modeli (Analysis Services — wyszukiwanie danych)

Podczas badania model skojarzenia (Analysis Services — wyszukiwanie danych)

Modele klastra

model wyszukiwania Zawartości dla modeli drzewo decyzyjne (Analysis Services — wyszukiwanie danych)

Podczas badania modelu klastrowanie (Analysis Services — wyszukiwanie danych)

Model drzewa decyzji

model wyszukiwania Zawartości dla modeli drzewo decyzyjne (Analysis Services — wyszukiwanie danych)

Podczas badania modelu drzewa decyzji (Analysis Services — wyszukiwanie danych)

Modele regresja liniowej

model wyszukiwania Zawartości dla modeli regresji liniowej (Analysis Services — wyszukiwanie danych)

Podczas badania modelu regresja liniowej (Analysis Services — wyszukiwanie danych)

Modele regresja logistyczne

model wyszukiwania Zawartości dla logistyczne modele regresji (Analysis Services — wyszukiwanie danych)

Podczas badania modelu regresja liniowej (Analysis Services — wyszukiwanie danych)

Modele Naïve Bayes

model wyszukiwania Zawartości dla Naive modele Bayes (Analysis Services — wyszukiwanie danych)

Podczas badania Naive modelu Bayes (Analysis Services — wyszukiwanie danych)

Modele neuronowe sieci

model wyszukiwania Zawartości dla neuronowe modele sieci (Analysis Services — wyszukiwanie danych)

Podczas badania modelu neuronowe sieci (Analysis Services-wyszukiwanie danych)

Sekwencja klastrowanie

Mining Model Content for Sequence Clustering Models (Analysis Services - Data Mining)

Podczas badania sekwencji klastrowanie w modelu (Analysis Services — wyszukiwanie danych)

Modele serii czas

model wyszukiwania Zawartości dla czasu seria modele (Analysis Services — wyszukiwanie danych)

Podczas badania modelu czasu serii (Analysis Services — wyszukiwanie danych)

Narzędzia do przeglądania zawartości model wyszukiwania

Podczas przeglądania lub eksplorowania modelu w Business Intelligence Development Studio, można wyświetlać informacje w Podgląd zawartości drzewa rodzajowa firmy Microsoft, która jest dostępna w obu Business Intelligence Development Studio i SQL Server Management Studio.

The Microsoft Generic Content Viewer displays the columns, rules, properties, attributes, nodes, and other content from the model by using the same information that is available in the content zestaw wierszy schematu of the model wyszukiwania. Zestaw wierszy zawartość schematu jest rodzajowy ramy do prezentowania szczegółowe informacje na temat zawartości model wyszukiwanie danych.Model zawartości można przeglądać w dowolnym klient, który obsługuje hierarchicznych zestawów wierszy.W przeglądarce Business Intelligence Development Studio przedstawia te informacje w podglądzie tabela HTML, reprezentujący wszystkie modele w spójny format, co ułatwia zrozumienie struktury modeli, które tworzysz. Aby uzyskać więcej informacji zobaczWyświetlanie szczegółowe informacje o modelu z podglądem drzewa zawartości rodzajowa firmy Microsoft.

Powrót do początku

Narzędzia do Kwerenda model wyszukiwania zawartości

W celu pobrania zawartości modeli wyszukiwania, należy utworzyć kwerendę przeciwko wyszukiwanie danych modelu.

Najprostszym sposobem utworzenia kwerendy zawartości ma wykonać następującą instrukcję DMX w SQL Server Management Studio:

SELECT * FROM [<mining model name>].CONTENT

Aby uzyskać więcej informacji zobaczPodczas badania modeli wyszukiwania danych (Analysis Services — wyszukiwanie danych).

Za pomocą zestawów wierszy schematu wyszukiwanie danych, wykonać kwerendę model wyszukiwania zawartości.zestaw zestaw wierszy schematu jest standardowy strukturę, której klienci używają do wykrycia, przeglądanie i zbadać informacji o strukturach wyszukiwania i modeli.Zestawy wierszy schematu mogą wysyłać kwerendy za pomocą XMLA, języka Transact-SQL lub DMX instrukcji.

W SQL Server 2008, użytkownik może również uzyskać dostęp informacje zawarte w wyszukiwanie danych zestawów wierszy schematu połączenia z serwerem usług Analysis Services, otwierając i badanie tabele systemowe. Aby uzyskać więcej informacji o korzystaniu z instrukcji SELECT, aby zestawów wierszy kwerendy danych wyszukiwania schematu Zobacz Troubleshooting Tools (Analysis Services - Data Mining).

Powrót do początku