Badanie modelu regresją (Analysis Services - wyszukiwania danych)

Podczas tworzenia kwerendy danych model wyszukiwania, można utworzyć kwerendę zawartości, która zawiera szczegółowe informacje dotyczące wzorców wykryte w analizie, lub można utworzyć kwerendę przewidywanie używa desenie w modelu, aby prognoz przy użyciu nowych danych.

W tej sekcji wyjaśniono, jak tworzyć kwerendy dla modeli, które są oparte na algorytmie regresją Microsoft.

Kwerendy zawartości

Pobieranie parametrów modelu przy użyciu zestawu wierszy schematu wyszukiwania danych

Znajdowanie dodatkowych szczegółów dotyczących modelu przy użyciu DMX

Przewidywania kwerend

Tworzenie prognoz dla wartości stałe

Dokonywania przewidywań dyskretnych wartości

Pobieranie informacji o modelu regresją

Logistyczne regresja modele są tworzone przy użyciu algorytmu sieci neuronowe Microsoft specjalnego zestaw parametrów; Dlatego logistyczne regresja modelu niektóre takie same informacje jak model sieci neuronowe, ale jest mniej skomplikowana.Aby zrozumieć strukturę zawartości modelu i typy węzłów, które przechowują rodzaj informacji, zobacz Model zawartości dla modeli regresją górnictwo (Analysis Services - wyszukiwania danych).

Do śledzenia w scenariuszach kwerendy, można utworzyć logistyczne regresja modelu opisane w poniższej sekcji pośrednie samouczek wyszukiwania danych: Lekcja 5: Tworzenie sieci neuronowe i modele regresją (pośrednie samouczek wyszukiwania danych).

Można również użyć struktura wyszukiwania, Targeted Mailing, z Samouczek wyszukiwania danych podstawowych.

ALTER MINING STRUCTURE [Targeted Mailing]
ADD MINING MODEL [TM_Logistic Regression]
([Customer Key],
[Age],
[Bike Buyer] PREDICT,
[Yearly Income] PREDICT,
[Commute Distance],
[English Education],
Gender,
[House Owner Flag],
[Marital Status],
[Number Cars Owned],
[Number Children At Home],
[Region],
[Total Children]
)
USING Microsoft_Logistic_Regression

Przykładowa kwerenda 1: Pobieranie parametrów modelu przy użyciu zestawu wierszy schematu wyszukiwania danych

Przez badanie zestaw wierszy schematu wyszukiwanie danych, można znaleźć metadane dotyczące modelu, takie jak utworzenia go, gdy model ostatnio został przetworzony, nazwa struktura wyszukiwania że zależy od modelu i nazwę kolumna używane jako atrybut przewidywalne.Poniższy przykład zwraca parametry, które były używane podczas modelu została utworzona, wraz z nazwa i typ modelu, i data, która została utworzona.

SELECT MODEL_NAME, SERVICE_NAME, DATE_CREATED, MINING_PARAMETERS 
FROM $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'Call Center_LR'

Przykładowe wyniki:

NAZWA_MODELU

SERVICE_NAME

DATE_CREATED

MINING_PARAMETERS

Wywołanie Center_LR

Microsoft_Logistic_Regression

04/07/2009 20:38:33

HOLDOUT_PERCENTAGE = 30, HOLDOUT_SEED = 1, MAXIMUM_INPUT_ATTRIBUTES = 255, MAXIMUM_OUTPUT_ATTRIBUTES = 255, MAXIMUM_STATES = 100 SAMPLE_SIZE = 10000

Powrót do początku

Przykładowa kwerenda 2: Znajdowanie dodatkowych szczegółów dotyczących modelu przy użyciu DMX

Następująca kwerenda zwraca niektóre podstawowe informacje o logistyczne regresja modelu.Logistyczne regresja modelu przypomina model sieci neuronowe na wiele sposobów, w tym obecność węzeł Statystyka kredytu marginalnego (NODE_TYPE = 24), który opisuje wartości wykorzystanych jako nakłady.Ta przykładowa kwerenda używa modelu ukierunkowanych korespondencji i pobiera wartości nakładów, pobierając je z tabela zagnieżdżonej NODE_DISTRIBUTION.

SELECT FLATTENED NODE_DISTRIBUTION AS t
FROM [TM_Logistic Regression].CONTENT 

Wyniki częściowe:

t.ATTRIBUTE_NAME

t.ATTRIBUTE_VALUE

t.support

t.PROBABILITY

t.VARIANCE

t.VALUETYPE

Wiek

Brak

0

0

0

1

Wiek

45.43491192

17484

1

126.9544114

3

Kupujący Bike

Brak

0

0

0

1

Kupujący Bike

0

8869

0.507263784

0

4

Kupujący Bike

1

8615

0.492736216

0

4

Wrócić odległość

Brak

0

0

0

1

Wrócić odległość

5-10 Mil

3033

0.173472889

0

4

Rzeczywiste kwerenda zwraca wiele więcej wierszy; Jednak ten ilustruje rodzaj dostarczonych informacji dotyczących nakładów.Dyskretne produkcji każda możliwa wartość znajduje się w tabela.Ciągłe wartości takich jak wejść Age, pełna lista jest niemożliwe, więc dane wejściowe jest discretized jako średnia.Aby uzyskać więcej informacji dotyczących sposobów korzystania z informacji w węźle marginalny statystyki, zobacz Model zawartości dla modeli regresją górnictwo (Analysis Services - wyszukiwania danych).

Ostrzeżenie

Wyniki została spłaszczona dla ich łatwiejszego oglądania, ale tabela zagnieżdżonej można powrócić w jednym kolumna Jeśli dostawca obsługuje hierarchicznych zestawów wierszy.Aby uzyskać więcej informacji, zobacz Hierarchicznych zestawów wierszy w OLE DB Programmer's Guide.

Powrót do początku

Kwerendy przewidywania dotyczące modelu regresją

Można użyć Przewidywanie (DMX) funkcja z każdego rodzaju z model wyszukiwania do nowych danych do modelu udostępniają i prognoz w oparciu o nowe wartości.Za pomocą funkcji zwraca dodatkowe informacje dotyczące przewidywanie, takie jak prawdopodobieństwo, że przewidywanie jest poprawny.Ta sekcja zawiera niektóre przykłady kwerend przewidywanie logistyczne regresja modelu.

Przykładowa kwerenda 3: Tworzenie prognoz dla wartości stałe

Ponieważ logistyczne regresja obsługuje ciągły atrybutów dla obu wejściowe i przewidywania, łatwo jest tworzyć modele skorelować różnych czynników w danych.przewidywanie kwerendy można eksplorować relację między tymi czynnikami.

Następujące przykładowe kwerendy jest oparty na modelu Centrum rozmowy z samouczka pośrednie i tworzy kwerendę singleton, która przewiduje klasy usługa shift piątek AM.predicthistogram (dmx) funkcja zwraca zagnieżdżoną tabela, która zapewnia odpowiednie zrozumienie ważności prognozowanej wartości statystyki.

SELECT
  Predict([Call Center_LR].[Service Grade]) as Predicted ServiceGrade,
  PredictHistogram([Call Center_LR].[Service Grade]) as [Results],
FROM
  [Call Center_LR]
NATURAL PREDICTION JOIN
(SELECT 'Friday' AS [Day Of Week],
  'AM' AS [Shift]) AS t

Przykładowe wyniki:

Przewidywane jakości usługi

Wyniki

0.102601830123659

Klasa usługOBSŁUGA $PRAWDOPODOBIEŃSTWO $$ADJUSTEDPROBABILITYODCHYLENIE $FUNKCJA ODCH.STANDARDOWE $
0.10260183012365983.02325581395350.98837209302325600.001205526606000870.034720694203902
0.9767441860465120.01162790697674420.011627906976744200

Aby uzyskać więcej informacji na temat prawdopodobieństwa, obsługę i odchylenie standardowe wartości w tabela zagnieżdżonej NODE_DISTRIBUTION, zobacz Model zawartości dla modeli regresją górnictwo (Analysis Services - wyszukiwania danych).

Powrót do początku

Przykładowa kwerenda 4: Dokonywania przewidywań dyskretnych wartości

Logistyczne regresja jest zazwyczaj używany w scenariuszach miejsce analizowanie czynników, które przyczyniają się do wyniku binarny.Chociaż model używany w samouczku Prognozuje wartości ciągłego, ServiceGrade, w rzeczywistym scenariuszu warto zestaw model przewidzieć, czy klasa usługa spełnione niektóre discretized wartości miejsce docelowe.Alternatywnie można wyjściowe prognoz używanie ciągłej wartości, ale później pogrupować przewidywanych wyników w dobrej, targów lub niska.

Poniższy przykład ilustruje sposób zmienić sposób zgrupowaniem przewidywalne atrybut.W tym celu utworzyć kopię struktury górnictwa i następnie zmienić metoda discretization miejsce docelowe kolumny tak, aby wartości są zgrupowane zamiast ciągłe.

W poniższej procedurze opisano, jak zmienić grupowanie Service Grade wartości wywołania centrum danych.

Aby utworzyć discretized wersja struktura wyszukiwania Centrum obsługi telefonicznej i modeli

  1. W Business Intelligence Development Studio w oknie Solution Explorer rozwiń Górnictwa struktur.

  2. Kliknij prawym przyciskiem myszy Call Center.dmm i wybierz kopię.

  3. Kliknij prawym przyciskiem myszy Górnictwa struktur i wybierz Wklej.Nowy struktura wyszukiwania dodane iss, o nazwie Call Center 1.

  4. Kliknij prawym przyciskiem myszy nowy struktura wyszukiwania i wybierz nazwy.Wpisz nową nazwę wywołania Discretized Center.

  5. Kliknij dwukrotnie nowy struktura wyszukiwania , aby go otworzyć projektanta.Należy zauważyć, że modeli wyszukiwania wszystkich zostały skopiowane także i wszystkie mają rozszerzenie 1.Pozostaw nazw jest teraz.

  6. W Struktury górnictwa kartę, kliknij prawym przyciskiem myszy kolumna dla Service Gradei wybierz Właściwości.

  7. Zmień Content właściwość z ciągłe do Discretized.Zmień DiscretizationMethod Właściwość klastrów.BucketCount Discretization wpisz 3.

    Ostrzeżenie

    Parametry te właśnie są używane do ilustrowania procesu i nie wytwarzają niekoniecznie prawidłowy model

  8. Z Górnictwa modelu menu wybierz struktury proces i wszystkie modele.

W następującej kwerendzie przykładowej jest oparty na modelu discretized i prognozuje klasy usługa na określony dzień tygodnia, prawdopodobieństwa dla każdego przewidywanego wyniku.

SELECT
  (PredictHistogram([Call Center_LR 1].[Service Grade])) as [Predictions]
FROM
  [Call Center_LR 1]
NATURAL PREDICTION JOIN
(SELECT 'Saturday' AS [Day Of Week]) AS t  

Oczekiwane wyniki:

Prognoz

Klasa usługOBSŁUGA $PRAWDOPODOBIEŃSTWO $$ADJUSTEDPROBABILITYODCHYLENIE $FUNKCJA ODCH.STANDARDOWE $
0.1087271838312535.72465047706410.4252934580602870.017016836003029300
0.0585576923062531.70988808007030.3774986676198850.02088202006045400
0.17016949152515.61091598832020.1858442379561920.066138657138604900
0.9545454545454550.01136363636363640.011363636363636400

Należy zauważyć, że przewidywane wyniki zostały zgrupowane w trzech kategoriach określone; Jednakże te grupy są oparte na klastrowanie wartości rzeczywistych danych nie dowolne wartości, które zestaw jako cele biznesowe.

Powrót do początku

Lista funkcje prognozowania

Wszystkie Microsoft obsługę algorytmów wspólny zestaw funkcji.Jednakże Microsoft algorytm regresją obsługuje dodatkowe funkcje wymienione w poniższej tabela.

Aby uzyskać listę funkcji, które są wspólne dla wszystkich Microsoft algorytmy, zobacz Mapowanie funkcji kwerendy typów (DMX).Aby składni określonych funkcji, zobacz Odwołanie do funkcji rozszerzenia górnictwa (DMX) danych.

Ostrzeżenie

Dla sieci neuronowe i modeli regresją PredictSupport (DMX) funkcja zwraca pojedynczą wartość, która reprezentuje rozmiar szkolenia zestaw dla całego modelu.