Artykuł
07/22/2011

Badanie modelu regresją (Analysis Services - wyszukiwania danych)

Podczas tworzenia kwerendy danych model wyszukiwania, można utworzyć kwerendę zawartości, która zawiera szczegółowe informacje dotyczące wzorców wykryte w analizie, lub można utworzyć kwerendę przewidywanie używa desenie w modelu, aby prognoz przy użyciu nowych danych.

W tej sekcji wyjaśniono, jak tworzyć kwerendy dla modeli, które są oparte na algorytmie regresją Microsoft.

Kwerendy zawartości

Pobieranie parametrów modelu przy użyciu zestawu wierszy schematu wyszukiwania danych

Znajdowanie dodatkowych szczegółów dotyczących modelu przy użyciu DMX

Przewidywania kwerend

Tworzenie prognoz dla wartości stałe

Dokonywania przewidywań dyskretnych wartości

Pobieranie informacji o modelu regresją

Logistyczne regresja modele są tworzone przy użyciu algorytmu sieci neuronowe Microsoft specjalnego zestaw parametrów; Dlatego logistyczne regresja modelu niektóre takie same informacje jak model sieci neuronowe, ale jest mniej skomplikowana.Aby zrozumieć strukturę zawartości modelu i typy węzłów, które przechowują rodzaj informacji, zobacz Model zawartości dla modeli regresją górnictwo (Analysis Services - wyszukiwania danych).

Do śledzenia w scenariuszach kwerendy, można utworzyć logistyczne regresja modelu opisane w poniższej sekcji pośrednie samouczek wyszukiwania danych: Lekcja 5: Tworzenie sieci neuronowe i modele regresją (pośrednie samouczek wyszukiwania danych).

Można również użyć struktura wyszukiwania, Targeted Mailing, z Samouczek wyszukiwania danych podstawowych.

ALTER MINING STRUCTURE [Targeted Mailing]
ADD MINING MODEL [TM_Logistic Regression]
([Customer Key],
[Age],
[Bike Buyer] PREDICT,
[Yearly Income] PREDICT,
[Commute Distance],
[English Education],
Gender,
[House Owner Flag],
[Marital Status],
[Number Cars Owned],
[Number Children At Home],
[Region],
[Total Children]
)
USING Microsoft_Logistic_Regression

Przykładowa kwerenda 1: Pobieranie parametrów modelu przy użyciu zestawu wierszy schematu wyszukiwania danych

Przez badanie zestaw wierszy schematu wyszukiwanie danych, można znaleźć metadane dotyczące modelu, takie jak utworzenia go, gdy model ostatnio został przetworzony, nazwa struktura wyszukiwania że zależy od modelu i nazwę kolumna używane jako atrybut przewidywalne.Poniższy przykład zwraca parametry, które były używane podczas modelu została utworzona, wraz z nazwa i typ modelu, i data, która została utworzona.

SELECT MODEL_NAME, SERVICE_NAME, DATE_CREATED, MINING_PARAMETERS 
FROM $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'Call Center_LR'

Przykładowe wyniki:

NAZWA_MODELU	SERVICE_NAME	DATE_CREATED	MINING_PARAMETERS
Wywołanie Center_LR	Microsoft_Logistic_Regression	04/07/2009 20:38:33	HOLDOUT_PERCENTAGE = 30, HOLDOUT_SEED = 1, MAXIMUM_INPUT_ATTRIBUTES = 255, MAXIMUM_OUTPUT_ATTRIBUTES = 255, MAXIMUM_STATES = 100 SAMPLE_SIZE = 10000

Powrót do początku

Przykładowa kwerenda 2: Znajdowanie dodatkowych szczegółów dotyczących modelu przy użyciu DMX

Następująca kwerenda zwraca niektóre podstawowe informacje o logistyczne regresja modelu.Logistyczne regresja modelu przypomina model sieci neuronowe na wiele sposobów, w tym obecność węzeł Statystyka kredytu marginalnego (NODE_TYPE = 24), który opisuje wartości wykorzystanych jako nakłady.Ta przykładowa kwerenda używa modelu ukierunkowanych korespondencji i pobiera wartości nakładów, pobierając je z tabela zagnieżdżonej NODE_DISTRIBUTION.

SELECT FLATTENED NODE_DISTRIBUTION AS t
FROM [TM_Logistic Regression].CONTENT

Wyniki częściowe:

t.ATTRIBUTE_NAME	t.ATTRIBUTE_VALUE	t.support	t.PROBABILITY	t.VARIANCE	t.VALUETYPE
Wiek	Brak	0	0	0	1
Wiek	45.43491192	17484	1	126.9544114	3
Kupujący Bike	Brak	0	0	0	1
Kupujący Bike	0	8869	0.507263784	0	4
Kupujący Bike	1	8615	0.492736216	0	4
Wrócić odległość	Brak	0	0	0	1
Wrócić odległość	5-10 Mil	3033	0.173472889	0	4

Rzeczywiste kwerenda zwraca wiele więcej wierszy; Jednak ten ilustruje rodzaj dostarczonych informacji dotyczących nakładów.Dyskretne produkcji każda możliwa wartość znajduje się w tabela.Ciągłe wartości takich jak wejść Age, pełna lista jest niemożliwe, więc dane wejściowe jest discretized jako średnia.Aby uzyskać więcej informacji dotyczących sposobów korzystania z informacji w węźle marginalny statystyki, zobacz Model zawartości dla modeli regresją górnictwo (Analysis Services - wyszukiwania danych).

Ostrzeżenie

Wyniki została spłaszczona dla ich łatwiejszego oglądania, ale tabela zagnieżdżonej można powrócić w jednym kolumna Jeśli dostawca obsługuje hierarchicznych zestawów wierszy.Aby uzyskać więcej informacji, zobacz Hierarchicznych zestawów wierszy w OLE DB Programmer's Guide.

Powrót do początku

Kwerendy przewidywania dotyczące modelu regresją

Można użyć Przewidywanie (DMX) funkcja z każdego rodzaju z model wyszukiwania do nowych danych do modelu udostępniają i prognoz w oparciu o nowe wartości.Za pomocą funkcji zwraca dodatkowe informacje dotyczące przewidywanie, takie jak prawdopodobieństwo, że przewidywanie jest poprawny.Ta sekcja zawiera niektóre przykłady kwerend przewidywanie logistyczne regresja modelu.

Przykładowa kwerenda 3: Tworzenie prognoz dla wartości stałe

Ponieważ logistyczne regresja obsługuje ciągły atrybutów dla obu wejściowe i przewidywania, łatwo jest tworzyć modele skorelować różnych czynników w danych.przewidywanie kwerendy można eksplorować relację między tymi czynnikami.

Następujące przykładowe kwerendy jest oparty na modelu Centrum rozmowy z samouczka pośrednie i tworzy kwerendę singleton, która przewiduje klasy usługa shift piątek AM.predicthistogram (dmx) funkcja zwraca zagnieżdżoną tabela, która zapewnia odpowiednie zrozumienie ważności prognozowanej wartości statystyki.

SELECT
  Predict([Call Center_LR].[Service Grade]) as Predicted ServiceGrade,
  PredictHistogram([Call Center_LR].[Service Grade]) as [Results],
FROM
  [Call Center_LR]
NATURAL PREDICTION JOIN
(SELECT 'Friday' AS [Day Of Week],
  'AM' AS [Shift]) AS t

Przykładowe wyniki:

Przewidywane jakości usługi	Wyniki
0.102601830123659	Klasa usługOBSŁUGA $PRAWDOPODOBIEŃSTWO $$ADJUSTEDPROBABILITYODCHYLENIE $FUNKCJA ODCH.STANDARDOWE $ 0.10260183012365983.02325581395350.98837209302325600.001205526606000870.034720694203902 0.9767441860465120.01162790697674420.011627906976744200

Aby uzyskać więcej informacji na temat prawdopodobieństwa, obsługę i odchylenie standardowe wartości w tabela zagnieżdżonej NODE_DISTRIBUTION, zobacz Model zawartości dla modeli regresją górnictwo (Analysis Services - wyszukiwania danych).

Powrót do początku

Przykładowa kwerenda 4: Dokonywania przewidywań dyskretnych wartości

Logistyczne regresja jest zazwyczaj używany w scenariuszach miejsce analizowanie czynników, które przyczyniają się do wyniku binarny.Chociaż model używany w samouczku Prognozuje wartości ciągłego, ServiceGrade, w rzeczywistym scenariuszu warto zestaw model przewidzieć, czy klasa usługa spełnione niektóre discretized wartości miejsce docelowe.Alternatywnie można wyjściowe prognoz używanie ciągłej wartości, ale później pogrupować przewidywanych wyników w dobrej, targów lub niska.

Poniższy przykład ilustruje sposób zmienić sposób zgrupowaniem przewidywalne atrybut.W tym celu utworzyć kopię struktury górnictwa i następnie zmienić metoda discretization miejsce docelowe kolumny tak, aby wartości są zgrupowane zamiast ciągłe.

W poniższej procedurze opisano, jak zmienić grupowanie Service Grade wartości wywołania centrum danych.

Aby utworzyć discretized wersja struktura wyszukiwania Centrum obsługi telefonicznej i modeli

W Business Intelligence Development Studio w oknie Solution Explorer rozwiń Górnictwa struktur.
Kliknij prawym przyciskiem myszy Call Center.dmm i wybierz kopię.
Kliknij prawym przyciskiem myszy Górnictwa struktur i wybierz Wklej.Nowy struktura wyszukiwania dodane iss, o nazwie Call Center 1.
Kliknij prawym przyciskiem myszy nowy struktura wyszukiwania i wybierz nazwy.Wpisz nową nazwę wywołania Discretized Center.
Kliknij dwukrotnie nowy struktura wyszukiwania , aby go otworzyć projektanta.Należy zauważyć, że modeli wyszukiwania wszystkich zostały skopiowane także i wszystkie mają rozszerzenie 1.Pozostaw nazw jest teraz.
W Struktury górnictwa kartę, kliknij prawym przyciskiem myszy kolumna dla Service Gradei wybierz Właściwości.
Zmień Content właściwość z ciągłe do Discretized.Zmień DiscretizationMethod Właściwość klastrów.BucketCount Discretization wpisz 3.

Ostrzeżenie

Parametry te właśnie są używane do ilustrowania procesu i nie wytwarzają niekoniecznie prawidłowy model
Z Górnictwa modelu menu wybierz struktury proces i wszystkie modele.

W następującej kwerendzie przykładowej jest oparty na modelu discretized i prognozuje klasy usługa na określony dzień tygodnia, prawdopodobieństwa dla każdego przewidywanego wyniku.

SELECT
  (PredictHistogram([Call Center_LR 1].[Service Grade])) as [Predictions]
FROM
  [Call Center_LR 1]
NATURAL PREDICTION JOIN
(SELECT 'Saturday' AS [Day Of Week]) AS t

Oczekiwane wyniki:

Prognoz
Klasa usługOBSŁUGA $PRAWDOPODOBIEŃSTWO $$ADJUSTEDPROBABILITYODCHYLENIE $FUNKCJA ODCH.STANDARDOWE $ 0.1087271838312535.72465047706410.4252934580602870.017016836003029300 0.0585576923062531.70988808007030.3774986676198850.02088202006045400 0.17016949152515.61091598832020.1858442379561920.066138657138604900 0.9545454545454550.01136363636363640.011363636363636400

Należy zauważyć, że przewidywane wyniki zostały zgrupowane w trzech kategoriach określone; Jednakże te grupy są oparte na klastrowanie wartości rzeczywistych danych nie dowolne wartości, które zestaw jako cele biznesowe.

Powrót do początku

Lista funkcje prognozowania

Wszystkie Microsoft obsługę algorytmów wspólny zestaw funkcji.Jednakże Microsoft algorytm regresją obsługuje dodatkowe funkcje wymienione w poniższej tabela.

IsDescendant (DMX)	PredictStdev (DMX)
PredictAdjustedProbability (DMX)	PredictSupport (DMX)
PredictHistogram (DMX)	PredictVariance (DMX)
PredictProbability (DMX)

Aby uzyskać listę funkcji, które są wspólne dla wszystkich Microsoft algorytmy, zobacz Mapowanie funkcji kwerendy typów (DMX).Aby składni określonych funkcji, zobacz Odwołanie do funkcji rozszerzenia górnictwa (DMX) danych.

Ostrzeżenie

Dla sieci neuronowe i modeli regresją PredictSupport (DMX) funkcja zwraca pojedynczą wartość, która reprezentuje rozmiar szkolenia zestaw dla całego modelu.