Udostępnij za pośrednictwem


Pomiar dokładności modelu górnictwa (Analysis Services - wyszukiwania danych)

SQL Server Usługi Analysis Services provides a variety of ways to determine whether your mining models are accurate.

  • Wykresy można użyć do wizualnego reprezentowania dokładności danych model wyszukiwania: A wykres przyrostu porównuje dokładności prognoz każdego modelu.A wykres zysków Wyświetla teoretyczne zwiększenia zysku, który jest skojarzony z za pomocą każdego modelu.A wykresu punktowego porównuje wartości rzeczywiste przeciwko przewidywane wartości i jest używany dla modeli regresja lub innych modeli, które przewidywania ciągłego atrybutów za pomocą ciągłego nakładów.

  • Można użyć macierzy klasyfikacji do przy przechodzeniu do przewidywania dokładne i niedokładne.

  • Można użyć krzyżowo do statystycznie sprawdzania wiarygodności na model wyszukiwania.

Aby uzyskać więcej informacji, zobacz Narzędzia do tworzenia wykresów dokładności modelu (Analysis Services - wyszukiwania danych).Wszystkie typy wykresów, opisane w tym temacie można także tworzyć programowo za pomocą XML/A lub AMO.Aby uzyskać więcej informacji na temat programowania Usługi Analysis Services rozwiązań, zobacz Developer's Guide (Analysis Services - wyszukiwania danych).

Ostrzeżenie

Po określeniu, że model jest dokładnych, należy ocenić wyniki modelu w kontekście problem w biznesie model został zaprojektowany do odpowiedzi.

W tym temacie wyjaśniono ogólny obieg w Business Intelligence Development Studio lub SQL Server Management Studio Dokładność pomiaru model wyszukiwania.W zależności od typu model wyszukiwania że używasz wybierz wykres, niektóre opcje mogą być nieco inny, niedostępne lub skonfigurowanych domyślnie, ale proces jest następująca:

  1. Wybierz model lub struktury do testowania.

  2. Wybierz dane z badań.

  3. Opcjonalnie można filtrować dane z badań.

  4. Wybierz typ wykresu i otworzyć go w podglądzie właściwe.

  5. Opcjonalnie Dostosuj wykres.

Procedura krok po kroku, zobacz Jak Tworzenie wykresu dokładności modelu górnictwo.

Wybieranie modelu lub struktury

It is common practice to build several data mining models for each data mining structure, and for each model to use a different algorithm or set of parameters.Usługi Analysis Services makes it easy to test multiple related mining models in the same chart.Jednak również można wybrać tylko jeden model wyszukiwania danych wyjściowych na wykresie dokładności.

W Business Intelligence Development Studio, możesz wybrać struktura wyszukiwania , a następnie kliknij przycisk Górnictwa wykresu dokładność kartę, aby otworzyć obszar projektowania wykresów dokładności.W SQL Server Management Studio, prawym przyciskiem myszy struktura wyszukiwania , a następnie wybierz Widok wykresu Unieś Otwórz obszar tego samego projektu i utworzyć dowolny rodzaj wykresu dokładności.

Jeśli wiele modeli wyszukiwania można dodać do wykresu, należy wybrać modeli wyszukiwania, które mają ten sam atrybut przewidywalne.Jeśli tworzysz wykres przyrostu, wykres zysków, wykres punktowy lub klasyfikacji macierzy można wybrać, które modele do wykresu za pomocą Zaznaczenie wprowadzania kartę.Jednakże jeśli tworzysz krzyżowe sprawdzanie poprawności raportu, Usługi Analysis Services będzie analizować wszystkich modeli, które mają ten sam atrybut przewidywalne.

Wybieranie danych testowych

Przed utworzeniem wykresu dźwigu, wykres zysków, lub wykres punktowy, należy określić dane, który będzie używany do oceny modelu.Because the data that you use for evaluation greatly affects the results of evaluation, SQL Server 2008 Usługi Analysis Services provides the following options for specifying test data:

  • Przy użyciu partycji wstrzymanie, który został zdefiniowany jako test zestaw podczas tworzenia danych struktura wyszukiwania.Przy użyciu części struktura wyszukiwania danych jako dane testowe można zmierzyć wszystkie modele w strukturze konsekwentnie.

  • Określanie zewnętrznego źródło danych jako dane z badań.

  • Określanie zewnętrznego źródło danych oraz stosowanie filtrów do ograniczania danych do odpowiedniego podzbiór przypadkach.Definiując filtr, można wybrać dane z badań, która spełnia szczególne warunki lub zawiera sprawy, które są przedmiotem szczególnego zainteresowania.

  • Za pomocą filtr zastosowany do przypadków szkolenia używane przez model.Definiując filtr modelu, można ograniczyć przypadkach do podzbiór danych i zapewnienia, że określonego modelu zawsze jest oceniany przy użyciu podobnych danych.

Jeśli tworzysz krzyżowe sprawdzanie poprawności raport w Business Intelligence Development Studio lub SQL Server Management Studio, domyślnie Usługi Analysis Services używa partycji wstrzymanie zdefiniowane dla modelu, jeśli taka istnieje.Jeśli zdefiniowano żadnej partycji wstrzymanie Usługi Analysis Services używa całego zestaw przypadków szkolenia.

Jeśli tworzysz wykres przyrostu, wykres zysków, wykres punktowy lub klasyfikacji macierzy w Business Intelligence Development Studio lub SQL Server Management Studio, używasz Karcie zaznaczenia wejście w widoku Wykres dokładności górnictwo projektanta górnictwo danych, aby określić dane, które mają być używane do testowania modeli wyszukiwania.Dostępne są następujące opcje:

Użyj model wyszukiwania testów

Górnictwo modelu badania przypadków są pobierane z tych samych danych, który jest w struktura wyszukiwania, ale filtr jest stosowany do modelu, aby ograniczyć przypadkach używanych do testowania.Filtr modelu jest zestaw warunków, które można utworzyć, a następnie przechowywać wraz z model wyszukiwania.Ponieważ warunku filtr jest zapisywany z model wyszukiwania, jest stosowane domyślnie, gdy szkolić modelu.Podczas testowania modelu można użyć filtru jest lub można użyć zestaw danych do testowania i tym samym ominąć filtr modelu.Jeśli chcesz zmienić filtr, który jest stosowany do model wyszukiwania, można zmodyfikować filtr modelu i ponowne przetworzenie modelu.Alternatywnie można utworzyć kopię modelu i następnie utworzyć inny filtr na kopii.

Aby uzyskać więcej informacji o filtrach modelu, zobacz Tworzenie filtrów dla modeli wyszukiwania (Analysis Services - wyszukiwania danych).

Opis sposobu tworzenia filtru na model wyszukiwania, zobacz Jak Zastosować filtr do modelu górnictwo.

struktura wyszukiwania test przypadkami użycia

Ta opcja umożliwia pomiar dokładności, jeśli zdefiniowano zestaw testowania danych podczas tworzenia struktura wyszukiwania, definiując wstrzymanie procent lub maksymalna liczba przypadków dla wstrzymanie.Definicja zestaw testów przechowywana jest ze struktury.Dlatego też testowania zestaw można używać z dowolnego modelu, który jest oparty na strukturze.

Ostrzeżenie

Nie można utworzyć filtr bezpośrednio na struktura wyszukiwania wstrzymanie danych.Jednakże jeśli chcesz filtrować te dane jako rozwiązanie alternatywne, użytkownik może ponownie użyć oryginalnego widok źródło danych jako zewnętrzne dane źródłowe, a następnie zastosować filtr do zewnętrznego źródło danych.

Aby uzyskać więcej informacji, zobacz Partycjonowanie danych do szkolenia i testowania zestawy (Analysis Services - wyszukiwania danych).

Określić inny zestaw danych

W SQL Server 2005, jedynym sposobem sprawdzenia dokładności model wyszukiwania było użyć zestaw danych zewnętrznych.Ta opcja jest nadal dostępna w SQL Server 2008, ale teraz można także zdefiniować filtr na danych zewnętrznych.

Aby używać zewnętrznego źródło danych, musi być zmapowana kolumny z danych zewnętrznych, który chcesz użyć dla wprowadzania kolumn w model wyszukiwania.Można zignorować niektórych kolumn, ale zewnętrznego zestaw danych musi zawierać co najmniej jedną kolumna, które mogą być mapowane do przewidywalna kolumna w modelu górniczych.W zależności od modelu może być również konieczne mapowanie kolumna lub kolumn danych zewnętrznych, które mają atrybuty wymagane do przewidywanie.

W projektancie wyszukiwania danych, użyj Wejściowych zaznaczanie kartę i Określić mapowanie kolumny okno dialogowe, aby zaznaczyć tabela wejściowych, które wzory mają być sprawdzana.Po wybraniu wejścia tabela, kolumn w tabelach Struktury górnictwa i Zaznacz tabele wprowadzania są automatycznie mapowane razem.Mapowania można zmodyfikować, klikając kolumna w Struktury górnictwa tabela i przeciągając go do Zaznacz tabele wprowadzania tabela.Jeśli dane wejściowe zawiera zagnieżdżoną tabela, można także dołączyć tę tabela za pomocą Wybierz tabela zagnieżdżoną łącze.

Ostrzeżenie

przewidywalna kolumna Musi być zawsze mapowany.Kolumny, które są mapowane nie są karmione jako wartości NULL do model wyszukiwania.

Po zmapowano odpowiednich kolumn, można opcjonalnie określić stan miejsce docelowe dla przewidywalna kolumna.Jeśli pozostawisz stanu przewidywalna kolumna jak model wykonuje niezależnie od stanu puste, prognozuje wykresu dźwigu przewidywalna kolumna.Aby uzyskać więcej informacji o różnicach między tworzenie Unieś wykresy z lub bez określonego stanu przewidywalna kolumna, zobacz Unieś wykresu (Analysis Services - wyszukiwania danych).

Istnieje również możliwość utworzenia filtru na danych zewnętrznych.Opis sposobu tworzenia filtru, zobacz Jak Filtrowanie wierszy danych wejściowych dla wykresu dokładności.

Zsynchronizować kolumn przewidywania i wartości opcji współrzędne przewidywalne atrybutów w danych zewnętrznych źródło i modelu górnictwo tak, że nawet jeśli mają różne nazwy pochodzą z tej samej przewidywalna kolumna podczas szkolenia modelu.Jest to przydatne, gdy masz dwie struktura wyszukiwania kolumny, które wskazują na tych samych danych źródłowych, ale prawdopodobnie kolumny są oznaczane etykietami inaczej.

Jeśli wyczyścisz zsynchronizować kolumn przewidywania i wartości pole wyboru można wybrać prawidłowy w każdym przewidywalna kolumna i wartość, a wyniki są wykreślane razem, nawet jeżeli wyniki nie sensu.Może wyczyścić tę opcję, jeśli chcesz porównać dwa przewidywalne atrybuty, które nie są jawnie mapowane na ten sam zestaw wartości.Jednak należy pamiętać, że dwa atrybuty nie mogą być porównywalne pod względem dokładności.Na przykład model discretizes dochodu w wiadrach jako wysoki, środkowy i niski, może być porównywalne do modelu, który grupuje dochodu w zakresach 150,000 + 50 000-100 000 i 10 000-50 000.Jednak przed wyczyść pole wyboru, należy się upewnić, że atrybuty są porównywalne.

Aby uzyskać więcej informacji:Jak Zaznacz kolumnę przewidywalny dla wykresu dokładności, Korzystanie z narzędzi wyszukiwania danych

Filtrowanie danych

Można filtrować dane używane do szkolić i testowania danych model wyszukiwania w następujący sposób:

  • Tworzenie filtru, który jest przechowywany z modelem.

  • Zastosować filtr do zewnętrznego źródło danych.

Podczas definiowania filtru zasadniczo tworzenia klauzula WHERE dla przychodzących danych.Jeżeli filtrujesz wprowadzania zestaw danych używane do oceny modelu wyrażenie filtru jest tłumaczony na Transact-SQL instrukcja i stosowane do wprowadzania tabela podczas tworzenia wykresu.W wyniku liczbę przypadków, badanie można znacznie zmniejszyć.

Natomiast po zastosowaniu filtru do model wyszukiwania, wyrażenie filtru utworzony jest tłumaczony na instrukcja danych górnictwa rozszerzenia (DMX) i stosowane do pojedynczych modelu.Jeśli zastosujesz filtr do modelu podzbiór oryginalnych danych jest używany do szkolić modelu.Jeśli zdefiniowano zestaw testowania danych podczas tworzenia struktury, przypadkach model używany dla szkolenia obejmują jedynie przypadki, w struktura wyszukiwania zestaw szkoleniowy, które spełniają warunki filtru.Ponadto, gdy zostanie wybrana opcja przypadków badania modelu górnictwo użycia, przypadkach badania obejmują jedynie przypadki, w struktura wyszukiwania badania zestaw i spełniają warunki filtru.Warunki filtra stosuje się również do przeglądanie szczegółowe kwerendy w przypadkach modelu.

Jednakże jeśli nie zdefiniowano dane wstrzymania ustawiony, przypadkach modelu używanych do testowania dołączyć wszystkich przypadkach zestaw danych, które spełniają warunki filtru.

W związku z tym, wiele modeli, nawet jeśli oparte na tym samym struktura wyszukiwania, mogą mieć różne filtry i w wyniku ich używać różnych danych dla kształcenia i testowania.Jeśli zostanie wybrana opcja Użycie model wyszukiwania testów podczas tworzenia wykresu dokładności powinien realizować, że całkowita liczba przypadków zarówno badania i szkolenia zestawy mogą różnić się znacznie między modelami testowanego.

Ostrzeżenie

Jeśli filtr zostanie dodany do istniejącego model wyszukiwania, lub zmiany warunków filtru, należy ponownie przetworzyć model wyszukiwania aby zobaczyć efekty filtra.

Aby przeglądać sprawy rzeczywiste szkolenia, które były używane, można utworzyć kwerendy zawartości DMX, takie jak:

SELECT * from <model>.CASES WHERE IsTrainingCase()

lub:

SELECT * from <model>.CASES WHERE IsTestCase()

Aby porównać te przypadki przypadków w strukturze, utwórz następujące kwerendy zawartości DMX:

SELECT * FROM <structure>.CASES WHERE IsTestCase()

Ostrzeżenie

Aby uruchomić kwerendę zawartości w przypadkach modelu, należy włączyć Drillthrough na modelu.

Aby uzyskać informacje dotyczące rodzajów można zastosować filtry i sposób wyznaczania wartości wyrażeń filtru, zobacz Wzór filtr składnię i przykłady (Analysis Services - wyszukiwania danych).

Wybieranie typu wykresu i wyświetlanie wykresu

W zależności od tego, że wybrany typ wykresu ma możliwość dalszego skonfigurować opcje wykresu, przeglądanie lub wykres zostanie skopiowany do Schowka i pracy z danymi programu Excel.

Uwagaich definicje i wykresy nie są zapisywane.Po zamknięciu okna zawierającego wykres należy ponownie utworzyć wykresu.

Wykres dźwigu

Po skonfigurowaniu opcji modeli i testowania danych kliknij Unieś wykres kartę, aby wyświetlić wyniki.Można też wykres zostanie skopiowany do Schowka i wyświetlanie szczegółów linii trend indywidualnych lub punktów danych w górnictwie legendy.

Aby uzyskać więcej informacji, zobacz Unieś wykresu (Analysis Services - wyszukiwania danych) i Unieś kartę wykres (widok Wykres górnictwo dokładność).

Wykres zysku

Po skonfigurowaniu opcji modeli i testowania danych, kliknij przycisk Unieś wykres karcie Wybierz wykres zysków z Typ wykresu lista zestaw zysk Opcje wykresu, a następnie kliknij OK do wyświetlania wyniki.Można użyć Ustawień zysku wykres okno dialogowe tyle razy, ile chcesz spróbować kosztów różnych opcji i ponownie wyświetlić wykres.Legenda wyszukiwania zawiera szczegółowe informacje o szacunkowej zysku dla każdego modelu.Wykres i zawartość górnictwa legendy można także skopiować do Schowka, aby pracować w programie Excel.

Aby uzyskać więcej informacji, zobacz Zysk wykresu (Analysis Services - wyszukiwania danych) i Okno dialogowe Ustawienia wykresu zysku (widok Wykres górnictwo dokładność).

Wykres punktowy

Jeśli zaznaczono odpowiedni typ modelu, po kliknięciu Unieś wykres karcie Typ wykresu jest automatycznie zestaw do Wykresu punktowego i jest wyświetlany wykres punktowy.Dalsza konfiguracja nie jest możliwe.Można też wykres zostanie skopiowany do Schowka i wkleić wykres jako grafikę do programu Excel lub innej aplikacji.

Aby uzyskać więcej informacji, zobacz Wykres punktowy (Analysis Services - wyszukiwania danych).

Klasyfikacja macierzy

Macierzy klasyfikacji, użyj Zaznaczenie wprowadzania karcie wybór modeli i testowania danych, a następnie kliknij Macierzy klasyfikacji kartę, aby wyświetlić wyniki.Zawartość macierzy klasyfikacji są takie same dla wszystkich typów modelu i nie można konfigurować.Można również skopiować do Schowka danych na wykresie, a następnie pracować w programie Excel.

Aby uzyskać więcej informacji, zobacz Klasyfikacja macierzy (Analysis Services - wyszukiwania danych) lub Karta macierzy klasyfikacji (widok Wykres górnictwo dokładność).

Raport sprawdzania poprawności krzyżowe

Dla raportu krzyżowo, po wybraniu struktura wyszukiwania lub model wyszukiwania w oknie Solution Explorer kliknij Krzyżowe sprawdzanie poprawności karcie, należy skonfigurować wszystkie odpowiednie opcje, a następnie kliknij Uzyskać wyniki do generowania raportu.Dalsza konfiguracja nie jest możliwe.Format krzyżowe sprawdzanie poprawności raportu jest taka sama dla wszystkich typów modelu i nie można konfigurować.Jednak zawartość sprawozdania różni się w zależności od typu model analizowania i przewidywalny atrybut typu danych.Można także skopiować wyniki raportu do Schowka i pracować z danymi w programie Excel.

Aby uzyskać więcej informacji, zobacz Sprawdzanie poprawności krzyżowych (Analysis Services - wyszukiwania danych) lub Raport sprawdzania poprawności krzyżowych (Analysis Services - wyszukiwania danych).