Sprawdzanie poprawności modeli wyszukiwania danych (Analysis Services - wyszukiwania danych)

Sprawdzanie poprawności jest proces oceny, jak wykonać modeli wyszukiwania danych rzeczywistych.Jest sprawdzanie poprawności modeli wyszukiwania zrozumienie ich jakości i cech przed wdrożyć je do środowiska produkcyjnego.

Istnieją różne podejścia do oceny jakości i cech danych model wyszukiwania.Pierwszy obejmuje wykorzystanie różnych środków ważności statystycznych do określenia, czy istnieją problemy w danych lub w modelu.Po drugie może rozdzielić dane do szkolenia i testowania zestawy do badania dokładności prognoz.Wreszcie, może poprosić Przegląd wyniki danych ekspertów firmy model wyszukiwania do określenia, czy wykryte desenie mają znaczenie w scenariuszu firmy docelowej.Wszystkie te metody są przydatne w metodologii wyszukiwanie danych i są używane wielokrotnie powtarzane, jak tworzenie, testowanie i Aktualizuj modele odpowiedzi na określony problem.

This section introduces some basic concepts related to model quality, and introduces the strategies for model validation that are provided in Microsoft SQL Server 2008 Usługi Analysis Services. For an overview of how model validation fits into the larger data mining process, see Projekty górnictwo danych (Analysis Services - wyszukiwania danych).

Kryteria dla pomiaru modeli wyszukiwania danych

Większości metod sprawdzania poprawności danych model wyszukiwania nie odpowiedzi na pytania biznesowe bezpośrednio, ale udostępniają metryki, używany do prowadnicy decyzji biznesowych lub rozwoju.Brak reguły wszechstronne, powiedzieć gdy model jest wystarczająco dobrze lub gdy mają wystarczającej ilości danych.

Środki wyszukiwanie danych zazwyczaj należą do kategorii dokładności, wiarygodności i użyteczności.

Dokładności, wiarygodności i użyteczności

Dokładność jest miara z jak skorelowany jest model wyniku z atrybutów danych, które zostały dostarczone.Istnieją różne środki dokładności, ale wszystkie środki dokładności są zależne od danych, który jest używany.W rzeczywistości wartości mogą być brakujące lub niedokładne lub danych mogła ulec zmianie przez wiele procesów.Szczególnie w fazie badań i rozwoju można zdecydować akceptować pewne błąd w danych, szczególnie jeśli danych jest dość jednolita w jego właściwości.Na przykład model prognozuje sprzedaż określonego magazynu na podstawie sprzedaży w przeszłości można zdecydowanie skorelowanych i bardzo dokładne, nawet jeśli magazyn używane konsekwentnie niewłaściwe metoda rachunkowości.Dlatego dokładność pomiarów muszą być zrównoważone oceny wiarygodności.

Niezawodność ocenia sposób, danych model wyszukiwania wykonuje na różne zestawy danych.Dane model wyszukiwania jest wiarygodna generuje ten sam rodzaj prognoz lub nie znajdzie tego samego rodzaju ogólne desenie niezależnie od dane z badań, które zostały dostarczone.Na przykład model, który generuje dla magazynu, który użyto nieprawidłowego metoda rachunkowości nie byłyby generalize również do innych magazynów i dlatego nie byłyby wiarygodne.

Przydatność zawiera różne wskaźniki informujące, czy model dostarcza użytecznych informacji.Na przykład dane model wyszukiwania odpowiada przechowywać lokalizacji sprzedaży może być dokładne i niezawodne, ale może być przydatne, ponieważ nie generalize tego wyniku, dodając więcej magazynów w tej samej lokalizacji.Ponadto nie odpowiada działalności podstawowych kwestii Dlaczego niektórych lokalizacjach jest więcej sprzedaży.Można również znajdować, model, który pojawia się skuteczne w fakt jest bez znaczenia, ponieważ jest oparta na korelacje między w danych.

Microsoft Data górnictwo Framework

CRISP DM jest dobrze metodologię, która opisuje kroki w celu zdefiniowania, opracowywania i realizacji wyszukiwanie danych projektu.CRISP DM jest jednak ram koncepcyjnych, które nie oferuje szczególne wskazówki w sposób zakres i harmonogram projektu.Aby lepiej spełniać szczególne potrzeby użytkowników biznesowych, którzy są zainteresowani wyszukiwanie danych, ale nie wiedzieć, gdzie rozpocząć planowanie i potrzeb deweloperów, którzy mogą być wykwalifikowanych w.Opracowywanie aplikacji netto, ale są nowego wyszukiwanie danych Microsoft opracowała metoda dla realizacji projektu wydobycia danych zawierającego kompleksowy system oceny.

Aby uzyskać więcej informacji, zobacz zasobów wyszukiwania danych Microsoft strona.

Podejścia do sprawdzania poprawności modelu wyszukiwania w programie SQL Server Analysis Services

SQL Server 2008 obsługuje wiele metod do sprawdzania poprawności wyszukiwanie danych rozwiązań, które obsługują wszystkie fazy wyszukiwanie danych rozwój metodologii.

Partycjonowanie danych do szkolenia i testowania zestawów

Partycjonowanie danych do szkolenia i zestawów testów jest ustanowione technika przygotowywania danych do oceny.Część danych z zestaw danych szkoleniowych jest zarezerwowana dla testowania i pozostałe dane jest używana dla szkolenia.Po zakończeniu modelu model używany jest dokonanie prognoz przeciwko zestaw testów.Ponieważ dane w kształceniu zestaw losowo wybranych z tych samych danych, używany do szkolenia, metryki dokładności, który pochodzi z badania jest mniej prawdopodobne wpływu rozbieżności w danych i dlatego lepiej odzwierciedlają właściwości modelu.

Aby uzyskać więcej informacji, zobacz Partycjonowanie danych do szkolenia i testowania zestawy (Analysis Services - wyszukiwania danych).

Krzyżowe sprawdzanie poprawności modeli górnictwo

Krzyżowo pozwala dzielenia zestawu danych na wiele mniejszych przekrój poprzeczny i tworzyć wiele modeli na przekrój poprzeczny, aby sprawdzić poprawność kompletny zestaw danych.Usługi Analysis Servicesnastępnie generuje dokładności szczegółowe metryki dla każdej partycji.Korzystając z tych informacji, poprawy jakości poszczególnych modelu lub identyfikacji najlepszych modeli dla określonego zestaw danych.

Aby uzyskać więcej informacji, zobacz Sprawdzanie poprawności krzyżowych (Analysis Services - wyszukiwania danych).

Wykresy dokładności modelu górnictwo

Microsoft SQL Server Usługi Analysis Services provides tools to help you graph prediction accuracy, test the model against new or existing data, or compare multiple models in charts and reports.

A Unieś wykres jest metodą wizualizacji poprawę, która uzyskać z danych model wyszukiwania, kiedy porównać do zgadywania losowe.Można również utworzyć wykresów zysku , kojarzenie zysk finansowy lub kosztów za pomocą model wyszukiwania, i Wykresy punktowy dla modeli regresja.A macierzy klasyfikacji jest metoda sortowania pozytywnego i negatywnego zgaduje do tabela, dzięki czemu można szybko i łatwo określenia sposobu dokładnie modelu Prognozuje wartości miejsce docelowe.

Aby uzyskać więcej informacji Narzędzia do tworzenia wykresów dokładności modelu (Analysis Services - wyszukiwania danych).

Można także filtrować modeli na różne sposoby, szkolić i testowanie różnych kombinacji tego samego źródło danych.Aby uzyskać więcej informacji, zobacz Pomiar dokładności modelu górnictwa (Analysis Services - wyszukiwania danych).

Przeglądanie i badanie modelu zawartości i przypadkach

Usługi Analysis Services zawiera zestaw wyszukiwanie danych przeglądarki do przeglądania i eksplorowania modelu.Można również tworzyć zawartość kwerend, które pomagają lepiej zrozumieć modelu i nieoczekiwane problemy w swoje podejście lub danych.Podczas tworzenia kwerendy zawartości przy użyciu danych górnictwa rozszerzenia (DMX) można uzyskać informacje statystyczne dotyczące wzorców odnalezione przez model wyszukiwania, lub pobrać sprawy, które obsługują specyficzne wzorce znalezione przez model.Można także drążyć wskroś do szczegółów w podstawowej struktura wyszukiwania, aby znaleźć lub przedstawić szczegółowe informacje, które nie zostało uwzględnione w modelu lub zająć się wzorce znalezione w danych.

Aby uzyskać więcej informacji na temat kwerend modelu zawartości, zobacz Badanie modeli wyszukiwania danych (Analysis Services - wyszukiwania danych).

Aby uzyskać więcej informacji na temat przeglądania zawartości modelu, zobacz Wyświetlanie modeli wyszukiwania danych.

Aby uzyskać więcej informacji dotyczących sposobu interpretowania zawartości modelu określone algorytmy, zobacz Algorytmów wyszukiwania danych (Analysis Services - wyszukiwania danych).