Kreator wyszukiwania danych (Analysis Services - wyszukiwania danych)

The Data Mining Wizard in Microsoft SQL Server Usługi Analysis Services starts every time that you add a new mining structure to a data mining project.Kreator pomaga definiować nowe struktury górnictwa i wybiera źródeł danych, które będą używane do wyszukiwanie danych.Kreator również można podzielić dane w struktura wyszukiwania do zestawów kształcenia i testowania i pomocy dodać model górnictwo początkowej dla każdej struktury.

Zawartość struktura wyszukiwania pochodzi z istniejącego widok źródło danych lub moduł.Można wybrać kolumny, które mają zostać uwzględnione w struktura wyszukiwania.Wszystkie modele, które są oparte na tej struktury można użyć tych kolumn.Można umożliwić użytkownikom modelu górnictwo danych drążenie z wyniki modelu górnictwa, aby zobaczyć dodatkowe struktura wyszukiwania kolumn, które nie zostały uwzględnione w modelu górnictwa, sam.

Podczas tworzenia danych należy następujące decyzje struktura wyszukiwania i modelu przy użyciu Kreatora wyszukiwanie danych:

  • Czy utworzyć dane struktura wyszukiwania i modeli z relacyjnej bazy danych lub z istniejącego moduł baza danych OLAP.

  • Jak dużo danych w szkolenie i ile zestaw przeznaczone do badania.Wszystkie modele, które są oparte na tej struktury struktura wyszukiwania dzielenia na szkolenia i testowania zestawów danych, można użyć ten zestaw testów.

  • Które kolumny lub atrybuty do przewidywanie i które kolumny lub używać jako dane wejściowe dla analizy.Każda struktura musi także zawierać klucz, który unikatowo identyfikuje rekordu przypadek.

  • Algorytm, które ma być używany.The algorithms provided in SQL Server Usługi Analysis Services have different characteristics and produce different results.Można utworzyć wiele modeli przy użyciu różnych algorytmów lub zmienić parametry algorytmów tworzenia różnych modeli..

Kreator wyszukiwania danych zawiera funkcje ułatwiające te decyzje:

  • Strony kreatora, w których przypadek definiowania zestaw.Można wybrać tabele przypadek i zagnieżdżonych tabel ze źródła danych relacyjnych, lub wybierz źródło danych OLAP a następnie wybierz klucz przypadek i liter kolumn poziom a opcjonalnie zestaw filtrów na module.

  • Okna dialogowe analizować dane w kolumnach i zaleca się użycie kolumn.

  • Automatyczne wykrywanie kolumna zawartości i typy danych.

  • Automatyczne krojenie moduł, jeśli model wyszukiwania jest oparty na źródło danych OLAP.

Po zakończeniu pracy Kreatora wyszukiwania danych, modyfikowanie struktura wyszukiwania za pomocą projektanta wyszukiwania danych i modeli, aby wyświetlić dokładności modelu, wyświetlanie cech strukturę i modeli lub tworzenie prognoz przy użyciu modeli.

Aby uzyskać więcej informacji:Projektant wyszukiwania danych

Przy użyciu Kreatora wyszukiwania danych

Aby uruchomić Kreatora wyszukiwania danych, Dodaj nowy struktura wyszukiwania do Usługi Analysis Services projektu przy użyciu Solution Explorer lub projektu menu w Business Intelligence Development Studio.

Kreator wyszukiwania danych ma dwie gałęzie, w zależności od tego, czy źródło danych jest relacyjna lub moduł:

  • Modeli relacyjnych górnictwo

  • Modeli wyszukiwania OLAP

Ostrzeżenie

Nie trzeba mieć moduł lub baza danych OLAP w celu wyszukiwanie danych.Jeśli dane są już przechowywane w moduł, lub chcesz kopalni wymiary OLAP lub wyniki skupiska OLAP lub obliczeń, zaleca się używania relacyjnej źródło danych lub tabela do wyszukiwanie danych.

Modeli relacyjnych górnictwo

Podczas tworzenia model wyszukiwania ze źródło danych relacyjnych w Usługi Analysis Services, należy najpierw określić w Kreatorze wyszukiwania danych chcesz użyć istniejącego relacyjnej bazy danych do definiowania struktury modelu.Istnieje również możliwość tworzenia tylko struktura wyszukiwania, lub struktura wyszukiwania i jeden model górnictwo skojarzonych danych.Jeżeli wybierzesz utworzenie model wyszukiwania, należy określić technika wyszukiwanie danych do używania przez wybranie algorytmu, który jest najbardziej odpowiednia dla typu analizy danych górnictwa, który ma.

Aby uzyskać więcej informacji:Algorytmów wyszukiwania danych (Analysis Services - wyszukiwania danych)

Określanie Widok źródła danych i tabeli typów

Są kolejne kroki w kreatorze Wybierz Widok źródło danych, którego chcesz użyć do zdefiniowania struktura wyszukiwaniai określenie przypadek tabela.przypadek tabela będzie używana dla danych szkolenia model wyszukiwaniai opcjonalnie on również badania.Można również określić tabela zagnieżdżonej.

Wybór przypadek tabela jest ważna decyzja.przypadek tabela powinna zawierać obiekty, które chcesz analizować: na przykład klienci i ich informacje demograficzne.Tabela zagnieżdżona zazwyczaj zawiera dodatkowe informacje dotyczące obiektów przypadek tabeli, takich jak transakcji prowadzonych przez klienta lub atrybuty, które mają relacja wiele-do-jednego z obiekt.Na przykład, tabele zagnieżdżone przyłączony do Klienci przypadek tabela może zawierać listę produktów zakupionych przez poszczególnych klientów lub listy hobby.Aby uzyskać więcej informacji:Zagnieżdżone tabele (Analysis Services - wyszukiwania danych)

Określanie użycia kolumny

Po określeniu przypadek tabela i tabel zagnieżdżonych, aby określić typ użycia dla każdej kolumna w tabelach, które zostaną uwzględnione w struktura wyszukiwania.Jeśli nie określisz typu obciążenie dla kolumna, kolumna nie zostaną uwzględnione w struktura wyszukiwania.

Kolumny wyszukiwania danych może być jednym z czterech typów: klucz wprowadzania przewidywalny lub kombinację wejściowych i przewidywalny.Kolumny klucza zawiera identyfikator unikatowy dla każdego wiersza w tabela.Niektóre modele górnictwa, takich jak na podstawie sekwencji klastrowanie lub czas serii algorytmów, może zawierać wiele kolumn klucz.Jednak nie są kluczami mieszanek, w sensie relacyjnej wielu z tych kluczy, ale zamiast tego należy wybrać taki, aby zapewnić obsługę czas serii i klastrowanie analizy sekwencji.Aby uzyskać więcej informacji, zobacz Algorytm serii Microsoft czasu lub Algorytm klastrowania Microsoft sekwencji.

Wejściowy kolumny zawierają informacje, z której dokonywane są prognoz.Przewidywalne kolumny zawierają informacje, które spróbować przewidzieć w model wyszukiwania.

Na przykład serii tabel może zawierać identyfikatory klienta, informacje demograficzne i kwotę pieniężnego każdego klienta spędza w określonym sklepie.Identyfikator klienta unikatowo identyfikuje klienta i odnosi się także przypadek tabela tabele zagnieżdżone; Dlatego należy użyć Identyfikatora klienta jako kolumna klucz.Wybór kolumny z informacje demograficzne może być używany jako wprowadzania kolumny i kolumny, która opisuje ilość pieniędzy spędza każdego klienta jako przewidywalna kolumna.Następnie można utworzyć model wyszukiwania odpowiadającą demograficzne pieniędzy klienta spędza w magazynie.Ten model może być używany jako podstawę dla przeznaczone do obrotu.

Kreator wyszukiwania danych zawiera Proponuj funkcji, która jest włączona, po wybraniu przewidywalna kolumna.Zestawów danych często zawierają więcej kolumn niż potrzebne do tworzenia model wyszukiwania.Proponuj funkcja oblicza wynik numeryczny, od 0 do 1, który opisuje relację między każdej kolumna w zestawie danych oraz przewidywalna kolumna.Oparty na ten wynik, funkcja sugeruje kolumn jako dane wejściowe dla model wyszukiwania.Jeśli używasz Proponuj funkcji, można użyć kolumny sugerowane, zmodyfikuj wybrane opcje, aby dopasowanie potrzeb lub zignorować sugestie.

Określanie zawartości i typy danych

Po zaznaczeniu przewidywalne kolumna lub kolumn wprowadzania, można określić typy zawartości i danych dla każdej kolumna.

Aby uzyskać więcej informacji:Typy danych (wyszukiwania danych), Typy zawartości (wyszukiwania danych)

Dzielenie danych na szkolenia i testowania zestawów

Ostatnim krokiem przed ukończeniem Kreator jest dzielenia danych na szkolenia i testowania zestawów.Zdolność do przechowywania części danych dla badania jest nowego w SQL Server 2008 i udostępnia mechanizm łatwego w obsłudze dla zapewnienia, że spójny zestaw danych z badań jest dostępna do użycia z wszystkich modeli wyszukiwania skojarzony z nowym struktura wyszukiwania.

Można określić, że procent danych można użyć do testowania, a wszystkie pozostałe będą używane dla szkolenia.Można również określić liczbę przypadków dla badania.Definicja partycji jest przechowywany wraz z struktura wyszukiwania, dzięki czemu przy każdym utworzeniu nowy model oparty na strukturze zestaw testowania danych będą dostępne dla oceny dokładności modelu.

Aby uzyskać więcej informacji:Sprawdzanie poprawności modeli wyszukiwania danych (Analysis Services - wyszukiwania danych), Partycjonowanie danych do szkolenia i testowania zestawy (Analysis Services - wyszukiwania danych)

Kończenie pracy Kreatora

Ostatniego kroku kreatora jest nazwa struktura wyszukiwania i model skojarzony górniczych.Jeśli wybierzesz Zezwalaj na drążenie wskroś, drążenia wskroś funkcjonalność jest włączona w modelu.Dzięki temu użytkownicy, którzy mają odpowiednie uprawnienia eksplorować źródło danych, który jest używany do utworzenia modelu.

Aby uzyskać więcej informacji:Za pomocą drążenia na modelach górnictwo i kopalnictwo struktur (Analysis Services - wyszukiwania danych)

Powrót do początku

Modeli wyszukiwania OLAP

Podczas tworzenia wielowymiarowe model wyszukiwania ze źródło danych OLAP w Usługi Analysis Services, należy najpierw określić w Kreatorze wyszukiwania danych chcesz użyć istniejącego moduł do definiowania struktury modelu.Istnieje możliwość tworzenia tylko strukturę górniczych lub tworzenie struktura wyszukiwania plus jeden skojarzonych danych model wyszukiwania.Jeżeli wybierzesz utworzenie model wyszukiwania, należy określić technika wyszukiwanie danych do używania przez wybranie algorytmu, który jest najbardziej odpowiednia dla problemu biznesowego.

Aby uzyskać więcej informacji:Algorytmów wyszukiwania danych (Analysis Services - wyszukiwania danych)

Określanie źródła danych i w przypadku klucza

Następnie wybierz wymiar moduł używany jako źródło danych do definiowania struktura wyszukiwania.Następnie wybierz atrybut jako klucz, lub przypadek klucza, z model wyszukiwania.

Ostrzeżenie

Tworzonego modelu OLAP górnictwa i moduł źródłowy umożliwia utworzenie modelu muszą być zawarte w tym samym Usługi Analysis Services bazy danych.

Określanie kolumn poziom sprawy i użycie kolumny

Po wybraniu klucza przypadek, atrybuty i środki, które są skojarzone z tym kluczem są wyświetlane w widoku drzewa na następnej strona kreatora.Z tej listy wybierz atrybuty i środki, które mają być używane jako kolumny struktury.Kolumny te są znane jako przypadek kolumn poziom.Zgodnie z modelem relacyjnym należy również określić sposób każdej kolumny powinien być używany w strukturze, co można zrobić na następnej strona kreatora.Kolumny można klucz, wejściowe, przewidywalny, wprowadzania i przewidywalnego lub niezaznaczone.

Dodawanie tabel zagnieżdżonych

Oddział OLAP Kreatora wyszukiwania danych zawiera tabele zagnieżdżone, aby dodać model wyszukiwania struktury.Na Sposób określić górnictwa kolumny użycia modelu strona kreatora, kliknij przycisk Dodaj tabele zagnieżdżone , aby otworzyć okno dialogowe oddzielnych, który prowadzi użytkownika przez kroki, aby dodać tabele zagnieżdżone.Tylko miara grup, które mają zastosowanie do wymiar są wyświetlane.Wybierz grupa miar zawierający klucz obcy przypadek wymiar.Następnie, określić sposób użycia każdej kolumna w grupa miar, wprowadzania lub przewidywalny.Kreator dodaje do tabela przypadek tabela zagnieżdżonej.Domyślna nazwa tabela zagnieżdżonej jest nazwa wymiar zagnieżdżonych, ale można zmienić nazwę tabela zagnieżdżonej i jej kolumn.Aby uzyskać więcej informacji:Zagnieżdżone tabele (Analysis Services - wyszukiwania danych)

Określanie zawartości i typy danych

Po zaznaczeniu przewidywalne kolumna lub kolumn wprowadzania, można określić typy zawartości i danych dla każdej kolumna.

Aby uzyskać więcej informacji:Typy danych (wyszukiwania danych), Typy zawartości (wyszukiwania danych)

Krojenie modułu źródła

W gałęzi OLAP w kreatorze można ograniczyć zakres wyszukiwania modelu krojenie moduł źródłowy przed szkolić modelu górniczych.Krojenie moduł jest podobna do dodawania WHERE klauzuli do instrukcja języka SQL.Na przykład jeśli moduł zawiera informacje dotyczące zakupu produktów, może ograniczyć atrybut wiek ponad 30, kolumna płci tylko żeńska i Data zakupu do wcześniej do marca 2000 r.W taki sposób, można ograniczyć modelu dla pokrycia zakres samic, która jest starsza niż 30 lat i kto zakupione produktu po marca 2000 r.

Dzielenie danych na szkolenia i testowania zestawów

Ostatnim krokiem przed ukończeniem Kreator jest dane, które jest dostępne z moduł do szkolenia i testowania zestawy partycji.Definicja partycji jest przechowywany wraz z struktura wyszukiwania, dzięki czemu przy każdym utworzeniu nowy model oparty na strukturze zestaw testowania danych będą dostępne dla oceny dokładności modelu.

Aby uzyskać więcej informacji:Sprawdzanie poprawności modeli wyszukiwania danych (Analysis Services - wyszukiwania danych), Partycjonowanie danych do szkolenia i testowania zestawy (Analysis Services - wyszukiwania danych)

Kończenie pracy Kreatora

Ostatniego kroku kreatora jest nazwa struktura wyszukiwania i model skojarzony górniczych.Jeśli wybierzesz Zezwalaj na drążenie wskroś, drążenia wskroś funkcjonalność jest włączona w modelu.Dzięki temu użytkownicy, którzy mają odpowiednie uprawnienia eksplorować źródło danych, który jest używany do utworzenia modelu.Można również określić, czy chcesz dodać nowy wymiar do moduł źródłowy jest oparty na modelu górnictwa, lub utworzyć nowy moduł z modelu górniczych.

Aby uzyskać więcej informacji:Za pomocą drążenia na modelach górnictwo i kopalnictwo struktur (Analysis Services - wyszukiwania danych)

Powrót do początku