Artykuł
07/22/2011

Tworzenie struktury sieci neuronowe i modelu (pośrednie samouczek wyszukiwania danych)

Aby utworzyć dane model wyszukiwania, należy najpierw użyć Kreatora górnictwo danych do utworzenia nowej struktura wyszukiwania na podstawie nowego widok źródło danych.W to zadanie będzie użyj Kreatora tworzenia struktury górnictwa i jednocześnie czas utworzyć model skojarzony górnictwa, oparty na Microsoft sieci neuronowe algorytmu.

Ponieważ sieci neuronowe są wyjątkowo elastyczne i można analizować wiele kombinacji wejść i wyjść, należy wypróbować kilka sposobów przetwarzania danych, aby uzyskać najlepsze wyniki.Na przykład, można dostosować sposób, w jaki dane są binned, lub zgrupowane, aby miejsce docelowe określone wymagania biznesowe.Aby to zrobić, doda nową kolumna struktura wyszukiwania grupuje dane liczbowe w inny sposób, a następnie utwórz model, który używa nowej kolumna.Do wykonania niektórych badań użyje tych modeli wyszukiwania.

Oddzielny model do przewidywanie i oceny punktowej zbudować wreszcie, gdy zapewne z modelu sieci neuronowe, które czynniki mają największy wpływ na pytanie biznesowe.Będzie używać Microsoft regresją algorytmu, który jest oparty na modelu sieci neuronowe, ale jest zoptymalizowany dla znalezienia rozwiązania oparte na określonych nakładów.

Tworzenie struktury domyślne Centrum wywołania

Do tworzenia domyślnej sieci neuronowe struktura wyszukiwania i modelu

W oknie Solution Explorer w Business Intelligence Development Studio, kliknij prawym przyciskiem myszy Górnictwa struktur i wybierz Nowej struktury górnictwa.
Na Zapraszamy kreatora wyszukiwania danych strona, kliknij przycisk Dalej.
Na Wybierz metodę definicji strona upewnij się, że z istniejących relacyjnej bazy danych lub magazyn danych jest zaznaczone, a następnie kliknij Dalej.
Na Tworzenie struktury danych górnictwa strona, sprawdź, czy opcja Tworzenie struktura wyszukiwania z model wyszukiwania jest zaznaczone.
Kliknij listę rozwijaną dla opcji od techniki wyszukiwanie danych chcesz użyć?, następnie wybierz Sieci neuronowe Microsoft.

Ponieważ logistyczne regresja modele są oparte na sieci neuronowe, można użyć ponownie tę samą strukturę i dodać nowy model górnictwa.
Kliknij Dalej.

Widok źródła danych wybierz zostanie wyświetlona strona.
W obszarze Widoki źródło danych dostępne, wybierz opcję Centrum wywołaniei kliknij przycisk Dalej.
Na Określić typy tabel strona, zaznacz przypadku pole wyboru obok FactCallCenter tabela.Kliknij Dalej.
Na Określ dane szkolenia strona, zaznacz klucz obok kolumna FactCallCenterID.
Wybierz Predict i wprowadzania pola wyboru.

Wybierz klucz, wprowadzania, i Predict pola wyboru, jak pokazano w poniższej tabela:

Tabele i kolumny	Klucz/Input/prognozowania
AutomaticResponses	Dane wejściowe
AverageTimePerIssue	Przewidywanie/wprowadzania
Calls	Dane wejściowe
DateKey	Nie należy używać
DayOfWeek	Dane wejściowe
FactCallCenterID	Klucz
IssuesRaised	Dane wejściowe
LevelOneOperators	Przewidywanie/wprowadzania
LevelTwoOperators	Dane wejściowe
Orders	Przewidywanie/wprowadzania
ServiceGrade	Przewidywanie/wprowadzania
Shift	Dane wejściowe
TotalOperators	Nie należy używać
WageType	Dane wejściowe

Na określić kolumny Zawartość i typ danych strona, sprawdź, czy siatka zawiera kolumny, typy zawartości i typy danych, jak pokazano w poniższej tabela, a następnie kliknij Dalej.

kolumny	Typ zawartości	Typy danych
AutomaticResponses	Ciągłe	Długie
AverageTimePerIssue	Ciągłe	Długie
Calls	Ciągłe	Długie
DayOfWeek	Dyskretne	Tekst
FactCallCenterID	Klucz	Długie
IssuesRaised	Ciągłe	Długie
LevelOneOperators	Ciągłe	Długie
LevelTwoOperators	Ciągłe	Długie
Orders	Ciągłe	Długie
ServiceGrade	Ciągłe	Double
Shift	Dyskretne	Tekst
WageType	Dyskretne	Tekst

Na Tworzenie zestaw testów strona, wyczyść pole tekstowe dla opcji, udział procentowy danych testowych.Kliknij Dalej.
Na Kończenie pracy Kreatora strona, dla nazwy struktury górnictwa, typ Centrum wywołanie.
Dla nazwę modelu górnictwa, typu Wywołania NN domyślne Centrum, a następnie kliknij przycisk Zakończ.

Zezwalaj na drążenie wskroś pole jest wyłączone, ponieważ nie można drążyć wskroś danych z modeli sieci neuronowe.
W oknie Solution Explorer kliknij prawym przyciskiem myszy nazwę dane struktura wyszukiwania właśnie utworzonym i wybierz proces.

Opis Discretization

Domyślnie podczas tworzenia modelu sieci neuronowe, który ma atrybut numeryczny przewidywalne algorytm sieci neuronowe Microsoft traktuje jako numer kolejny atrybutu.Na przykład ServiceGrade atrybut jest liczbą teoretycznie zakresy z 0,00 (wszystkie połączenia są odbierane) do 1,00 (wszystkie obiekty wywołujące Rozłącz).W tym zestaw danych, wartości mają następujący podział:

dystrybucja wartości jakości obsługi

W rezultacie podczas przetwarzania modelu wyjść mogą być pogrupowane inaczej niż oczekujesz.Na przykład domyślny model, który używa klastrowanie Aby znaleźć grupy wartości dzieli ServiceGrade do zakresów, takiej jak to: 0.0748051948 - 0.09716216215.Mimo to grupowanie matematycznie dokładne, takie zakresy może nie być tak istotnych dla użytkowników biznesowych.Inny sposób grupowania wartości liczbowe, można utworzyć kopię lub wiele kopii kolumna danych liczbowych i określić sposób algorytmu wyszukiwanie danych należy przetworzyć wartości.Na przykład określić, że algorytm podzielić wartości na nie więcej niż pięciu pojemników.

Usługi Analysis Services oferuje różne metody binning lub przetwarzania danych liczbowych.W poniższej tabela przedstawiono różnice między wyniki podczas atrybut wyjściowego ServiceGrade została przetworzona trzy różne sposoby:

Traktując je jako numer kolejny
Posiadające algorytm dyskretyzować wartość przez najlepszych możliwych metoda, co się dzieje się klastrowanie
Określanie, że numery być binned przez metoda równe obszary

Domyślny model (ciągłe)	Binned przezklastrowanie	Binned przez obszary równe
VALUEOBSŁUGA Brak0 0.09875120	VALUEOBSŁUGA < 0.074805194834 0.0748051948 - 0.0971621621527 0.09716216215 - 0.1329729729539 0.13297297295 - 0.16749999997510 >= 0.16749999997510	VALUEOBSŁUGA < 0.0726 0.07 - 0.0022 0.09 - 0.1136 >= 0.1236

W tej tabela kolumna wartość pokazuje, jak numer kolejny została zrealizowana, a kolumna obsługi pokazuje, ile wierszy znaleziono wartość, zakres lub typ wartości.Aby uzyskać więcej informacji dotyczących opcji binning, zobacz Metody discretization (wyszukiwania danych).

Ostrzeżenie

Te statystyki węzeł Statystyka marginalny modelu, można uzyskać po wszystkich przetwarzania danych.Aby uzyskać więcej informacji na temat węzeł Statystyka marginalny Zobacz Model zawartości dla sieci neuronowe modeli górnictwo (Analysis Services - wyszukiwania danych).

Alternatively, rather than using the numeric values, you could add a separate derived column that classifies the service grades into predefined target ranges, such as Best (ServiceGrade <= 0.05), Acceptable (0.10 > ServiceGrade > 0.05), and Poor (ServiceGrade >= 0.10).

Tworząc kopię kolumny i zmiana metody Discretization

W przypadku wyszukiwanie danych usług Analysis Services, można łatwo zmienić sposób, w jaki dane liczbowe jest binned w struktura wyszukiwania poprzez dodanie kopię kolumna zawierające dane miejsce docelowe i zmiana metoda discretization.

Poniższa procedura opisuje sposób kopii kolumna górnictwa, która zawiera atrybut miejsce docelowe ServiceGrade.Można utworzyć wiele kopii dowolnej kolumna w struktura wyszukiwania, włączając przewidywalne atrybut.

Następnie będzie Dostosowywanie grupowanie wartości liczbowe kolumna skopiowane do zmniejszenia złożoności grupowanie.Ten samouczek będzie równe obszary metoda discretization i określić cztery pakiety.Grupowanie, wynikające z tej metoda są dość blisko wartości miejsce docelowe interesu użytkowników biznesowych.

Ostrzeżenie

Podczas początkowej eksploracji danych można również eksperymentować z różnych metod discretization lub spróbuj najpierw klastrowanie danych.

Aby utworzyć dostosowaną kopię kolumna wstruktura wyszukiwania

W oknie Solution Explorer kliknij dwukrotnie struktura wyszukiwania utworzony.
W struktura wyszukiwania , kliknij pozycję Dodaj struktura wyszukiwania kolumny.
W Zaznacz kolumnę okno dialogowe, wybierz ServiceGrade z listy w Kolumna źródłowa, następnie kliknij przycisk OK.

Nowa kolumna zostanie dodana do listy struktura wyszukiwania kolumny.Domyślnie nowa kolumna górnictwo ma taką samą nazwę jak istniejąca kolumna z przyrostkowe numeryczne: na przykład ServiceGrade 1.Można zmienić nazwę kolumna, to być bardziej opisową.

Należy również określić metoda discretization.
Kliknij prawym przyciskiem myszy ServiceGrade 1 i wybierz Właściwości.
W Właściwości okna, zlokalizuj nazwę właściwość i Zmień nazwę, aby wywołać NN Centrum Binned.
Okno dialogowe pojawi się pytaniem, czy chcesz wprowadzić zmiany tej samej nazwy wszystkich powiązanych model wyszukiwania kolumny.Click No.
W Właściwości okna zlokalizować sekcji Typ danych i rozwiń ją, jeśli to konieczne.
Zmień wartość właściwość Content z Continuous do Discretized.

Dostępne są następujące właściwości.Zmiana wartości właściwości, jak pokazano w poniższej tabela:

Właściwość

Wartość domyślna

Nowa wartość

DiscretizationMethod

Continuous

EqualAreas

DiscretizationBucketCount

Brak wartości

4

Ostrzeżenie

Wartość domyślna, DiscretizationBucketCount jest faktycznie 0, co oznacza, że algorytm automatycznie określa optymalną liczbę wiadrach.Dlatego jeśli chcesz przywrócić jego domyślną wartość tej właściwość, wpisz 0.
W projektancie wyszukiwania danych, kliknij przycisk Górnictwa modele kartę.

Zauważ, że podczas dodawania kopię kolumna struktura wyszukiwania Flaga użycia kopii jest automatycznie zestaw do Ignore.Zazwyczaj po dodaniu kolumna kopii struktura wyszukiwania kopii nie należy używać do analizy wraz z oryginalną kolumna lub algorytm znajdzie silne powiązania między dwoma kolumnami, które mogą zasłaniać inne relacje.

Właściwość	Wartość domyślna	Nowa wartość
DiscretizationMethod	Continuous	EqualAreas
DiscretizationBucketCount	Brak wartości	4

Dodawanie nowego modelu górnictwo struktury górnictwo

Utworzono nowy grupowanie dla atrybut miejsce docelowe, należy dodać nowy model wyszukiwania używający discretized kolumna.Po zakończeniu, CallCenter struktura wyszukiwania będzie miał dwa modele górnictwa:

model wyszukiwania, Call Center Default NN, Uchwyty ServiceGrade wartości jak ciągłego zakres.
model wyszukiwania, Call Center Binned NN, Discretizes ServiceGrade wartości na cztery różne pakiety.

Aby dodać model wyszukiwania na podstawie nowej kolumna zdyskretyzowana

W oknie Solution Explorer kliknij prawym przyciskiem myszy struktura wyszukiwania właśnie utworzonym i wybierz Otwórz.
Kliknij Górnictwa modele kartę.
Kliknij Tworzenie powiązanych model wyszukiwania.
W Nowy Model górnictwa okno dialogowe dla nazwę modelu, typ Wywołania NN Centrum Binned.W Nazwa algorytmu listy rozwijanej wybierz Sieci neuronowe Microsoft.
Na liście kolumn zawartych w nowym model wyszukiwania, zlokalizuj ServiceGradei zmień korzystaniu z Predict do Ignore.
Podobnie, zlokalizuj ServiceGrade Binnedi zmień korzystaniu z Ignore do Predict.

Zazwyczaj nie można porównać modeli górnictwa, używających różnych atrybutów przewidywalne.Jednakże w SQL Server 2008, można utworzyć alias dla model wyszukiwania kolumna.Oznacza to, że można zmienić nazwy ServiceGrade Binned kolumna wewnątrz model wyszukiwania tak, aby ma taką samą nazwę jak oryginalne kolumna.Można następnie bezpośrednio porównać te dwa modele wykresie dokładności nawet danych jest discretized inaczej.

Aby dodać alias struktura wyszukiwania kolumn w modelu górnictwo

W Górnictwa modele kartę w struktury, wybierz opcję ServiceGrade Binned.

Należy zauważyć, że Właściwości okno wyświetla właściwości obiektu ScalarMiningStructure kolumna.
kolumna dla model wyszukiwania, ServiceGrade Binned NN, kliknij komórka kolumna odpowiadające ServiceGrade Binned.

Uwaga to teraz Właściwości okno wyświetla właściwości dla obiektu MiningModelColumn.
Zlokalizuj nazwę właściwość i zmień wartość ServiceGrade.

Zlokalizuj Opis właściwość i wpisz alias kolumna tymczasowe.

Właściwości okno powinny zawierać następujące informacje:

Właściwość	Wartość
Opis	Alias kolumna tymczasowe
Identyfikator	ServiceGrade Binned
Modelowanie flag
Nazwa	Klasa usług
Identyfikator elementu SourceColumn	Kategoria usługi 1
Użycie	Przewidywanie

Kliknij w dowolnym miejscu Górnictwa modelu kartę.

Siatka zostanie zaktualizowana, aby wyświetlić nowy alias tymczasową kolumna ServiceGrade, obok użycia kolumna.Siatki, zawierający struktura wyszukiwania i dwóch modeli wyszukiwania powinna wyglądać następująco:

Struktura	Domyślne Centrum obsługi telefonicznej NN	Wywołanie Centrum Binned NN
	Microsoft sieci neuronowe	Microsoft sieci neuronowe
AutomaticResponses	Dane wejściowe	Dane wejściowe
AverageTimePerIssue	Przewidywanie	Przewidywanie
Wywołania	Dane wejściowe	Dane wejściowe
DayOfWeek	Dane wejściowe	Dane wejściowe
FactCallCenterID	Klucz	Klucz
IssuesRaised	Dane wejściowe	Dane wejściowe
LevelOneOperators	Dane wejściowe	Dane wejściowe
LevelTwoOperators	Dane wejściowe	Dane wejściowe
Zamówienia	Dane wejściowe	Dane wejściowe
ServceGrade Binned	Ignoruj	Przewidywanie (ServiceGrade)
ServiceGrade	Przewidywanie	Ignoruj
SHIFT	Dane wejściowe	Dane wejściowe
Całkowita operatorów	Dane wejściowe	Dane wejściowe
WageType	Dane wejściowe	Dane wejściowe

Przetwarzanie modelu

Wreszcie, w celu zapewnienia, że modele utworzone są porównywalne, będzie zestaw materiału siewnego parametr domyślny i modele binned.Ustawienie wartości materiału siewnego gwarancji, że każdy model rozpoczyna przetwarzanie danych z tego samego punktu.

Ostrzeżenie

Jeśli nie określisz wartość liczbową parametru materiału siewnego, SQL Server Analysis Services generują materiału siewnego, na podstawie nazwy modelu.Ponieważ model sieci neuronowe i model regresją mają różne nazwy, należy zestaw wartość początkową dla zapewnienia przetwarzania danych w tej samej kolejności.

Aby określić materiał siewny i przetworzyć modele

W Górnictwa modelu kartę, kliknij prawym przyciskiem myszy kolumna dla modelu o nazwie Call Center - LRi wybierz Ustawić parametry algorytmu.
W wierszu dla parametru HOLDOUT_SEED, kliknij puste komórka w obszarze wartość, a następnie wpisz 1.Click OK.Powtórz ten krok dla każdego modelu skojarzonych ze strukturą.

Ostrzeżenie

Wartość wybierz jako materiał siewny nie ma znaczenia, jak użyć tego samego materiału siewnego dla wszystkich powiązanych modeli.
W Górnictwa modele menu wybierz struktury górnictwa proces i wszystkie modele.Kliknij Tak wdrożyć zaktualizowanego wyszukiwanie danych projektu na serwerze.
W Górnictwa Model procesu okno dialogowe, kliknij przycisk uruchomić.
Kliknij zamknąć zamknąć Postępu procesu okno dialogowe, a następnie kliknij zamknąć ponownie Górnictwa Model procesu okno dialogowe.

Teraz, utworzono dwa modele pokrewne górnictwa, będą eksplorować dane wykrywanie relacje w danych.

Kolejnym zadaniem w lekcji

Eksplorowanie modelu Centrum obsługi telefonicznej (samouczek wyszukiwania danych pośrednich)

Zobacz także

Koncepcje

Górnictwo struktur (Analysis Services - wyszukiwania danych)

Share via

Tworzenie struktury sieci neuronowe i modelu (pośrednie samouczek wyszukiwania danych)

Tworzenie struktury domyślne Centrum wywołania

Do tworzenia domyślnej sieci neuronowe struktura wyszukiwania i modelu

Opis Discretization

Tworząc kopię kolumny i zmiana metody Discretization

Aby utworzyć dostosowaną kopię kolumna wstruktura wyszukiwania

Dodawanie nowego modelu górnictwo struktury górnictwo

Aby dodać model wyszukiwania na podstawie nowej kolumna zdyskretyzowana

Aby dodać alias struktura wyszukiwania kolumn w modelu górnictwo

Przetwarzanie modelu

Aby określić materiał siewny i przetworzyć modele

Kolejnym zadaniem w lekcji

Zobacz także

Koncepcje

Dodatkowe zasoby