Tworzenie struktury sieci neuronowe i modelu (pośrednie samouczek wyszukiwania danych)

Aby utworzyć dane model wyszukiwania, należy najpierw użyć Kreatora górnictwo danych do utworzenia nowej struktura wyszukiwania na podstawie nowego widok źródło danych.W to zadanie będzie użyj Kreatora tworzenia struktury górnictwa i jednocześnie czas utworzyć model skojarzony górnictwa, oparty na Microsoft sieci neuronowe algorytmu.

Ponieważ sieci neuronowe są wyjątkowo elastyczne i można analizować wiele kombinacji wejść i wyjść, należy wypróbować kilka sposobów przetwarzania danych, aby uzyskać najlepsze wyniki.Na przykład, można dostosować sposób, w jaki dane są binned, lub zgrupowane, aby miejsce docelowe określone wymagania biznesowe.Aby to zrobić, doda nową kolumna struktura wyszukiwania grupuje dane liczbowe w inny sposób, a następnie utwórz model, który używa nowej kolumna.Do wykonania niektórych badań użyje tych modeli wyszukiwania.

Oddzielny model do przewidywanie i oceny punktowej zbudować wreszcie, gdy zapewne z modelu sieci neuronowe, które czynniki mają największy wpływ na pytanie biznesowe.Będzie używać Microsoft regresją algorytmu, który jest oparty na modelu sieci neuronowe, ale jest zoptymalizowany dla znalezienia rozwiązania oparte na określonych nakładów.

Tworzenie struktury domyślne Centrum wywołania

Do tworzenia domyślnej sieci neuronowe struktura wyszukiwania i modelu

  1. W oknie Solution Explorer w Business Intelligence Development Studio, kliknij prawym przyciskiem myszy Górnictwa struktur i wybierz Nowej struktury górnictwa.

  2. Na Zapraszamy kreatora wyszukiwania danych strona, kliknij przycisk Dalej.

  3. Na Wybierz metodę definicji strona upewnij się, że z istniejących relacyjnej bazy danych lub magazyn danych jest zaznaczone, a następnie kliknij Dalej.

  4. Na Tworzenie struktury danych górnictwa strona, sprawdź, czy opcja Tworzenie struktura wyszukiwania z model wyszukiwania jest zaznaczone.

  5. Kliknij listę rozwijaną dla opcji od techniki wyszukiwanie danych chcesz użyć?, następnie wybierz Sieci neuronowe Microsoft.

    Ponieważ logistyczne regresja modele są oparte na sieci neuronowe, można użyć ponownie tę samą strukturę i dodać nowy model górnictwa.

  6. Kliknij Dalej.

    Widok źródła danych wybierz zostanie wyświetlona strona.

  7. W obszarze Widoki źródło danych dostępne, wybierz opcję Centrum wywołaniei kliknij przycisk Dalej.

  8. Na Określić typy tabel strona, zaznacz przypadku pole wyboru obok FactCallCenter tabela.Kliknij Dalej.

  9. Na Określ dane szkolenia strona, zaznacz klucz obok kolumna FactCallCenterID.

  10. Wybierz Predict i wprowadzania pola wyboru.

  11. Wybierz klucz, wprowadzania, i Predict pola wyboru, jak pokazano w poniższej tabela:

    Tabele i kolumny

    Klucz/Input/prognozowania

    AutomaticResponses

    Dane wejściowe

    AverageTimePerIssue

    Przewidywanie/wprowadzania

    Calls

    Dane wejściowe

    DateKey

    Nie należy używać

    DayOfWeek

    Dane wejściowe

    FactCallCenterID

    Klucz

    IssuesRaised

    Dane wejściowe

    LevelOneOperators

    Przewidywanie/wprowadzania

    LevelTwoOperators

    Dane wejściowe

    Orders

    Przewidywanie/wprowadzania

    ServiceGrade

    Przewidywanie/wprowadzania

    Shift

    Dane wejściowe

    TotalOperators

    Nie należy używać

    WageType

    Dane wejściowe

  12. Na określić kolumny Zawartość i typ danych strona, sprawdź, czy siatka zawiera kolumny, typy zawartości i typy danych, jak pokazano w poniższej tabela, a następnie kliknij Dalej.

    kolumny

    Typ zawartości

    Typy danych

    AutomaticResponses

    Ciągłe

    Długie

    AverageTimePerIssue

    Ciągłe

    Długie

    Calls

    Ciągłe

    Długie

    DayOfWeek

    Dyskretne

    Tekst

    FactCallCenterID

    Klucz

    Długie

    IssuesRaised

    Ciągłe

    Długie

    LevelOneOperators

    Ciągłe

    Długie

    LevelTwoOperators

    Ciągłe

    Długie

    Orders

    Ciągłe

    Długie

    ServiceGrade

    Ciągłe

    Double

    Shift

    Dyskretne

    Tekst

    WageType

    Dyskretne

    Tekst

  13. Na Tworzenie zestaw testów strona, wyczyść pole tekstowe dla opcji, udział procentowy danych testowych.Kliknij Dalej.

  14. Na Kończenie pracy Kreatora strona, dla nazwy struktury górnictwa, typ Centrum wywołanie.

  15. Dla nazwę modelu górnictwa, typu Wywołania NN domyślne Centrum, a następnie kliknij przycisk Zakończ.

    Zezwalaj na drążenie wskroś pole jest wyłączone, ponieważ nie można drążyć wskroś danych z modeli sieci neuronowe.

  16. W oknie Solution Explorer kliknij prawym przyciskiem myszy nazwę dane struktura wyszukiwania właśnie utworzonym i wybierz proces.

Opis Discretization

Domyślnie podczas tworzenia modelu sieci neuronowe, który ma atrybut numeryczny przewidywalne algorytm sieci neuronowe Microsoft traktuje jako numer kolejny atrybutu.Na przykład ServiceGrade atrybut jest liczbą teoretycznie zakresy z 0,00 (wszystkie połączenia są odbierane) do 1,00 (wszystkie obiekty wywołujące Rozłącz).W tym zestaw danych, wartości mają następujący podział:

dystrybucja wartości jakości obsługi

W rezultacie podczas przetwarzania modelu wyjść mogą być pogrupowane inaczej niż oczekujesz.Na przykład domyślny model, który używa klastrowanie Aby znaleźć grupy wartości dzieli ServiceGrade do zakresów, takiej jak to: 0.0748051948 - 0.09716216215.Mimo to grupowanie matematycznie dokładne, takie zakresy może nie być tak istotnych dla użytkowników biznesowych.Inny sposób grupowania wartości liczbowe, można utworzyć kopię lub wiele kopii kolumna danych liczbowych i określić sposób algorytmu wyszukiwanie danych należy przetworzyć wartości.Na przykład określić, że algorytm podzielić wartości na nie więcej niż pięciu pojemników.

Usługi Analysis Services oferuje różne metody binning lub przetwarzania danych liczbowych.W poniższej tabela przedstawiono różnice między wyniki podczas atrybut wyjściowego ServiceGrade została przetworzona trzy różne sposoby:

  • Traktując je jako numer kolejny

  • Posiadające algorytm dyskretyzować wartość przez najlepszych możliwych metoda, co się dzieje się klastrowanie

  • Określanie, że numery być binned przez metoda równe obszary

Domyślny model (ciągłe)

Binned przezklastrowanie

Binned przez obszary równe

VALUEOBSŁUGA
Brak0
0.09875120
VALUEOBSŁUGA
< 0.074805194834
0.0748051948 - 0.0971621621527
0.09716216215 - 0.1329729729539
0.13297297295 - 0.16749999997510
>= 0.16749999997510
VALUEOBSŁUGA
< 0.0726
0.07 - 0.0022
0.09 - 0.1136
>= 0.1236

W tej tabela kolumna wartość pokazuje, jak numer kolejny została zrealizowana, a kolumna obsługi pokazuje, ile wierszy znaleziono wartość, zakres lub typ wartości.Aby uzyskać więcej informacji dotyczących opcji binning, zobacz Metody discretization (wyszukiwania danych).

Ostrzeżenie

Te statystyki węzeł Statystyka marginalny modelu, można uzyskać po wszystkich przetwarzania danych.Aby uzyskać więcej informacji na temat węzeł Statystyka marginalny Zobacz Model zawartości dla sieci neuronowe modeli górnictwo (Analysis Services - wyszukiwania danych).

Alternatively, rather than using the numeric values, you could add a separate derived column that classifies the service grades into predefined target ranges, such as Best (ServiceGrade <= 0.05), Acceptable (0.10 > ServiceGrade > 0.05), and Poor (ServiceGrade >= 0.10).

Tworząc kopię kolumny i zmiana metody Discretization

W przypadku wyszukiwanie danych usług Analysis Services, można łatwo zmienić sposób, w jaki dane liczbowe jest binned w struktura wyszukiwania poprzez dodanie kopię kolumna zawierające dane miejsce docelowe i zmiana metoda discretization.

Poniższa procedura opisuje sposób kopii kolumna górnictwa, która zawiera atrybut miejsce docelowe ServiceGrade.Można utworzyć wiele kopii dowolnej kolumna w struktura wyszukiwania, włączając przewidywalne atrybut.

Następnie będzie Dostosowywanie grupowanie wartości liczbowe kolumna skopiowane do zmniejszenia złożoności grupowanie.Ten samouczek będzie równe obszary metoda discretization i określić cztery pakiety.Grupowanie, wynikające z tej metoda są dość blisko wartości miejsce docelowe interesu użytkowników biznesowych.

Ostrzeżenie

Podczas początkowej eksploracji danych można również eksperymentować z różnych metod discretization lub spróbuj najpierw klastrowanie danych.

Aby utworzyć dostosowaną kopię kolumna wstruktura wyszukiwania

  1. W oknie Solution Explorer kliknij dwukrotnie struktura wyszukiwania utworzony.

  2. W struktura wyszukiwania , kliknij pozycję Dodaj struktura wyszukiwania kolumny.

  3. W Zaznacz kolumnę okno dialogowe, wybierz ServiceGrade z listy w Kolumna źródłowa, następnie kliknij przycisk OK.

    Nowa kolumna zostanie dodana do listy struktura wyszukiwania kolumny.Domyślnie nowa kolumna górnictwo ma taką samą nazwę jak istniejąca kolumna z przyrostkowe numeryczne: na przykład ServiceGrade 1.Można zmienić nazwę kolumna, to być bardziej opisową.

    Należy również określić metoda discretization.

  4. Kliknij prawym przyciskiem myszy ServiceGrade 1 i wybierz Właściwości.

  5. W Właściwości okna, zlokalizuj nazwę właściwość i Zmień nazwę, aby wywołać NN Centrum Binned.

  6. Okno dialogowe pojawi się pytaniem, czy chcesz wprowadzić zmiany tej samej nazwy wszystkich powiązanych model wyszukiwania kolumny.Click No.

  7. W Właściwości okna zlokalizować sekcji Typ danych i rozwiń ją, jeśli to konieczne.

  8. Zmień wartość właściwość Content z Continuous do Discretized.

    Dostępne są następujące właściwości.Zmiana wartości właściwości, jak pokazano w poniższej tabela:

    Właściwość

    Wartość domyślna

    Nowa wartość

    DiscretizationMethod

    Continuous

    EqualAreas

    DiscretizationBucketCount

    Brak wartości

    4

    Ostrzeżenie

    Wartość domyślna, DiscretizationBucketCount jest faktycznie 0, co oznacza, że algorytm automatycznie określa optymalną liczbę wiadrach.Dlatego jeśli chcesz przywrócić jego domyślną wartość tej właściwość, wpisz 0.

  9. W projektancie wyszukiwania danych, kliknij przycisk Górnictwa modele kartę.

    Zauważ, że podczas dodawania kopię kolumna struktura wyszukiwania Flaga użycia kopii jest automatycznie zestaw do Ignore.Zazwyczaj po dodaniu kolumna kopii struktura wyszukiwania kopii nie należy używać do analizy wraz z oryginalną kolumna lub algorytm znajdzie silne powiązania między dwoma kolumnami, które mogą zasłaniać inne relacje.

Dodawanie nowego modelu górnictwo struktury górnictwo

Utworzono nowy grupowanie dla atrybut miejsce docelowe, należy dodać nowy model wyszukiwania używający discretized kolumna.Po zakończeniu, CallCenter struktura wyszukiwania będzie miał dwa modele górnictwa:

  • model wyszukiwania, Call Center Default NN, Uchwyty ServiceGrade wartości jak ciągłego zakres.

  • model wyszukiwania, Call Center Binned NN, Discretizes ServiceGrade wartości na cztery różne pakiety.

Aby dodać model wyszukiwania na podstawie nowej kolumna zdyskretyzowana

  1. W oknie Solution Explorer kliknij prawym przyciskiem myszy struktura wyszukiwania właśnie utworzonym i wybierz Otwórz.

  2. Kliknij Górnictwa modele kartę.

  3. Kliknij Tworzenie powiązanych model wyszukiwania.

  4. W Nowy Model górnictwa okno dialogowe dla nazwę modelu, typ Wywołania NN Centrum Binned.W Nazwa algorytmu listy rozwijanej wybierz Sieci neuronowe Microsoft.

  5. Na liście kolumn zawartych w nowym model wyszukiwania, zlokalizuj ServiceGradei zmień korzystaniu z Predict do Ignore.

  6. Podobnie, zlokalizuj ServiceGrade Binnedi zmień korzystaniu z Ignore do Predict.

Zazwyczaj nie można porównać modeli górnictwa, używających różnych atrybutów przewidywalne.Jednakże w SQL Server 2008, można utworzyć alias dla model wyszukiwania kolumna.Oznacza to, że można zmienić nazwy ServiceGrade Binned kolumna wewnątrz model wyszukiwania tak, aby ma taką samą nazwę jak oryginalne kolumna.Można następnie bezpośrednio porównać te dwa modele wykresie dokładności nawet danych jest discretized inaczej.

Aby dodać alias struktura wyszukiwania kolumn w modelu górnictwo

  1. W Górnictwa modele kartę w struktury, wybierz opcję ServiceGrade Binned.

    Należy zauważyć, że Właściwości okno wyświetla właściwości obiektu ScalarMiningStructure kolumna.

  2. kolumna dla model wyszukiwania, ServiceGrade Binned NN, kliknij komórka kolumna odpowiadające ServiceGrade Binned.

    Uwaga to teraz Właściwości okno wyświetla właściwości dla obiektu MiningModelColumn.

  3. Zlokalizuj nazwę właściwość i zmień wartość ServiceGrade.

  4. Zlokalizuj Opis właściwość i wpisz alias kolumna tymczasowe.

    Właściwości okno powinny zawierać następujące informacje:

    Właściwość

    Wartość

    Opis

    Alias kolumna tymczasowe

    Identyfikator

    ServiceGrade Binned

    Modelowanie flag

      

    Nazwa

    Klasa usług

    Identyfikator elementu SourceColumn

    Kategoria usługi 1

    Użycie

    Przewidywanie

  5. Kliknij w dowolnym miejscu Górnictwa modelu kartę.

    Siatka zostanie zaktualizowana, aby wyświetlić nowy alias tymczasową kolumna ServiceGrade, obok użycia kolumna.Siatki, zawierający struktura wyszukiwania i dwóch modeli wyszukiwania powinna wyglądać następująco:

    Struktura

    Domyślne Centrum obsługi telefonicznej NN

    Wywołanie Centrum Binned NN

      

    Microsoft sieci neuronowe

    Microsoft sieci neuronowe

    AutomaticResponses

    Dane wejściowe

    Dane wejściowe

    AverageTimePerIssue

    Przewidywanie

    Przewidywanie

    Wywołania

    Dane wejściowe

    Dane wejściowe

    DayOfWeek

    Dane wejściowe

    Dane wejściowe

    FactCallCenterID

    Klucz

    Klucz

    IssuesRaised

    Dane wejściowe

    Dane wejściowe

    LevelOneOperators

    Dane wejściowe

    Dane wejściowe

    LevelTwoOperators

    Dane wejściowe

    Dane wejściowe

    Zamówienia

    Dane wejściowe

    Dane wejściowe

    ServceGrade Binned

    Ignoruj

    Przewidywanie (ServiceGrade)

    ServiceGrade

    Przewidywanie

    Ignoruj

    SHIFT

    Dane wejściowe

    Dane wejściowe

    Całkowita operatorów

    Dane wejściowe

    Dane wejściowe

    WageType

    Dane wejściowe

    Dane wejściowe

Przetwarzanie modelu

Wreszcie, w celu zapewnienia, że modele utworzone są porównywalne, będzie zestaw materiału siewnego parametr domyślny i modele binned.Ustawienie wartości materiału siewnego gwarancji, że każdy model rozpoczyna przetwarzanie danych z tego samego punktu.

Ostrzeżenie

Jeśli nie określisz wartość liczbową parametru materiału siewnego, SQL Server Analysis Services generują materiału siewnego, na podstawie nazwy modelu.Ponieważ model sieci neuronowe i model regresją mają różne nazwy, należy zestaw wartość początkową dla zapewnienia przetwarzania danych w tej samej kolejności.

Aby określić materiał siewny i przetworzyć modele

  1. W Górnictwa modelu kartę, kliknij prawym przyciskiem myszy kolumna dla modelu o nazwie Call Center - LRi wybierz Ustawić parametry algorytmu.

  2. W wierszu dla parametru HOLDOUT_SEED, kliknij puste komórka w obszarze wartość, a następnie wpisz 1.Click OK.Powtórz ten krok dla każdego modelu skojarzonych ze strukturą.

    Ostrzeżenie

    Wartość wybierz jako materiał siewny nie ma znaczenia, jak użyć tego samego materiału siewnego dla wszystkich powiązanych modeli.

  3. W Górnictwa modele menu wybierz struktury górnictwa proces i wszystkie modele.Kliknij Tak wdrożyć zaktualizowanego wyszukiwanie danych projektu na serwerze.

  4. W Górnictwa Model procesu okno dialogowe, kliknij przycisk uruchomić.

  5. Kliknij zamknąć zamknąć Postępu procesu okno dialogowe, a następnie kliknij zamknąć ponownie Górnictwa Model procesu okno dialogowe.

Teraz, utworzono dwa modele pokrewne górnictwa, będą eksplorować dane wykrywanie relacje w danych.