Artykuł
07/22/2011

Algorytm serii Microsoft czasu

Microsoft Algorytm szeregu czasowego zapewnia regresja algorytmy, które są zoptymalizowane pod kątem prognozowanie ciągłe wartości, takie jak sprzedaż produktu, na czas.Stosowanie innych Microsoft algorytmy, takich jak drzewa decyzji, wymagają dodatkowych kolumn nowych informacji jako dane wejściowe do przewidywania trend, czas model serii nie nie.A czas model serii można prognozować trendy oparte tylko na oryginalny zestaw danych jest używany do tworzenia modelu.Można również dodać nowe dane do modelu należy przewidywanie i automatycznie uwzględnić nowe dane do analizy trend.

Na poniższym diagramie przedstawiono typowy model do prognozowania sprzedaży produktu w czterech różnych regionów sprzedaży przez czas.Przedstawiona na diagramie modelu przedstawia sprzedaż dla każdego region wykreślane jako czerwony, żółty, purpurowe i niebieskie linie.Wiersz dla każdego region ma dwie części:

Informacji historycznych pojawia się na lewo od pionowej linii i reprezentuje dane algorytm używany do tworzenia modelu.
Przewidywane informacje z prawej linii pionowej i reprezentuje tworzącym modelu prognozy.

Kombinacja źródło dane i dane prognozowania jest nazywany serii.

Przykład szeregu czasowego

Ważne Funkcja Microsoft algorytm szeregu czasowego to, że można wykonywać przewidywanie krzyżowego.Jeśli użytkownik szkolić algorytm z dwóch serii oddzielnych, ale powiązane, można użyć modelu wynikowego do przewidywania wyniku jednej serii oparte na zachowanie innych serii.Na przykład zaobserwowanych sprzedaż jednego produktu może mieć wpływ prognozowanych sprzedaży innego produktu. przewidywanie granic jest również przydatne przy tworzeniu ogólny model, który można zastosować do wielu serii.Na przykład prognoz dla określonego region są niestabilne, ponieważ serii brakuje dobrej jakości danych. Możesz szkolić Ogólny wzór na średnią wszystkich czterech regionów i następnie zastosowanie modelu w pojedynczych serii, aby utworzyć bardziej stabilne prognoz dla każdego region.

Przykład

Zespół zarządzający w Adventure Works Cycles chce przewidywania miesięcznej sprzedaży rowerów na nadchodzący rok.Firma jest szczególnie zainteresowani czy sprzedaży rowerów w jednym modelu można przewidzieć sprzedaż innego modelu.Za pomocą Microsoft algorytm szeregu czasowego na historycznych danych z ostatnich trzech lat firmie może wygenerować danych model wyszukiwania , prognoz sprzedaży rowerów w przyszłości.Ponadto firma może wykonywać krzyżowego prognoz, aby sprawdzić, czy są powiązane trendów sprzedaży modeli rowerów w poszczególnych.

Każdego kwartału, firma planuje zaktualizować model najnowsze dane o sprzedaży i zaktualizować ich przewidywania modelu ostatnie trendy.Aby skorygować dla magazynów nie dokładnie albo stale aktualizować dane sprzedaży, spowoduje utworzenie modelu ogólne przewidywanie i który służy do tworzenia prognoz dla wszystkich regionów.

Jak działa algorytm

W SQL Server 2005, Microsoft czasu serii algorytm używany jeden algorytm, ARTxp.Algorytm ARTXp została zoptymalizowana dla prognoz krótkoterminowych i dlatego przewidywane następna wartość prawdopodobne w serii.Począwszy od SQL Server 2008, Microsoft algorytm serii czasu używa algorytmu ARTxp i drugiego algorytmu, ARIMA.Algorytm ARIMA jest zoptymalizowany do przewidywanie długoterminowe.Zobacz szczegółowe wyjaśnienie dotyczące implementacji algorytmów ARTxp i ARIMA Algorytm czas Microsoft serii techniczne.

Domyślnie Microsoft korzysta z algorytmu szeregu czasowego kombinację algorytmów, po analizę desenie i dokonywania przewidywań.Algorytm pociągów dwóch osobnych modeli na tych samych danych: jeden model używa algorytmu ARTxp, i jeden model używa algorytmu ARIMA. Algorytm mieszania następnie wyniki dwóch modeli dają najlepsze przewidywanie zmiennej liczbie czas plasterków.ARTxp jest najlepszy dla prognoz krótkoterminowych, dlatego jest on ważone bardziej intensywnie na początku szeregu prognoz.Jednak jako czas plasterki, które są przewidywaniu dalsze przeniesienie w przyszłości, ARIMA jest ważona bardziej intensywnie.

Wymieszać algorytmy preferować pełni albo krótkim lub długim okresie przewidywanie czasu można również sterować serii.Począwszy od SQL Server 2008 standardowego, można określić, że Microsoft szeregu czasowego użycia algorytmu, jedno z następujących ustawień:

Użyj tylko ARTxp przewidywanie krótkoterminowych.
Użyj tylko ARIMA długoterminowe przewidywanie.
Użyj domyślnej mieszania dwóch algorytmów.

Począwszy od SQL Server 2008 Enterprise, można dostosować sposób Microsoft szeregu czasowego algorytm mieszania modeli dla przewidywanie.Podczas korzystania z modelu mieszanych, Microsoft szeregu czasowego algorytm mieszania dwóch algorytmy w następujący sposób:

Tylko ARTxp jest zawsze używana dla dokonywania pierwsze kilka prognoz.
Po pierwsze kilka prognoz używana jest kombinacja ARIMA i ARTxp.
Jak wzrasta liczba kroków przewidywanie, przewidywanie bardziej intensywnie polegać na ARIMA, aż ARTxp nie jest już używany.
Sterowanie punktem mieszania, szybkość, jaką spadły wagi ARTxp, i wagi ARIMA jest zwiększana o ustawienie parametru PREDICTION_SMOOTHING.

Oba algorytmy, można wykrywać sezonowość danych na wielu poziomach.Na przykład dane mogą zawierać miesięcznych cykli zagnieżdżone w rocznych cykli.wykrywać tych cykli sezonowych, można dostarczyć Wskazówka okresowości lub określić algorytm powinien automatycznie wykryć okresowość.

Oprócz okresowości, jest kilka parametrów, które kontrolują zachowanie Microsoft algorytm serii czasu po wykryciu okresowości, sprawia, że przewidywania, lub analizuje przypadkach.Aby uzyskać informacje dotyczące sposobu zestaw zobacz Parametry algorytmu Algorytm czas Microsoft serii techniczne.

Wymagany czas modeli serii danych

Podczas przygotowywania danych do użycia w szkolenie danych model wyszukiwania, upewnij się, że zrozumieć wymagania dla określonego modelu i sposobu używania danych.

Prognozowanie każdy model musi zawierać liter serii jest kolumna, która określa czas plasterki lub innych serii, w którym następuje zmiana.Na przykład danych w poprzedniej diagram przedstawia serii rowerów dawne i przewidywane sprzedaży w okresie kilku miesięcy.Dla tego modelu każdego region jest serii i Data, kolumna zawiera serię czas, który jest również przypadek serii.W innych modelach serii przypadek może być tekst pole lub niektóre identyfikator, taki jak identyfikator klienta lub identyfikator transakcji.Jednak czas model serii zawsze należy użyć data, czas, lub niektóre inne unikatowa wartość liczbowa dla jego przypadek serii.

Wymagania dla czas model serii są następujące:

Pojedynczy klucz czas kolumnykażdy model musi zawierać jedną kolumnę dat lub liczb, używany jako seria przypadek, który definiuje czas plasterki używające modelu.Typ danych dla klucz czas kolumna może być albo dataczas typ danych lub typ danych numerycznych.Jednak kolumna musi zawierać wartości ciągłe i wartości muszą być unikatowe dla każdej serii.przypadek serii dla modelu serii czas nie mogą być przechowywane w dwóch kolumn, takie jak kolumna rok i miesiąc kolumny.
Przewidywalne kolumnakażdy model musi zawierać co najmniej jedną kolumna przewidywalny, wokół którego utworzy algorytm czas model serii.Typ danych przewidywalna kolumna muszą mieć ciągły wartości.Na przykład, przewidywania jak numeryczne atrybuty takie, jak zmiany temperatury, dochodu lub sprzedaży przez czas.Jednak nie można użyć kolumny, która zawiera dyskretnych wartości, takie jak stan zakupów lub poziom wykształcenia jako przewidywalna kolumna.
Kolumna klucz opcjonalne seriikażdego modelu może mieć dodatkowe kolumny klucz, który zawiera unikatowych wartości, które identyfikują serii.Kolumna klucz opcjonalne serii musi zawierać wartości unikatowe.Na przykład pojedynczy model może zawierać sprzedaż dla wielu modeli produktu, tak długo, jak istnieje tylko jeden rekord dla każdej nazwy produktu dla każdego czas plasterka.

Można zdefiniować dane wejściowe dla Microsoft model serii czasu w kilka różnych sposobów.Jednakże ponieważ format przypadkach wejściowy ma wpływ na definicję model wyszukiwania, należy rozważyć potrzeby biznesowe i odpowiednio przygotować dane.Dwa poniższe przykłady ilustrują, jak wpływa na model danych wejściowych.W obydwu przykładach wypełniony model wyszukiwania zawiera desenie cztery odrębne serii:

Sprzedaż produktu a
Sprzedaż produktu b
Objętość produktu a
Objętość produktu b

W obydwu przykładach można przewidzieć nowe przyszłej sprzedaży i objętość dla każdego produktu.Nie można przewidzieć nowe wartości dla produktu lub czas.

Przykład 1: Dwie kolumny przewidywalne

W tym przykładzie użyto poniższej tabela przypadkach wejściowe:

TimeID	Produkt	Sprzedaż	Wolumin
1/2001	A	1000	600
2/2001	A	1100	500
1/2001	B	500	900
2/2001	B	300	890

TimeID kolumna tabela zawiera czas identyfikator, i ma dwa wpisy dla każdego dnia. TimeID Kolumna staje się przypadek serii.Dlatego, byłoby wyznaczyć w tej kolumnie klucz czas kolumny dla czas model serii.

Product kolumna definiuje produktu w bazie danych.Ta kolumna zawiera serię produktu.Dlatego może wyznaczyć w tej kolumnie drugiego klucza czas model serii.

Sales kolumna opisuje zyski brutto określonego produktu dla jednego dnia, oraz kolumna woluminu ilości określonego produktu, który pozostaje w magazynie.Te dwie kolumny zawierają dane używane do szkolić modelu.

Przykład 2: Cztery kolumny przewidywalne

Chociaż w tym przykładzie użyto zasadniczo te same dane wejściowe w pierwszym przykładzie, dane wejściowe jest strukturę inaczej, jak pokazano w poniższej tabela:

TimeID	A_Sales	A_Volume	B_Sales	B_Volume
1/2001	1000	600	500	900
2/2001	1100	500	300	890

W tej tabela TimeID kolumna nadal zawiera serię przypadek czas model serii wyznaczyć jako klucz czas kolumna.Jednakże poprzedniego Sales i Volume kolumny są teraz podzielone na dwie kolumny, a każdy z tych kolumn są poprzedzone nazwę produktu.W wyniku istnieje tylko jeden wpis dla każdego dnia w TimeID kolumna.Tworzy to czas model serii zawierającym cztery kolumny przewidywalne: A_Sales, A_Volume, B_Sales i B_Volume.

Ponadto ponieważ produkty zostały podzielone na różnych kolumn, nie trzeba określić serię dodatkowe kolumna klucz.Wszystkie kolumna w modelu są kolumna serii przypadek lub przewidywalna kolumna.

Wyświetlanie modelu szeregu czasowego

Po przeszkoleni modelu wyniki są przechowywane jako zestaw wzorców, które można eksplorować lub za pomocą prognoz.

Aby poznać modelu, można użyć Czasu serii Viewer.Przeglądarka viewer zawiera wykres wyświetlający przewidywania przyszłych i widoku drzewa okresowe struktur danych.

Jeśli chcesz dowiedzieć się więcej o sposobie obliczania prognoz można przeglądać w modelu Ogólnej zawartości drzewa Podgląd programu Microsoft.Zawartość przechowywaną w modelu zawiera szczegóły, takie jak okresowe struktur wykrytych przez algorytmy ARIMA i ARTxp, równanie używane do mieszania algorytmy i inne statystyki.

Tworzenie prognoz serii czasu

Domyślnie, podczas wyświetlania czas model serii Usługi Analysis Services zawiera pięć prognoz dla serii.Jednak można utworzyć kwerendy zwraca zmienną liczbę prognoz i można dodatkowe kolumny do przewidywania zwrócić Statystyki opisowe.Dla informacji o tworzeniu kwerend przeciwko czas model serii, zobacz Badanie Model serii czas (Analysis Services - wyszukiwania danych).Przykłady użycia danych górnictwa rozszerzenia (DMX) aby czas serii prognoz, zobacz PredictTimeSeries (DMX).

Podczas korzystania z Microsoft algorytm szeregu czasowego dokonać prognoz, należy rozważyć następujące dodatkowe ograniczenia i wymagania:

przewidywanie krzyżowych jest dostępne tylko podczas korzystania z modelu mieszanych lub modelu na podstawie algorytmu ARTxp.Jeśli używany jest model oparty tylko na algorytmu ARIMA, przewidywanie krzyżowe nie jest możliwe.
A czas model serii można wprowadzać prognoz, które różnią się niektóreczass znacząco, w zależności od 64-bitowym systemie operacyjnym, używany przez serwer.Różnice te występują związana ze sposobem, Itanium-opartych na systemie reprezentuje i numery arytmetykę zmiennopozycyjną, która różni się od sposobu obsługi, x64-podstawie system wykonuje te obliczenia.Wyniki przewidywanie mogą być specyficzne dla systemu operacyjnego, zaleca się, aby ocenić modele tego samego systemu operacyjnego, który będzie używany w produkcji.

Uwagi

Nie obsługuje tworzenie modeli wyszukiwania przy użyciu przewidywanych modelu Markup Language (PMML).
Obsługuje korzystanie z modeli wyszukiwania OLAP.
Nie obsługuje tworzenia wymiary wyszukiwanie danych.
Obsługuje przeglądanie szczegółowe.