Analiza predykcyjna z wykorzystaniem SQL Server 2008, cz. I     Analiza predykcyjna z wykorzystaniem SQL Server 2008

Analiza predykcyjna z wykorzystaniem SQL Server 2008, cz. II Udostępnij na: Facebook

Opublikowano: 27 czerwca 2008

Microsoft® SQL Server® 2008 oferuje analizę predykcyjną za pośrednictwem pełnego i intuicyjnego zestawu narzędzi Data Mining. Głęboka integracja z platformą Microsoft Business Intelligence zapewnia bogate wglądy na każdym etapie cyklu życia danych. Co więcej, elastyczna platforma umożliwia umieszczenie funkcji predykcji w dowolnej aplikacji.

Zawartość strony
Wgląd na każdym etapie cyklu życia danych  Wgląd na każdym etapie cyklu życia danych
Wspieranie funkcji Data Mining w każdej aplikacji  Wspieranie funkcji Data Mining w każdej aplikacji
Wnioski  Wnioski

Wgląd na każdym etapie cyklu życia danych

Zarówno w procesie wykorzystywania, analizowania, monitorowania, planowania, badania, jak i raportowania danych biznesowych, analiza predykcyjna pozwala uzyskiwać bogate wglądy, który odsłaniają nowe perspektywy rozwoju. SQL Server 2008 należy do rodziny technologii Business Intelligence, której wszystkie elementy współpracują ze sobą w celu dostarczenia wszechstronnej platformy umożliwiającej organizacjom stosowanie analizy predykcyjnej na każdym etapie cyklu życia danych.

Natywna integracja z systemem raportowania

Raportowanie stanowi fundamentalny aspekt działalności większości organizacji. Usługi SQL Server 2008 Reporting Services zapewniają wszechstronne rozwiązanie do tworzenia, renderowania i wdrażania raportów w całej korporacji. SQL Server Reporting Services mogą renderować raporty bezpośrednio na podstawie modelu Data Mining z wykorzystaniem kwerend Data Mining Extensions (DMX). Dzięki temu użytkownicy mogą wizualizować zawartość modeli Data Mining w celu zoptymalizowania reprezentacji danych. Co więcej możliwość wykonywania kwerendy bezpośrednio w strukturze Data Mining ułatwia użytkownikom dołączanie atrybutów spoza zakresu wymagań modelu Data Mining, prezentując pełne i znaczące informacje. Rysunek 4 przedstawia edytor kwerendy DMX dla Reporting Services.

Rysunek 1: Edytor kwerendy DMX dla SQL Server Reporting Services

Usługi SQL Server Reporting Services zapewniają możliwość generowania sterowanych parametrami raportów bazujących na prawdopodobieństwie predykcyjnym. Na przykład kwerenda pokazana na Rysunku 4 analizuje listę potencjalnych klientów dla hipotetycznego sklepu z rowerami Adventure Works i wykorzystuje model Data Mining do oszacowania prawdopodobieństwa zakupu roweru przez poszczególnych klientów. Kwerenda dokonuje filtrowania tak, aby zwracane były tylko dane klientów, którzy dokonają zakupu z prawdopodobieństwem większym niż 50%. Rysunek 5 pokazuje raport wynikowy, który firma może wykorzystać jako podstawę kampanii marketingowej skierowanej tylko do tych klientów, którzy z największym prawdopodobieństwem dokonają zakupu, co pozwoli znacząco poprawić efektywność kampanii i zwrot inwestycji.

Rysunek 2: A analiza predykcyjna report

Data Mining w locie podczas integracji danych

Popularność rozwiązań Business Intelligence stale wzrasta, w związku z tym firmy coraz częściej implementują rozwiązania do wyodrębniania, transformowania i ładowania (ETL), które służą do konsolidowania danych z całej organizacji w hurtowni danych na potrzeby analizy i raportowania. Jednak dane źródłowe dla tych operacji często są niekompletne, a w przypadku niektórych obiektów biznesowych, takich jak klienci, mogą wymagać poklasyfikowania na kategorie w oparciu o wspólne cechy charakterystyczne profilu.

Microsoft SQL Server 2008 Integration Services stanowią zaawansowaną, rozszerzalną platformę ETL, którą programiści rozwiązań Business Intelligence mogą wykorzystać do implementowania operacji ETL porządkujących i transformujących dane w locie. SQL Server Integration Services zawierają lokalizację docelową Data Mining Model Training służącą do szkolenia modeli Data Mining oraz transformację Data Mining Query, która może posłużyć do realizowania analizy predykcyjnej na danych, gdy są one przekazywane w ramach przepływu danych. Integracja analizy predykcyjnej z SQL Server Integration Services umożliwia organizacjom oznakowywanie nietypowych danych, klasyfikowanie obiektów biznesowych, stosowanie technologii Text Mining oraz wypełnianie brakujących wartości w locie w oparciu o możliwości i wglądy zapewniane przez algorytmy Data Mining. Na przykład proces ETL może powodować wyodrębnianie danych klientów z jednego lub wielu systemów źródłowych w celu umieszczenia ich w hurtowni danych. Tradycyjnie funkcje Data Mining byłyby stosowane po załadowaniu danych do hurtowni danych w celu poklasyfikowania klientów według przewidywanych zachowań nabywczych lub zrealizowania innych zadań zarządzania kampanią marketingową. Jednak dzięki usługom SQL Server Integration Services transformacja Data Mining Query może zostać zastosowana na modelu Data Mining już w trakcie procesu ETL, dzięki czemu hurtownia danych jest wypełniana poklasyfikowanymi danymi już na etapie ładowania. To zmniejsza ilość pracy, którą trzeba wykonać na serwerze hurtowni danych i sprawia, że dane dostępne do analizy są zawsze aktualne i spójnie poklasyfikowane. Co więcej klasyfikacja w czasie procesu ETL może również posłużyć do odfiltrowywania rekordów klientów, które nie pasują do żadnej znanej klasyfikacji. Rekordy te mogą być wynikiem słabej jakości danych lub mogą reprezentować nową klasyfikację, która jeszcze nie została uchwycona w procesie zarządzania kampaniami. W obu tych przypadkach SQL Server Integration Services mogą wykrywać te rekordy przy użyciu mechanizmu Data Mining i kierować je do własnoręcznego lub zautomatyzowanego przeglądu.

Rysunek 6 prezentuje przepływ danych SQL Server Integration Services, który obejmuje transformację Data Mining Query.

Rysunek 3: Data Mining w SQL Server Integration Services

Wnikliwa analiza

Usługi SQL Server 2008 Analysis Services stanowią wysoce skalowalną platformę do przeprowadzania wielowymiarowych analiz OLAP. Wielu klientów czerpie już korzyści z możliwości tworzenia zunifikowanego modelu wymiarowego (UDM) w Analysis Services i wykorzystywania go do fragmentowania miar biznesowych według wielu wymiarów. Analiza predykcyjna stanowiąca element SQL Server 2008 Analysis Services oferuje bogatszą funkcjonalność OLAP, wspierając wymiary Data Mining, które dzielą dane według ukrytych wewnątrz wzorców. Na przykład dział sprzedaży i marketingu może tworzyć strukturę Mining bazującą na istniejącym wymiarze Customer OLAP i wykorzystać ją do klasyfikowania klientów do klastrów, które przejawiają podobne cechy charakterystyczne. Następnie ta struktura Data Mining może posłużyć do wygenerowania nowego wymiaru Data Mining w celu przeprowadzenia analizy danych sprzedaży w oparciu o zidentyfikowane klastry klientów. Rysunek 7 prezentuje wymiar Data Mining w module OLAP.

Rysunek 4: Wymiar Data Mining w module OLAP

Poza dołączaniem wyników działania funkcji Data Mining do wymiarów OLAP SQL Server 2008 umożliwia również umieszczanie funkcji predykcyjnych bazujących na modelach Data Mining w wyliczeniach i wskaźnikach KPI.

Predykcyjne wskaźniki KPI

Wiele firm wykorzystuje wskaźniki KPI do oceny kluczowych, mierzalnych aspektów działalności biznesowej w kontekście wyznaczonych celów. SQL Server 2008 Analysis Services oferują scentralizowaną platformę dla wskaźników KPI z całej organizacji, a integracja z Microsoft Office PerformancePoint™ Server 2007 umożliwia osobom podejmującym decyzje budowanie biznesowych pulpitów nawigacyjnych (ang. dashboard), za pośrednictwem których mogą oni monitorować wydajność firmy. Wskaźniki KPI są z reguły retrospekcyjne np. pokazują całkowitą sprzedaż z ostatniego miesiąca w porównaniu z planowaną sprzedażą docelową. Jednak korzystając z analiz możliwych dzięki technologii Data Mining, organizacje mogą budować predykcyjne wskaźniki KPI, które przewidują przyszłą wydajność w kontekście określonych celów, stwarzając firmie szansę na proaktywne wykrycie i rozwiązanie potencjalnych problemów. Rysunek 8 ilustruje wskaźnik KPI, który prezentuje przybliżoną, oszacowaną liczbę przyszłych zamówień.

Rysunek 5: Microsoft Office PerformancePoint Server 2007

Dodatkowo analiza predykcyjna może wykrywać atrybuty, które wpływają na wskaźniki KPI. Korzystając z Office PerformancePoint Server 2007, użytkownicy mogą monitorować trendy w kluczowych wskaźnikach w celu rozpoznania tych atrybutów, które mają trwały efekt, np. sprawdzając, czy obniżenie ceny konkurencyjnego produktu ma stały wpływ na sprzedaż czy generuje jedynie krótkoterminowe zawirowania. Tego typu analizy dostarczają firmom informacje, które pozwalają im poprawić strategię reagowania.

 Do początku strony Do początku strony

Wspieranie funkcji Data Mining w każdej aplikacji

Jak można się było przekonać na podstawie dotychczasowej części niniejszego artykułu, SQL Server 2008 zapewnia wszechstronne rozwiązanie Data Mining, a ścisła integracja z platformą Microsoft Business Intelligence ułatwia udostępnianie funkcji analizy predykcyjnej użytkownikom oraz automatycznym procesom w obrębie całej korporacji. Jednak nadal mogą pojawiać się sytuacje, w których istnieje potrzeba wbudowania funkcjonalności Data Mining w aplikację, zastosowania analizy biznesowej w istniejącym procesie biznesowym lub rozszerzenia technologii Data Mining w odpowiedzi na specyficzny problem biznesowy. Z myślą o takich sytuacjach SQL Server oferuje elastyczną i rozszerzalną platformę programistyczną, która pozwala włączać predykcję i analizy w specjalistyczne aplikacje biznesowe.

Programowanie predykcyjne

SQL Server 2008 Data Mining wspiera wiele różnych interfejsów programowania aplikacji (API), które programiści mogą stosować do budowania niestandardowych rozwiązań wykorzystujących funkcje analizy predykcyjnej serwera SQL Server. DMX, XMLA, OLEDB oraz ADOMD.NET, a także obiekty AMO (Analysis Management Objects) oferują bogatą, w pełni udokumentowaną platformę programistyczną, która pozwala programistom budować aplikacje z obsługą technologii Data Mining, a także umożliwia dostarczanie odkryć i rekomendacji czasu rzeczywistego za pośrednictwem istniejących narzędzi.

Dzięki tej rozszerzalności organizacje biznesowe oraz niezależni dostawcy oprogramowania mają możliwość wbudowywania analizy predykcyjnej w specjalistyczne aplikacje biznesowe, wzbogacając je o wglądy oraz prognozy, które wspierają proces podejmowania decyzji oraz inne procesy biznesowe. Za przykład może posłużyć pakiet Analytics Foundation, który dodaje do aplikacji Microsoft Dynamics® CRM predykcyjny system oceniania. Umożliwia on pracownikom organizacji handlowych, marketingowych bądź usługowych identyfikowanie sprzyjających okoliczności (charakteryzujących się większym prawdopodobieństwem dokonania sprzedaży), podnosząc tym samym efektywność i poprawiając produktywność (więcej informacji znaleźć można pod adresem https://www.microsoft.com/dynamics/crm/product/analyticsfoundation.mspx).

Algorytmy typu plug-in oraz wizualizacje niestandardowe

Zestaw narzędzi SQL Server Data Mining może być w pełni rozszerzany przy pomocy procedur składowanych Microsoft .NET, algorytmów typu plug-in, niestandardowych wizualizacji oraz języka PMML. To pozwala programistom rozszerzać standardowe technologie Data Mining w SQL Server 2008 tak, aby spełniały one nietypowe wymagania biznesowe charakterystyczne dla danej organizacji poprzez:

  • Tworzenie niestandardowych algorytmów Data Mining w celu rozwiązywania charakterystycznych dla danej firmy problemów analitycznych.
  • Wykorzystanie algorytmów Data Mining oferowanych przez innych dostawców oprogramowania.
  • Tworzenie niestandardowych wizualizacji modeli Data Mining za pośrednictwem interfejsów API przeglądarek typu plug-in.

 Do początku strony Do początku strony

Wnioski

Dzięki niniejszemu dokumentowi można było przekonać się, że usługi SQL Server 2008 Analysis Services oferują kompleksową platformę Data Mining, którą organizacje mogą wykorzystać do inspirowania codziennych decyzji biznesowych przy pomocy wglądów i predykcji. Szerokie rozpowszechnianie za pośrednictwem dodatku Data Mining dla systemu Office 2007 powoduje, że możliwości analizy predykcyjnej wraz z intuicyjnymi narzędziami oraz czytelnymi wynikami są dostępne w obrębie całej korporacji za pośrednictwem komputerów osobistych. Wszechstronne środowisko programistyczne oraz rozszerzalny zakres innowacyjnych algorytmów Data Mining w połączeniu z korporacyjną skalowalnością oraz łatwością zarządzania zapewnianą przez usługi SQL Server Analysis Services sprawiają, że SQL Server 2008 jest idealnym sposobem udostępniania dobrodziejstw analizy predykcyjnej w każdej firmie.

Możliwości analizy predykcyjnej serwera SQL Server 2008 stanowiącego część platformy BI firmy Microsoft są ściśle zintegrowane z każdym etapem cyklu życia danych, co umożliwia stosowanie analiz w procesach raportowania, integracji danych, analizy OLAP oraz monitorowania wydajności firmy. Tak szeroka integracja analizy predykcyjnej z ekosystemem danych organizacji prowadzi do zwiększenia sprawności firmy i zapewnia odczuwalny wzrost konkurencyjności.

Chociaż funkcjonalność Data Mining dostarczana wraz z serwerem SQL Server 2008 jest wystarczająco uniwersalna, aby spełniać wymagania stawiane przez szeroki zakres scenariuszy biznesowych, jej rozszerzalność zapewnia, że może być ona wykorzystywana do rozwiązywania praktycznie każdego problemu związanego z predykcją. Potencjał rozszerzania technologii Data Mining serwera SQL Server za pośrednictwem niestandardowych algorytmów i wizualizacji wraz z możliwością wbudowywania funkcji predykcyjnych w specjalistyczne aplikacje biznesowe czyni SQL Server 2008 zaawansowaną platformą do wprowadzania analizy predykcyjnej w ramach istniejących procesów biznesowych w celu zapewniania wglądów i rekomendacji wspierających codzienne działania.

Dodatkowe informacje:
https://www.microsoft.com/sql

 Do początku strony Do początku strony

Analiza predykcyjna z wykorzystaniem SQL Server 2008, cz. I     Analiza predykcyjna z wykorzystaniem SQL Server 2008