Profilowanie danych z danymi profilowania Podgląd i zadania

Profilowanie dane zadanie dostarcza dane profilowania funkcji wewnątrz procesu wyodrębniania, transformacji i ładowania danych.Przy użyciu profilowania dane zadanie, można osiągnąć następujące korzyści:

  • Analizowanie źródło danych skuteczniej

  • Zrozumienie źródło danych lepiej

  • Zapobieganie problemom jakości danych, zanim zostaną wprowadzone do magazyn danych.

Ważna informacjaWażne:

Profilowanie danych zadań działa tylko z danych przechowywanych w SQL Server 2000 lub nowszej wersji.Nie działa ze źródłami danych firm lub plikach.

Co to jest profilowania danych?

Jakość danych jest ważne dla każdej działalności.Jak przedsiębiorstw tworzyć systemy analityczne i biznesowych analiz nad ich systemów transakcyjnych wiarygodność klucz wskaźniki wydajności i danych górnictwo prognoz zależy całkowicie poprawność danych, na których są oparte.Jednak, chociaż rośnie znaczenie prawidłowych danych podejmowania decyzji biznesowych challenge zapewnianiu ważności tych danych jest również zwiększenie.Dane strumieniowo do przedsięwzięcia stale z różnych systemów i źródeł oraz dużą liczbę użytkowników.

Wskaźniki jakości danych może być trudno zdefiniować, ponieważ są one zależne od domena lub aplikacji.Jedno wspólne podejście do definiowania jakość danych to dane profilowania.

Profil danych jest kolekcja agregacji statystyk dotyczących może zawierać następujące dane:

  • Liczba wierszy w tabela Nabywca.

  • Liczba różnych wartości kolumna Stan.

  • Liczba wartości null lub brakujące kolumna Zip.

  • Rozkład wartości kolumna Miasto.

  • Wytrzymałość współzależności funkcjonalnych kolumna Stan kolumna Zip — oznacza to, że Państwa powinny zawsze taka sama dla wartości danej zip.

Statystyki, zapewniający profilu danych daje informacje potrzebne w celu zminimalizowania skutecznie problemów jakości, które mogą wystąpić z pomocą źródło danych.

Działanie usług integracji danych profilowania

W Integration Services, danych profilowanie procesów składa się z następujących kroków:

  • Krok 1: Definiowanie zadań profilowania danych
    Profilowanie dane zadanie jest zadaniem, które służy do konfigurowania profilów, które chcesz obliczyć.Następnie uruchom pakiet zawierający zadanie profilowania danych do obliczenia profile.Zadanie zapisuje profilu wyjściowego w formacie XML do pliku lub zmiennej pakiet.

    Aby uzyskać więcej informacji:Konfigurowanie danych profilowania zadania

  • Krok 2: Recenzowanie profilów, które oblicza dane zadanie profilowania
    Aby przeglądać profile danych, które oblicza profilowania dane zadanie, należy wysłać dane wyjściowe do pliku, a następnie użyj Przeglądarka profilu danych.Ta przeglądarka jest autonomiczne narzędzie, które wyświetla profilu wyjściowego w formacie Podsumowanie i szczegóły z funkcji drążenia opcjonalne.

    Aby uzyskać więcej informacji:Wyświetlanie profilu wyjściowego wPrzeglądarka profilu danych

Dodawanie logiki warunkowego do danych profilowania przepływu pracy

Profilowanie dane zadanie nie ma wbudowane funkcje, które umożliwiają użycie warunkowe logiki połączyć to zadanie zadania niższego rzędu, oparte na wyjściowy profil.Jednakże można łatwo dodać tę logikę z niewielką ilość programowania, zadania skryptu.Na przykład zadania skryptu można wykonać kwerendę XPath przeciwko plik wyjściowy profilowania dane zadanie.Kwerenda może określić, czy procent wartości null w szczególności kolumna przekroczy określony próg.Jeśli procent przekracza próg, może przerwać pakiet i rozwiązać problem w źródło danych przed kontynuowaniem.Aby uzyskać więcej informacji, zobacz Przy użyciu profilowania zadania w przepływie pracy pakiet danych.

Ikona usług Integration Services (mała)Bieżąco z usług integracji

Najnowsze pliki do pobrania, artykuły, próbki i wideo firmy Microsoft, jak również wybranych rozwiązań ze Wspólnoty, odwiedź witrynę Integration Services strona na MSDN i TechNet:

Aby otrzymywać automatyczne powiadomienia dotyczące tych aktualizacji, zasubskrybuj źródła danych RSS dostępne na tej stronie.