Udostępnij za pośrednictwem


Konfigurowanie danych profilowania zadania

Zanim można przejrzeć profil źródło danych, pierwszym krokiem jest do ustawiania i uruchamiania zadań danych profilowania.Tworzenie zadania wewnątrz Integration Services pakiet.Aby skonfigurować zadanie danych profilowania, korzystanie z edytora danych zadań profilowania.Edytor ten umożliwia wybranie gdzie wyjściowe profile i które profile do obliczenia.Po zestaw się zadania, uruchomić pakiet w celu obliczenia danych profilów.

Ważna informacjaWażne:

Profilowanie danych zadań działa tylko z danych przechowywanych w SQL Server 2000 lub nowszej wersji.Nie działa ze źródłami danych firm lub plikach.

Ponadto, aby uruchomić pakiet zawierający profilowania dane zadanie, należy użyć konta mającego uprawnienia do odczytu i zapisu, włączając uprawnienia CREATE TABLE na tempdb bazy danych.

Wybierając sposób użyć zadania w pakiecie

Profilowanie dane zadanie tylko konfiguruje profile i tworzy plik wyjściowy zawierający obliczanej profile.Aby przejrzeć ten plik wyjściowy, należy użyć Przeglądarka profilu danych, program viewer autonomicznych.Ponieważ dane wyjściowe należy wyświetlić oddzielnie, można użyć zadania profilowania danych pakiet, który nie zawiera innych zadań.

Jednakże, nie trzeba używać danych profilowania zadań jako zadanie tylko w pakiet.Jeśli chcesz Wykonuje profilowanie danych przepływu pracy lub przepływ danych bardziej złożonych pakiet są następujące opcje:

  • Aby zaimplementować warunkowe logiki, która jest oparta na pliku wyjściowego zadania, w przepływ sterowania pakiet, należy umieścić zadania skryptu po profilowania dane zadanie.Można następnie użyć tego zadania skryptu pliku danych wyjściowych kwerendy.

  • Do danych profilu w przepływ danych po danych został załadowany i transformacji, należy zapisać zmienione dane tymczasowo do SQL Server tabela.Następnie można profilu zapisanych danych.

Aby uzyskać więcej informacji, zobacz Przy użyciu profilowania zadania w przepływie pracy pakiet danych.

Konfigurowanie wyjście zadań

Po zadania profilowania danych znajduje się w pakiecie, należy zestaw wyjściowych profilów, które będzie obliczyć zadanie w górę.Do zestaw się dane wyjściowe profile, użyj Ogólne strona w danych profilowania zadania edytorze.Oprócz określenia obiekt docelowy danych wyjściowych, Ogólne strona również oferuje możliwość wykonywania szybkich profilu danych.Po wybraniu Profilu szybkiego, profilowania dane zadanie profile tabela lub widoku za pomocą niektóre lub wszystkie domyślne profile z ustawień domyślnych.

Aby uzyskać więcej informacji, zobacz Dane profilowania Edytor zadań (strona Ogólne) i Pojedynczy formularz profilu szybkiego tabeli (dane profilowania zadania).

Ważna informacjaWażne:

Plik wyjściowy może zawierać dane poufne temat bazy danych i danych, która zawiera.Aby sugestie, jak zabezpieczyć ten plik, zobacz Kontrolowanie dostępu do plików używanych przez pakiety.

Wybierania i konfigurowania profilów, należy obliczyć

Po zestaw pliku wyjściowego, należy wybrać, które profile danych do obliczenia.Zadania profilowania danych można obliczyć ośmiu różnych danych profilów.Pięć z tych profili analizowanie pojedynczych kolumn i pozostałe trzy analizowanie wiele kolumn lub relacje między kolumnami i tabel.W jedno zadanie profilowania danych można obliczyć wiele profilów dla wielu kolumn lub kombinacji kolumn w wielu tabel lub widoków.

W poniższej tabela opisano raporty, każdy z tych profili computes i typy danych, dla których profil jest nieprawidłowy.

Aby obliczyć

Które zidentyfikować

Używaj tego profilu

Różne długości ciąg wartości w wybranym kolumna i procent wierszy w tabela reprezentuje każdej długości.

Ciąg wartości, które nie są prawidłowe— na przykład, profil kolumna, która ma dwa znaki województw w Stanach Zjednoczonych, ale odnajdowania wartości, które są więcej niż dwóch znaków.

Rozkład długości kolumna —ważny dla kolumna z jednego z tych typów danych:

  • Znakowych typów danych: char, nchar, varchar, and nvarchar

Zestaw wyrażeń regularnych, które obejmują określony procent wartości kolumna ciąg.

Ponadto do znajdowania wyrażeń regularnych, które mogą być używane w przyszłości do sprawdzania poprawności nowych wartości

Ciąg wartości, które nie są prawidłowe lub w niepoprawnym formacie —na przykład profil deseń kolumna Kod pocztowy i pocztowy kod może dawać wyrażeń regularnych: \d{5}-\d{4} \d{5} i \d{9}.Jeżeli dane wyjściowe innych wyrażeń regularnych, danych zawiera wartości, które są nieprawidłowe lub w niepoprawnym formacie.

Profil wzorca kolumn—Ważny dla kolumna z jednego z tych typów danych:

  • Znak typy danych: char, nchar, varchar, i nvarchar

Procent wartości null w wybranym kolumna.

Nieoczekiwanie wysokie stosunek wartości null kolumna —na przykład profil kolumna, która ma zawierać kody pocztowe w Stanach Zjednoczonych, ale discover niedopuszczalnie wysoki procent brakujących kodów pocztowych.

Zerowy współczynnik kolumna —ważny dla kolumna z tych typów danych:

  • Dowolny typ danych.Obejmuje to image, text, xml, w przypadku typów zdefiniowanych przez użytkownika i wariantu typu.

Statystyki, takie jak minimalna, maksymalna, średnia i odchylenie standardowe dla kolumny liczbowe i minimalna i maksymalna dla datetime kolumny.

Wartości liczbowe i dat, które są nieprawidłowe— na przykład kolumna historycznych data profilu, ale odnajdowanie maksymalnej data w przyszłości.

Profil statystyki kolumn —ważny dla kolumna z jednego z tych typów danych:

  • Typy danych liczbowych: integer types (except bit), money, smallmoney, decimal, float, real, and numeric

  • Data i czas typów danych: datetime, smalldatetime, timestamp, date, time, datetime2, and datetimeoffset

    UwagaUwaga:
    Dla kolumna, która ma datę i czas typ danych profilu oblicza tylko minimalne i maksymalne.

Wartooci distinct w wybranym kolumna i procent wierszy w tabela reprezentuje wartość każdego.Lub wartości, które reprezentują więcej niż określony procent w tabela.

Nieprawidłowa liczba różne wartości kolumna— na przykład profilu kolumna, która zawiera Państwa w Stanach Zjednoczonych, ale odkrywać więcej niż 50 różnych wartości.

Rozkład wartość kolumna —ważny dla kolumna z jednego z tych typów danych:

  • Typy danych liczbowych: integer types (except bit), money, smallmoney, decimal, float, real, and numeric

  • Znakowych typów danych: char, nchar, varchar, and nvarchar

  • Data i czas typów danych: datetime, smalldatetime, timestamp, date, time, datetime2, and datetimeoffset

Czy kolumna lub zestaw kolumn jest klucz lub przybliżone klucza zaznaczonej tabela.

Duplikowanie wartości kolumna klucz potencjalnych —na przykład profil nazwę i adres kolumna w tabela Klienci i wykrywanie zduplikowanych wartości, w którym powinny być unikatowe kombinacje nazwę i adres.

Klucz Kandydat —profil kolumna wielu raportów, czy kolumna lub zestaw kolumn jest odpowiedni jako klucz dla wybranej tabela.

Ważne dla kolumn z jednego z tych typów danych:

  • Typy danych Liczba całkowita: bit, tinyint, smallint, int, and bigint

  • Znakowych typów danych: char, nchar, varchar, and nvarchar

  • Data i czas typów danych: datetime, smalldatetime, timestamp, date, time, datetime2, and datetimeoffset

fragment wartości w jednej kolumnie (kolumny zależnej) zależy od wartości w innej kolumnie lub zestaw kolumn (kolumna decydującym).

Wartości, które nie są prawidłowe w kolumn zależnych —na przykład profil zależność między kolumna, która zawiera kody pocztowe w Stanach Zjednoczonych i kolumna, która zawiera Państwa w Stanach Zjednoczonych.Ten sam kod pocztowy powinien mieć zawsze tego samego Państwa.Jednakże profilu wykryje naruszenie zależność.

Współzależności funkcjonalnych —ważny dla kolumn z jednego z tych typów danych:

  • Typy danych Liczba całkowita: bit, tinyint, smallint, int, and bigint

  • Znakowych typów danych: char, nchar, varchar, and nvarchar

  • Data i czas typów danych: datetime, smalldatetime, timestamp, date, time, datetime2, and datetimeoffset

Czy kolumna lub zestaw kolumn jest służyć jako klucz obcy między wybranymi tabelami.

Oznacza to, że ten profil raporty nakładania się wartości między dwie kolumny lub zestawy kolumn.

Wartości, które nie są prawidłowe —na przykład profil jest kolumna IDproduktu tabela Sprzedaż.Profil odkryje, że kolumna zawiera wartości, które nie zostały znalezione w tabela Produkty kolumna IDproduktu.

Włączenie wartości —ważny dla kolumn z jednego z tych typów danych:

  • Typy danych Liczba całkowita: bit, tinyint, smallint, int, and bigint

  • Dane znakowe, wpisz: char, nchar, varchar, and nvarchar

  • Data i czas typów danych: datetime, smalldatetime, timestamp, date, time, datetime2, and datetimeoffset

Aby wybrać, które profile do obliczenia, należy użyć Żądania profilu strona w danych profilowania zadania edytorze.Aby uzyskać więcej informacji, zobacz Dane profilowania Edytor zadań (profil żąda strony).

Na Żądania profilu strona, także określić dane, źródło i konfigurowania profilów danych.Podczas konfigurowania zadania należy pamiętać o następujących informacji:

  • Aby uprościć konfiguracja i ułatwić odkrywanie cechy nieznane dane, można użyć symboli wieloznacznych, (*), zamiast osoba kolumna nazwy.Jeśli używasz tego symbolu wieloznacznego, zadanie będzie profilu każdej kolumna, która ma odpowiedni typ danych, który z kolei może spowalniać niedziałający przetwarzania.

  • Przy zaznaczonej tabela lub widoku jest puste, zadanie profilowania danych nie obliczyć wszystkie profile.

  • Gdy wszystkie wartości w wybranej kolumnie są puste, zadanie profilowania danych oblicza tylko kolumna null współczynnik profil.Nie oblicza profil dystrybucji długości kolumna, Profil wzorca kolumn, profil statystyki kolumnę lub kolumna wartości dystrybucji profilu pustej kolumna.

Poszczególnych profilów dostępnych danych ma własne opcje konfiguracja.Aby uzyskać więcej informacji o tych opcjach zobacz następujące tematy:

Uruchomienie pakietu zawiera dane zadanie profilowania

Po zestaw skład zadania profilowania danych można uruchomić zadanie.Następnie oblicza profile danych i wyświetla te informacje w formacie XML do pliku lub zmiennej pakiet zadania.Struktura XML to następuje schematu DataProfile.xsd.You can open the schema in Microsoft Visual Studio or another schema editor, in an XML editor, or in a text editor such as Notepad.Ten schemat dla jakości danych może być przydatna dla następujących celów:

  • Wymiany informacji o jakości danych w ramach i między organizacjami.

  • Do tworzenia niestandardowych narzędzi z informacji o jakości danych.

miejsce docelowe obszar nazw jest identyfikowany w schemacie jako https://schemas.microsoft.com/sqlserver/2008/DataDebugger/.

Następny krok

Wyświetlanie profilu wyjściowego wPrzeglądarka profilu danych.

Ikona usług Integration Services (mała)Bieżąco z usług integracji

Najnowsze pliki do pobrania, artykuły, próbki i wideo firmy Microsoft, jak również wybranych rozwiązań ze Wspólnoty, odwiedź witrynę Integration Services strona na MSDN i TechNet:

Aby otrzymywać automatyczne powiadomienia dotyczące tych aktualizacji, zasubskrybuj źródła danych RSS dostępne na tej stronie.