Aracılığıyla paylaş


Veri Profiling görev

Bir veri tanışmanıza yardımcı olan çeşitli profiller veri profil oluşturma görev hesaplar kaynak ve düzeltilmesi gereken veri sorunlarını belirleme.

Içinde veri profil oluşturma görev kullanabileceğiniz bir Integration Services depolanan profil veri paket SQL Server ve veri kalitesiyle olası sorunları tanımlamak için.

Not

Bu konu yalnızca açıklar özelliklerini ve veri profil oluşturma görevinin gereksinimleri.Bir veri profil oluşturma görevi nasıl örneklerde için alan bölümüne bakın. Görev ve Görüntüleyicisi profil oluşturma verilerini içeren veri profil oluşturma.

Important noteImportant Note:

Depolanan verileri içeren veri profil oluşturma görev çalışır. SQL Server 2000 veya sonraki sürümleri. Bu görev, üçüncü taraf veya dosya tabanlı veri kaynakları ile çalışmaz.

Ayrıca, veri profil oluşturma görevini içeren bir paket çalıştırmak için , CREATE tablo, tempdb veritabanı için izinleri de dahil olmak üzere, okuma/yazma izinlerine sahip bir hesabı kullanmanız gerekir.

Veri profilleri hesaplamak ve bunları bir dosyaya kaydetmek için görevi kullandıktan sonra tek başına veri profil görüntüleyiciyi profil çıktısını gözden geçirmek için kullanabilirsiniz.Veri profil görüntüleyiciyi de drilldown tha profil çıkışı tanımlanan veri kalitesi sorunlarını anlamanıza yardımcı yeteneğini destekler.Daha fazla bilgi için bkz:Profil çıkış veri profil Görüntüleyicisi'nde görüntüleme.

Important noteImportant Note:

Çıktı dosyası, veritabanınızın hakkında gizli veri ve veritabanı içerdiği verileri içerebilir.Bu dosya daha güvenli yapma hakkında öneriler için bkz: Paketleri tarafından kullanılan dosyalara erişimi denetleme.

Canlı sorguları, veri profil görüntüleyicide kullanılabilir drilldown yeteneği, özgün veri kaynağına gönderir.

Kullanılabilir profillerini anlama

Profil oluşturma veri görevi sekiz farklı veri profilleri hesaplaması.Bu profilleri beş sütunları tek tek çözümlemeniz ve diğer üç birden çok sütun veya sütunları ve tablolar arasındaki ilişkileri analiz.

Aşağıdaki beş profiller sütunları tek tek çözümleyebilirsiniz.

Sütunları tek tek çözümleme profilleri

Açıklama

Sütun uzunluğu dağıtım profili

Dize değerleri seçili tüm farklı uzunluklarını raporlarını sütun ve her uzunluğunu gösteren tablosundaki satırları yüzdesi.

Bu profil, verilerinizde geçersiz değerler gibi sorunları tanımlamanıza yardımcı olur.Örneğin, ABD durum kodları, iki karakter olması ve iki karakterden daha uzun değerleri bulmak için sütun profil.

Sütun null oranı profil

Seçili null değerleri yüzdesini bildirir sütun.

Bu profil verilerinizi beklenmedik biçimde yüksek bir null değerleri oranı gibi sorunları tanımlamanıza yardımcı bir sütun.Örneğin, bir posta kodu posta kodu sütun profil ve eksik kodları unacceptably yüksek bir yüzdesini keşfedin.

Sütun deseni profil

Raporların bir küme normal ifadelerin belirtilen bir dize sütunundaki değerlerin yüzdesini içerir.

Bu profil, verilerinizde geçerli olmayan bir dize gibi sorunları tanımlamanıza yardımcı olur.Bu profil, gelecekte yeni değerlerini doğrulamak için kullanılan normal ifadeler de önerebilir.Örneğin, ABD posta kodu sütun deseni profilini normal ifadeler üretebilir: \d{5}-\d{4} \d{5} ve \d{9}. Diğer normal ifadeler görürseniz, verileriniz büyük bir olasılıkla geçerli veya hatalı bir biçimde olmayan bir değer içerir.

Sütun için istatistikler profil

En az, en büyük, ortalama ve standart sapmayı, sayısal sütunlar ve minimum ve maksimum için istatistikleri rapor eder. datetime sütunlar.

Bu profil, verilerinizde geçersiz tarih gibi sorunları tanımlamanıza yardımcı olur.Örneğin, geçmişteki bir tarih sütun profil ve gelecekte bir maksimum tarihe keşfedin.

Sütun değeri dağıtım profili

Seçili sütun ve satırları yüzdesi tüm farklı değerler bildiriyor tablo, her değeri temsil eder.Birden çok satırda belirtilen yüzdesi gösteren değerleri de rapor edebilirsiniz tablo.

Bu profil, verilerinizdeki farklı değerleri bir sütun yanlış sayıda gibi sorunları tanımlamanıza yardımcı olur.Örneğin, Amerika Birleşik Devletleri'nde durumları da içeren ve 50'den fazla farklı değerleri bulmak için beklenen bir sütun profil.

Aşağıdaki üç profil için birden çok sütun veya sütunları ve tablolar arasındaki ilişkileri çözümleyin.

Birden çok sütunu çözümleme profilleri

Açıklama

Aday anahtar profil

Raporların bir sütun olup olmadığını veya küme sütunlarından anahtar veya seçili tablo için yaklaşık anahtar olur.

Bu profil verilerinizi yinelenen değerleri olası bir anahtar sütun gibi sorunları tanımlamanıza da yardımcı olur.

Işlev bir bağımlılık profil

Başka bir sütundaki değerlere göre (bağımlı sütun) bir sütundaki değerleri bağımlı olduğu sürece raporlarını veya küme sütun (determinant sütun).

Bu profil verilerinizi geçersiz değerler gibi sorunları tanımlamanıza da yardımcı olur.Örneğin, ABD posta kodları içeren bir sütun ve ABD durumlarını içeren bir sütun arasındaki bağımlılığı profil.Aynı posta kodu her zaman aynı duruma sahip olmalıdır, ancak bu bağımlılık, ihlallerini profil bulur.

Değer içerme profil

Çakışma iki sütun veya sütunları kümesi arasında değerleri hesaplar.Bu profili bir sütun olup olmadığını belirlemek veya sütunlar arasında seçili tablolardan yabancı anahtar olarak hizmet verecek uygun kümesidir.

Bu profil verilerinizi geçersiz değerler gibi sorunları tanımlamanıza da yardımcı olur.Örneğin, bir satış Productıd sütununda, profil tablo ve sütun ürünleri Productıd sütunda bulunan değerler içerdiğini tablo.

Geçerli bir profil için Önkoşullar

Tablolar ve boş olmayan sütunları seçmedikçe profili geçerli değil ve sütunları profil için geçerli veri türlerini içerir.

Geçerli veri türleri

Kullanılabilir profil bazıları, yalnızca belirli veri türleri için anlamlıdır.Örneğin, sayısal içeren bir sütun için sütun deseni profil bilgisayar veya datetime değerleri anlamlı değil. Bu nedenle, bir profili geçerli değil.

Profil

Geçerli veri türleri *

ColumnStatisticsProfile

Sayısal tür sütunlarından veya datetimeTür (no mean ve stddev için datetime sütun)

ColumnNullRatioProfile

Tüm sütunları **

ColumnValueDistributionProfile

Sütunları integer türü char tür ve datetime türü

ColumnLengthDistributionProfile

Sütunları char türü

ColumnPatternProfile

Sütunları char türü

CandidateKeyProfile

Sütunları integer türü char tür ve datetime türü

FunctionalDependencyProfile

Sütunları integer türü char tür ve datetime türü

InclusionProfile

Sütunları integer türü char tür ve datetime türü

* Tablosundaki önceki geçerli veri türlerini, integer, char, datetime, ve numeric türleri aşağıdaki belirli veri türleri şunlardır:

     Tamsayı türü içerir. bit, tinyint, smallint, int, ve bigint.

     Karakter türleri char, nchar, varchar, ve nvarchar, Ancak içermeyen varchar(max) ve nvarchar(max).

     Tarih ve saat türleri datetime, smalldatetime, ve timestamp.

     Sayısal türleri integer (dışında türleri bit), money, smallmoney, decimal, float, real, ve numeric.

** image, text, xml, udt, ve variant profiller dışında sütun null oranı profil türleri desteklenir.

Geçerli tablolar ve sütunlar

Profil oluşturma verileri, tablo veya sütun boş ise, aşağıdaki eylemleri gerçekleştirir:

  • Seçili tablo veya Görünüm boş olduğunda veri profil oluşturma görev herhangi bir profil hesaplaması yapmıyor.

  • Seçili sütundaki tüm değerlerin null olduğunda veri profil oluşturma görev yalnızca bu sütun boş oranı profil hesaplar.Görev, sütun uzunluğu dağıtım profili, sütun deseni profili, Column Statistics profil veya sütun değeri dağıtım profili hesaplaması yapmıyor.

Özellikleri verilerin bir görev için profil oluşturma

Veri profil oluşturma görev, bu kullanışlı bir yapılandırma seçenekleri vardır:

  • Joker karakter sütunlar   Bir profil isteği yapılandırırken, görevi kabul...(*) joker sütun adı yerine.Bu yapılandırmayı kolaylaştırır ve tanımadığınız veri özelliklerini keşfedin kolaylaştırır.Ne zaman görev, görev profilleri çalışan her sütun bir uygun bir veri türüne sahip.

  • Hızlı Profil   Görevi hızlı bir şekilde yapılandırmak için hızlı profili seçebilirsiniz.Hızlı bir profili varsayılan profil ve varsayılan ayarları kullanarak bir tablo veya Görünüm profilleri.

Veri Profililng görevdeki kullanılabilir özel günlüğü iletileri

Aşağıdaki tablo, veri profil oluşturma görev için özel bir günlük girdileri listeler.Daha fazla bilgi için bkz: Paketlerinde günlüğü uygulama ve Oturum için özel iletiler.

Günlük girdisi

Açıklama

DataProfilingTaskTrace

Görevin durumu hakkında açıklayıcı bilgiler sağlar.Iletileri, aşağıdaki bilgileri içerir:

  • Istekleri işleme başlatın.

  • Sorgu Başlat

  • Sorgu Sonlandır

  • Istek Computing bitiş

Çıkış ve örnek Şeması'nı anlama

Veri profil oluşturma görev seçili profilleri DataProfile.xsd şemaya göre yapılandırılmış bir XML olarak verir.Bu XML çıktısı bir dosyaya veya bir paket değişkeninde kaydedilen belirtebilirsiniz.Bu şema çevrimiçi konumunda görebilirsiniz https://schemas.Microsoft.com/sqlserver/2008/DataDebugger/.Web'den sayfa, şema yerel bir kopyasını kaydedebilirsiniz.Sonra şema yerel kopyasını Microsoft görüntüleyebilirsiniz Visual Studio veya, bir XML Düzenleyicisi veya Notepad gibi bir metin düzenleyicisinde başka bir şema Düzenleyicisi.

Bu verilerin kalitesini bilgi şeması için yararlı olabilir:

  • Veri kalite içinde ve kuruluşlar arasında bilgi değiş tokuş.

  • Veriler kalite bilgileriyle çalışan özel araçlar oluşturmak.

Hedef ad alanı şemada tanımlanır https://schemas.Microsoft.com/sqlserver/2008/DataDebugger/.

Çıktı paketinin koşullu akışında kullanma

Bileşenleri profil oluşturma veri akışında koşullu mantığı uygulamak için yerleşik bir işleve dahil Integration Services Çıktı verileri için profil oluşturma görevin temel paket. Ancak, komut dosyası göreve programlama, en az bir tutar ile bu mantık, kolayca ekleyebilirsiniz.Bu kod XML çıktısı bir XPath sorgusu gerçekleştirmek ve sonucu bir paket değişkende kaydedin.Sonraki görevler için komut dosyası görev bağlanan öncelik kısıtlamaları, bir ifade, iş akışı belirlemek için kullanabilirsiniz.Örneğin, komut dosyası görev algılar null değerleri yüzdesini bir sütun belirli bir eşiğe aşıyor.Bu koşul doğruysa, paket kesme ve devam etmeden önce bu sorunu gidermek isteyebilirsiniz.

Görev için profil oluşturma verileri yapılandırma

Veri profil oluşturma görevini kullanarak yapılandırma Veri Profiling görev Düzenleyicisi.Düzenleyici iki sayfa vardır:

Integration Services icon (small) Tümleştirme Hizmetleri ile güncel kalın

Karşıdan yüklemeler, makaleleri, örnekler ve en son Microsoft video yanı sıra, seçili topluluğun çözümleri için ziyaret Integration Services sayfa MSDN veya TechNet:

Bu güncelleştirmelerin otomatik bildirim için kullanılabilir RSS akışlarına abone olmak sayfa.

Değişiklik Geçmişi

Güncelleştirilmiş içerik

  • Eklenen bir not hakkında nasıl drilldown özelliği, veri kaynağına canlı bir sorgu gönderir.

  • Özel günlük iletileri ile ilgili bilgiler eklendi.