Share via


İçerik türleri (veri madenciliği)

In Microsoft SQL Server Analysis Services, you can define the both the physical data type for a column in a mining structure, and a logical content type for the column when used in a model,

The data type determines how algorithms process the data in those columns when you create mining models.Bir sütunun veri türünü tanımlayan sütun veri türüne algoritma bilgileri ve verileri işlemek nasıl verir.Her bir veri türü Analysis Services destekleyen bir veya daha fazla içerik türleri için veri madenciliği.

The content type describes the behavior of the content that the column contains.Sütun içeriği ve haftanın günleri gibi belirli bir zaman içinde yinelenirse, o sütun içerik türü döngüsel olarak belirtebilirsiniz.

Belirli veri türleri ve belirli içerik türleri için kullanabilmek bazı algoritmalar gerektiren işlev doğru.Örneğin, Microsoft önbelleğin Bayes algoritması sürekli sütunları giriş olarak kullanamaz ve sürekli değerleri tahmin edemezsiniz.Bazı içerik türleri, tuş sırasını gibi yalnızca belirli bir algoritma tarafından kullanılır.Algoritmalar ve içerik türleri için listesini ve her destekler Bkz: Veri madenciliği algoritmaları (Analysis Services - veri madenciliği).

Aşağıdaki liste, veri madenciliği, kullanılan içerik türlerini açıklar ve her türünü destekleyen veri türleri tanımlar.

Ayrık

Ayrı sütun değerleri arasında hiçbir continuum değerleriyle sınırlı sayıda içerir.Verileri belirli bir kategori sayısını temsil eder, örneğin, bir cinsiyet tipik ayrı öznitelik sütun sütundur.

Sayısal değerlerde bile ayrı öznitelik sütun değerleri sıralama, olunmasının olamaz.Üstelik, kesikli sütun için kullanılan değerleri sayısal bile, kesirli değerler hesaplanamaz.Telefon alan kodları, sayısal veri iyi bir örnektir.

The Discrete content type is supported by all data mining data types.

Sürekli

Sürekli sütun geçici değerlere izin veren bir ölçek üzerinde sayısal verileri temsil eden değerleri içerir.Ayrı bir sütun, sonlu, countable verisini temsil eden, aksine sürekli bir sütun ölçeklenebilir ölçümleri temsil eder ve sonsuz sayıda kesirli değerler içeren veri mümkündür.Bir sütunu sıcaklıklar sürekli öznitelik sütun örneğidir.

Zaman bir sütun sürekli sayısal veri içerir ve veri dağılımının nasıl biliyor, değerlerin beklenen dağıtım belirterek olası analiz doğruluğunu artırabilirsiniz.Belirttiğiniz sütun dağılım düzey araştırma yapısı.Bu nedenle, daha fazla bilgi için yapısını esas alan tüm modeller ayar uygulanır, bkz: Sütun dağıtım (veri madenciliği).

The Continuous content type is supported by the following data types: Date, Double ve Long.

Discretized

Discretization olası değerler sınırlı sayıda böylece demetleri sürekli bir veri küme değerlerini getirme işlemidir.Yalnızca sayısal veriler ayırmak.

Bu nedenle, discretized içerik türü sütun grupları veya sürekli sütundan türetilmiş değer demetleri temsil eden değerler içerdiğini gösterir.Demetleri sipariş edilen ve ayrık değerler olarak kabul edilir.

El ile veri ayırmak, sepetlere aldığınızdan emin olmak istediğiniz veya sql Server Analysis Services'daki sağlanan discretization yöntemleri kullanabilirsiniz.Bazı algoritmalar discretization otomatik olarak gerçekleştirir.Daha fazla bilgi için bkz: Nasıl yapılır: Araştırma modelinde bir sütun Discretization Değiştir.

The Discretized content type is supported by the following data types: Date, Double, Long, and Text.

Anahtar

The key content type means that the column uniquely identifies a row.Bir durumda tablo, genellikle anahtar sütunu bir sayı veya metin tanımlayıcısıdır.küme İçerik türüyle key belirtmek, sütun kullanılmamalıdır çözümleme için yalnızca, izlenmesinde kayıtları.

İç içe geçmiş tablolar da anahtarları olsa da, iç içe geçmiş tablo anahtar kullanımını biraz farklıdır.küme İçerik türüyle key iç içe geçmiş tablo sütun çözümlemek istediğiniz öznitelik ise de.İç içe geçmiş tablo anahtar değerleri her durum için benzersiz olması gerekir, ancak tüm servis talepleri küme boyunca yineleme olabilir.

Müşterilerin satın ürünleri analiz etme, örneğin, içerik türü için anahtar için ayarlamanız CustomerID durum tablo ve içerik türüyle yeniden için anahtar küme sütun PurchasedProducts iç içe geçmiş tablo sütun.

Not

İç içe geçmiş tablolar yalnızca bir Analysis services tanımlanan bir dış veri kaynağından veri kullanırsanız kullanılabilir veri kaynak görünümü.

Bu içerik türü aşağıdaki veri türleri tarafından desteklenen: Date, Double, Long, and Text.

Tuş sırası

The key sequence content type can only be used in sequence clustering models.Zaman, küme içerik türü için key sequence, sütun değerler bir dizi temsil içerir gösterirolaylar. Değerleri, sipariş edilen, ancak bir eşit uzaklıkta olmak zorunda değil.

Bu içerik türü aşağıdaki veri türleri tarafından desteklenen: Double, Long, Text, and Date.

Anahtar zaman

The key time content type can only be used in time series models.saat, küme içerik türü için key time, gösterir değerleri sipariş ve temsil eden bir saat ölçeği.

Bu içerik türü aşağıdaki veri türleri tarafından desteklenen: Double, Long, and Date.

Tablo

The table content type indicates that the column contains another data table, with one or more columns and one or more rows.Durumda belirli bir satır için tablo, bu sütunun üst durum kaydını tüm ilgili olarak, birden çok değer içerebilir.Örneğin, ana durum tablo müşterilerin listesini içeriyorsa, gibi iç içe geçmiş tablolar içeren birkaç sütuna sahip olabilir bir ProductsPurchased burada iç içe geçmiş Tablo listeleri geçmişte bu müşteri tarafından satın alınan ürünler, sütun ve bir hobileriniz müşteri çıkarlarını listeler sütun.

Bu veri türü sütun her zaman Table.

Döngüsel

The cyclical content type means that the column contains values that represent a cyclical ordered set.Örneğin, numaralandırılmış günlerin olduğu döngüsel bir sıralı küme, çünkü bir gün sayısı yedi gün sayısını izler.

Döngüsel sütun sıralı ve içerik türü bakımından ayrı olarak kabul edilir.

Bu içerik türü tarafından desteklenen veri madenciliği veri türleri de Analysis Services. Ancak, çoğu algoritmalarını döngüsel değerleri ayrık değerler kabul edin ve özel işleme. gerçekleştirmek değil

Sipariş

The Ordered content type also indicates that the column contains values that define a sequence or order.Ancak, bu içerik türünü sıralama için kullanılan değerler herhangi bir mesafe veya değerleri küme arasında yatırımlara ilişkisi belirtmez.Örneğin, sipariş öznitelik sütun birinden beş derece sırayla beceri düzeyleri hakkında bilgi içeriyorsa, örtük bilgi beceri düzeyleri arasındaki mesafeyi de yok; beş beceri düzey, mutlaka beş kat daha iyi bir beceri düzey bir değil.

Sipariş öznitelik sütun içerik türü'nün ayrı olarak kabul edilir.

Bu içerik türü tarafından desteklenen veri madenciliği veri türleri de Analysis Services. Ancak, ancak çoğu algoritmalarını sıralı değerler ayrık değerler kabul ve özel işleme. gerçekleştirmek değil

Sınıflandırılmış

Tüm modelleri ile birlikte ortak olan önceki içerik türlerine ek olarak, bazı veri türleri için içerik türlerini tanımlamak için sınıflandırılmış sütunları kullanabilirsiniz.Sınıflandırılmış sütunları hakkında daha fazla bilgi için bkz: Sınıflandırılmış Columns (veri madenciliği).