Modelleri kümeleme için içerik modeli mining (Analysis Services - veri madenciliği)
Bu konuda Microsoft Kümeleme algoritması kullanan modelleri belirli araştırma modeli içeriği açıklar.Bir genel açıklama içerik araştırma modeli için tüm model türleri için bkz: İçerik modeli mining (Analysis Services - veri madenciliği).
Bir küme modeli yapısını anlama
Bir kümeleme modeli basit bir yapısı vardır.Her model, modeli ve meta veriler temsil eden bir tek ana düğüm vardır ve her üst düğüm kümeleri düz bir listesini içerir (node_type = 5).Bu kuruluş aşağıdaki resimdeki gösterilir.
Her alt düğümü, tek bir küme temsil eder ve servis talepleri, kümedeki öznitelikleri hakkında ayrıntılı istatistikleri içerir.Bu küme ve kümedeki diğer kümelerden ayırt değerleri dağıtımını sayıda servis talebi sayısını içerir.
Not
İçin gerekli yinelemek sayısı veya kümeleri; açıklaması almak için düğümleri üzerinden üst düğüm modeli de sayar ve kümelerini listeler.
Üst düğüm tüm eğitim taleplerinin gerçek dağıtım açıklamak yararlı istatistikleri içerir.Bu istatistikler, iç içe geçmiş tablo sütun, NODE_DISTRIBUTION bulunur.Örneğin, aşağıdaki tablo NODE_DISTRIBUTION birkaç satır gösterir tablo kümeleme modeli için müşteri Nüfus Dağılımı açıklamak TM_Clustering, ta oluşturduğunuz Temel veri madenciliği öğreticisi:
ÖZNİTELİK_ADÝ |
ATRIBUTE_VALUE |
DESTEK |
OLASILIK |
VARYANS |
VALUE_TYPE |
---|---|---|---|---|---|
Geçerlilik süresi |
Eksik |
0 |
0 |
0 |
1 (Eksik) |
Geçerlilik süresi |
44.9016152716593 |
12939 |
1 |
125.663453102554 |
3 (Sürekli) |
Cinsiyet |
Eksik |
0 |
0 |
0 |
1 (Eksik) |
Cinsiyet |
F |
6350 |
0.490764355823479 |
0 |
4 (Discrete) |
Cinsiyet |
M |
6589 |
0.509235644176521 |
0 |
4 (Discrete) |
Bunlar arasında sonuçlar, karşılaşıldığını bildiren olan erkeklerde için üniversite sınavlarına oranı 50-50 ve o hakkında ortalama yaş modeli oluşturmak için kullanılan 12939 durumda olan 44 görebilirsiniz.Tanımlayıcı İstatistik raporlanmasını öznitelik sürekli sayısal veri türü, yaş ya da cinsiyet gibi bir kesikli değer türü gibi olmasına göre değişir.İstatistiksel ölçümler anlamına ve farkı sürekli veri türleri için oysa hesaplanan Olasılık ve Destek ayrı veri türleri için hesaplanır.
Not
Fark kümesinin toplam sapma gösterir.Küçük sapma değeri, en çok değeri gösterir sütun oldukça yakın ortalaması olan.Standart sapma elde etmek için farkı karekökü hesaplamak.
Her öznitelik için olduğunu unutmayın bir Missing başarılı olduğunu anlatan, değer türü kaç servis taleplerini vardı verisi yok bu özniteliği.Eksik veri önemli olabilir ve veri türüne bağlı olarak farklı şekillerde hesaplamaları etkiler.Daha fazla bilgi için bkz: Değerleri eksik (Analysis Services - veri madenciliği).
Bir küme modeli için içerik modeli
Bu bölüm, ilgili modelleri kümeleme için yalnızca bu sütunlar araştırma modeli içerik için ayrıntı ve örnekler sağlar.
Şema satır kümesi, model_catalog ve model_adı, gibi genel amaçlı sütunlar hakkında bilgi için bkz: İçerik modeli mining (Analysis Services - veri madenciliği).
MODEL_CATALOG
Model depolandığı veritabanının adı.MODEL_ADI
Modelinin adı.ÖZNİTELİK_ADÝ
Her zaman modunda öngörülebilir öznitelik çünkü modelleri kümeleme boş.NODE_NAME
Her zaman olduğu gibi NODE_UNIQUE_NAME.NODE_UNIQUE_NAME
Düğüm modeli içinde benzersiz tanıtıcısı.Bu değer değiştirilemez.NODE_TYPE
Bir kümeleme modeli aşağıdaki düğüm türleri çıktısını verir:Düğüm kodu ve adı
Açıklama
1 (Model)
Kök düğüm modeli için.
5 (Küme)
Durumda Küme Küme ve küme içindeki değerleri açıklayan istatistikleri durumlarda özelliklerini sayısını içerir.
NODE_CAPTION
Görüntüleme amaçları için bir kolay ad.Bir model oluştururken, NODE_UNIQUE_NAME değerini otomatik olarak resim yazısı olarak kullanılır.Ancak, program aracılığıyla veya görüntüleyiciyi kullanarak küme için görünen ad güncelleştirmek NODE_CAPTION değerini değiştirebilirsiniz.Not
Modeli yeniden işleme sırasında tüm ad değişiklikleri yeni değerleri tarafından yazılır.Model adlarında kalıcı veya bir modeli farklı sürümleri arasında Küme üyeliği değişiklikleri izlemek.
CHILDREN_CARDINALITY
Düğüm olan çocuklar sayısı tahmini.Üst düğüm küme modelinde sayısını gösterir.
Küme düğümleriher zaman 0.
PARENT_UNIQUE_NAME
Düğümün üst benzersiz adı.Üst düğümher zaman null
Küme düğümlerigenellikle 000.
NODE_DESCRIPTION
Düğüm açıklaması.Üst düğümher zaman (tümü).
Küme düğümleri küme diğer kümelerden ayırt birincil öznitelikleri virgülle ayrılmış listesi.
NODE_RULE
Modelleri kümeleme için kullanılmaz.MARGINAL_RULE
Modelleri kümeleme için kullanılmaz.NODE_PROBABILITY
Bu düğüm ile ilişkili olasılık.Üst düğümher zaman 1.kümeleme düğümleriolasılığını niteliklerle, kümeleme modeli oluşturmak için kullanılan algoritma bağlı bazı ayarlamalar bileşik olasılık temsil eder.
MARGINAL_PROBABILITY
Üst düğüm düğümden ulaşmasını olasılık.Bir kümeleme modelinde, Marjinal olasılık her zaman düğümün olasılık aynıdır.NODE_DISTRIBUTION
Düğümün olasılık çubuk içeren bir tablo.Üst düğümbu konuya giriş konusuna bakın.
Küme düğümleriöznitelikleri ve değerleri bu kümede bulunan durumlarda dağıtımını temsil eder.
NODE_SUPPORT
Bu düğüm destek servis taleplerinin sayısı.Üst düğümeğitim durumlarda tüm model numarasını gösterir.Küme düğümleri servis taleplerinin sayısı olarak küme boyutunu belirtir.
Notk-anlamına gelir Kümeleme, her modeli kullanıyorsa, durum yalnızca bir kümeye ait olabilir.Ancak, modeli kümeleme em kullanıyorsa, her defasında farklı bir kümeye ait olabilir ve durum için her küme için ait ağırlıklı bir mesafe atanır.Bu nedenle, em modeller için tek bir küme desteğini genel modeli desteği büyük toplamıdır.
MSOLAP_MODEL_COLUMN
Modelleri kümeleme için kullanılmaz.MSOLAP_NODE_SCORE
Düğüm ile ilişkili bir puan görüntüler.Üst düğümkümeleme modeli için Skor Bayesian bilgileri ölçüt (BIC).
Küme düğümleriher zaman 0.
MSOLAP_NODE_SHORT_CAPTION
Görüntüleme amacıyla kullanılan bir etiket.Bu başlık değiştiremezsiniz.Üst düğüm modeli türü: Küme modeli
Küme düğümleriküme adı.Örnek: Küme 1.
Açıklamalar
Analysis Services bir kümeleme modeli oluşturmak için birden çok yöntem sağlar.Hangi yöntem birlikte çalıştığınız model oluşturmak için kullanılan bilmiyorsanız, modeli meta veriler programlı olarak adomd istemci veya ÇYN kullanarak veya sorgulama veri madenciliği şema satır kümesi alabilirsiniz.Daha fazla bilgi için bkz: Nasıl yapılır: Sorgu madenciliği Model oluşturmak için kullanılan parametreler.
Not
Yapısı ve modeli içeriği aynı, hangi kümeleme yöntem veya kullandığınız parametreleri bakılmaksızın kalır.