Modelleri kümeleme için içerik modeli mining (Analysis Services - veri madenciliği)

Bu konuda Microsoft Kümeleme algoritması kullanan modelleri belirli araştırma modeli içeriği açıklar.Bir genel açıklama içerik araştırma modeli için tüm model türleri için bkz: İçerik modeli mining (Analysis Services - veri madenciliği).

Bir küme modeli yapısını anlama

Bir kümeleme modeli basit bir yapısı vardır.Her model, modeli ve meta veriler temsil eden bir tek ana düğüm vardır ve her üst düğüm kümeleri düz bir listesini içerir (node_type = 5).Bu kuruluş aşağıdaki resimdeki gösterilir.

kümeleme için model içeriği yapısı

Her alt düğümü, tek bir küme temsil eder ve servis talepleri, kümedeki öznitelikleri hakkında ayrıntılı istatistikleri içerir.Bu küme ve kümedeki diğer kümelerden ayırt değerleri dağıtımını sayıda servis talebi sayısını içerir.

Not

İçin gerekli yinelemek sayısı veya kümeleri; açıklaması almak için düğümleri üzerinden üst düğüm modeli de sayar ve kümelerini listeler.

Üst düğüm tüm eğitim taleplerinin gerçek dağıtım açıklamak yararlı istatistikleri içerir.Bu istatistikler, iç içe geçmiş tablo sütun, NODE_DISTRIBUTION bulunur.Örneğin, aşağıdaki tablo NODE_DISTRIBUTION birkaç satır gösterir tablo kümeleme modeli için müşteri Nüfus Dağılımı açıklamak TM_Clustering, ta oluşturduğunuz Temel veri madenciliği öğreticisi:

ÖZNİTELİK_ADÝ

ATRIBUTE_VALUE

DESTEK

OLASILIK

VARYANS

VALUE_TYPE

Geçerlilik süresi

Eksik

0

0

0

1 (Eksik)

Geçerlilik süresi

44.9016152716593

12939

1

125.663453102554

3 (Sürekli)

Cinsiyet

Eksik

0

0

0

1 (Eksik)

Cinsiyet

F

6350

0.490764355823479

0

4 (Discrete)

Cinsiyet

M

6589

0.509235644176521

0

4 (Discrete)

Bunlar arasında sonuçlar, karşılaşıldığını bildiren olan erkeklerde için üniversite sınavlarına oranı 50-50 ve o hakkında ortalama yaş modeli oluşturmak için kullanılan 12939 durumda olan 44 görebilirsiniz.Tanımlayıcı İstatistik raporlanmasını öznitelik sürekli sayısal veri türü, yaş ya da cinsiyet gibi bir kesikli değer türü gibi olmasına göre değişir.İstatistiksel ölçümler anlamına ve farkı sürekli veri türleri için oysa hesaplanan Olasılık ve Destek ayrı veri türleri için hesaplanır.

Not

Fark kümesinin toplam sapma gösterir.Küçük sapma değeri, en çok değeri gösterir sütun oldukça yakın ortalaması olan.Standart sapma elde etmek için farkı karekökü hesaplamak.

Her öznitelik için olduğunu unutmayın bir Missing başarılı olduğunu anlatan, değer türü kaç servis taleplerini vardı verisi yok bu özniteliği.Eksik veri önemli olabilir ve veri türüne bağlı olarak farklı şekillerde hesaplamaları etkiler.Daha fazla bilgi için bkz: Değerleri eksik (Analysis Services - veri madenciliği).

Bir küme modeli için içerik modeli

Bu bölüm, ilgili modelleri kümeleme için yalnızca bu sütunlar araştırma modeli içerik için ayrıntı ve örnekler sağlar.

Şema satır kümesi, model_catalog ve model_adı, gibi genel amaçlı sütunlar hakkında bilgi için bkz: İçerik modeli mining (Analysis Services - veri madenciliği).

  • MODEL_CATALOG
    Model depolandığı veritabanının adı.

  • MODEL_ADI
    Modelinin adı.

  • ÖZNİTELİK_ADÝ
    Her zaman modunda öngörülebilir öznitelik çünkü modelleri kümeleme boş.

  • NODE_NAME
    Her zaman olduğu gibi NODE_UNIQUE_NAME.

  • NODE_UNIQUE_NAME
    Düğüm modeli içinde benzersiz tanıtıcısı.Bu değer değiştirilemez.

  • NODE_TYPE
    Bir kümeleme modeli aşağıdaki düğüm türleri çıktısını verir:

    Düğüm kodu ve adı

    Açıklama

    1 (Model)

    Kök düğüm modeli için.

    5 (Küme)

    Durumda Küme Küme ve küme içindeki değerleri açıklayan istatistikleri durumlarda özelliklerini sayısını içerir.

  • NODE_CAPTION
    Görüntüleme amaçları için bir kolay ad.Bir model oluştururken, NODE_UNIQUE_NAME değerini otomatik olarak resim yazısı olarak kullanılır.Ancak, program aracılığıyla veya görüntüleyiciyi kullanarak küme için görünen ad güncelleştirmek NODE_CAPTION değerini değiştirebilirsiniz.

    Not

    Modeli yeniden işleme sırasında tüm ad değişiklikleri yeni değerleri tarafından yazılır.Model adlarında kalıcı veya bir modeli farklı sürümleri arasında Küme üyeliği değişiklikleri izlemek.

  • CHILDREN_CARDINALITY
    Düğüm olan çocuklar sayısı tahmini.

    Üst düğüm küme modelinde sayısını gösterir.

    Küme düğümleriher zaman 0.

  • PARENT_UNIQUE_NAME
    Düğümün üst benzersiz adı.

    Üst düğümher zaman null

    Küme düğümlerigenellikle 000.

  • NODE_DESCRIPTION
    Düğüm açıklaması.

    Üst düğümher zaman (tümü).

    Küme düğümleri küme diğer kümelerden ayırt birincil öznitelikleri virgülle ayrılmış listesi.

  • NODE_RULE
    Modelleri kümeleme için kullanılmaz.

  • MARGINAL_RULE
    Modelleri kümeleme için kullanılmaz.

  • NODE_PROBABILITY
    Bu düğüm ile ilişkili olasılık.Üst düğümher zaman 1.

    kümeleme düğümleriolasılığını niteliklerle, kümeleme modeli oluşturmak için kullanılan algoritma bağlı bazı ayarlamalar bileşik olasılık temsil eder.

  • MARGINAL_PROBABILITY
    Üst düğüm düğümden ulaşmasını olasılık.Bir kümeleme modelinde, Marjinal olasılık her zaman düğümün olasılık aynıdır.

  • NODE_DISTRIBUTION
    Düğümün olasılık çubuk içeren bir tablo.

    Üst düğümbu konuya giriş konusuna bakın.

    Küme düğümleriöznitelikleri ve değerleri bu kümede bulunan durumlarda dağıtımını temsil eder.

  • NODE_SUPPORT
    Bu düğüm destek servis taleplerinin sayısı.Üst düğümeğitim durumlarda tüm model numarasını gösterir.

    Küme düğümleri servis taleplerinin sayısı olarak küme boyutunu belirtir.

    Notk-anlamına gelir Kümeleme, her modeli kullanıyorsa, durum yalnızca bir kümeye ait olabilir.Ancak, modeli kümeleme em kullanıyorsa, her defasında farklı bir kümeye ait olabilir ve durum için her küme için ait ağırlıklı bir mesafe atanır.Bu nedenle, em modeller için tek bir küme desteğini genel modeli desteği büyük toplamıdır.

  • MSOLAP_MODEL_COLUMN
    Modelleri kümeleme için kullanılmaz.

  • MSOLAP_NODE_SCORE
    Düğüm ile ilişkili bir puan görüntüler.

    Üst düğümkümeleme modeli için Skor Bayesian bilgileri ölçüt (BIC).

    Küme düğümleriher zaman 0.

  • MSOLAP_NODE_SHORT_CAPTION
    Görüntüleme amacıyla kullanılan bir etiket.Bu başlık değiştiremezsiniz.

    Üst düğüm modeli türü: Küme modeli

    Küme düğümleriküme adı.Örnek: Küme 1.

Açıklamalar

Analysis Services bir kümeleme modeli oluşturmak için birden çok yöntem sağlar.Hangi yöntem birlikte çalıştığınız model oluşturmak için kullanılan bilmiyorsanız, modeli meta veriler programlı olarak adomd istemci veya ÇYN kullanarak veya sorgulama veri madenciliği şema satır kümesi alabilirsiniz.Daha fazla bilgi için bkz: Nasıl yapılır: Sorgu madenciliği Model oluşturmak için kullanılan parametreler.

Not

Yapısı ve modeli içeriği aynı, hangi kümeleme yöntem veya kullandığınız parametreleri bakılmaksızın kalır.