Önbelleğin Bayes modeller için içerik modeli mining (Analysis Services - veri madenciliği)

Bu konuda kullanan modelleri belirli araştırma modeli içeriği açıklar Microsoft önbelleğin Bayes algoritması.Nasıl yorumlanacağı istatistikleri ve yapısı hakkında bir açıklama tüm model türleri tarafından paylaşılan ve genel terim tanımları ile ilgili araştırma modeli içeriği, bkz: İçerik modeli mining (Analysis Services - veri madenciliği).

Önbelleğin Bayes modeli yapısını anlama

Önbelleğin Bayes modeli, model ve kendi meta veriler ve underneath üst düğüm, herhangi bir sayıda seçtiğiniz öngörülebilir öznitelikleri temsil eden bağımsız ağaçları temsil eden tek bir üst düğüm vardır.Öznitelikler için ağaçları yanı sıra, her model bir Marjinal istatistikleri düğüm içeriyor (node_type = 26) hakkında tanımlayıcı istatistik sağlayan küme eğitim talepleri.Daha fazla bilgi için bkz: Marjinal istatistikleri düğüm bilgileri.

Her tahmin edilebilir öznitelik ve değeri, modeli sonucunu bu öngörülebilir sütunlar nasıl çeşitli giriş açıklayan bilgiler içeren bir ağaç etkilenen çıkarır.Öngörülebilir öznitelik ve değeri, her ağacı içerir (node_type = 9) ve sonra bir dizi giriş özniteliklerini temsil düğümleri (node_type = 10).Giriş öznitelikleri genelde birden çok değere sahip olduğundan, her giriş öznitelik (node_type = 10) birden çok alt düğümleri olabilir (node_type = 11), her biri için belirli öznitelik durumu.

Not

Önbelleğin Bayes modeli sürekli veri türlerine izin vermediği için tüm değerleri giriş sütunları kesikli veya discretized olarak kabul edilir.Nasıl bir değer discretized belirtebilirsiniz.Daha fazla bilgi için Nasıl yapılır: Araştırma modelinde bir sütun Discretization Değiştir.

naive bayes için model içeriği yapısı

Önbelleğin Bayes modeli için içerik modeli

Bu bölümde, önbelleğin Bayes modeller için belirli yakınlık derecesine sahip yalnızca bu sütunlar araştırma modeli içerik için ayrıntı ve örnekler sağlar.

Şema satır kümesi, model_catalog ve model_adı, gibi genel amaçlı sütunlar hakkında bilgi için değil açıklanan burada veya araştırma modeli terminolojinin açıklamaları için bkz: İçerik modeli mining (Analysis Services - veri madenciliği).

  • MODEL_CATALOG
    Model depolandığı veritabanının adı.

  • MODEL_ADI
    Modelinin adı.

  • ÖZNİTELİK_ADÝ
    Bu düğüm karşılık gelen öznitelik adları.

    Modeli kököngörülebilir öznitelik adı.

    Marjinal istatistikleri geçerli değil

    Öngörülebilir özniteliköngörülebilir öznitelik adı.

    Giriş öznitelikgiriş öznitelik adı.

    Giriş öznitelik durumuyalnızca giriş öznitelik adı.Durumu almak için MSOLAP_NODE_SHORT_CAPTION kullanın.

  • NODE_NAME
    Düğüm adı.

    Bu sütun NODE_UNIQUE_NAME aynı değeri içerir.

    Düğüm adlandırma kuralları hakkında daha fazla bilgi için bkz: kullanarak düğüm adları ve kimliklerinden.

  • NODE_UNIQUE_NAME
    Düğümü benzersiz adı.Düğümler arasındaki ilişkileri hakkında bilgi sağlayan bir kuralına göre benzersiz adlar atanır.Düğüm adlandırma kuralları hakkında daha fazla bilgi için bkz: kullanarak düğüm adları ve kimliklerinden.

  • NODE_TYPE
    Önbelleğin Bayes modeli aşağıdaki düğüm türleri çıktısını verir:

    Düğüm türü No

    Açıklama

    26 (NaiveBayesMarginalStatNode)

    Tüm açıklayan istatistikleri içeren küme modeli için eğitim taleplerinin.

    9 (Öngörülebilir öznitelik)

    Öngörülebilir-öznitelik adını içerir.

    10 (Giriş öznitelik)

    Öznitelik değerleri içeren adını giriş öznitelik sütun ve alt düğümler içerir.

    11 (Giriş öznitelik durumu)

    Değerleri veya discretized belirli çıkış özniteliği ile eşleştirilmiş tüm giriş öznitelik değerleri içerir.

  • NODE_CAPTION
    Etiket veya düğüm ile ilişkili bir resim yazısı.Bu özellik öncelikle görüntüleme amaçlıdır.

    Modeli kökboş

    Marjinal istatistikleri boş

    Öngörülebilir özniteliköngörülebilir öznitelik adı.

    Giriş özniteliköngörülebilir öznitelik ve geçerli giriş öznitelik adı.Ex:

    Bisiklet alıcı -> yaş

    Giriş öznitelik durumuöngörülebilir öznitelik ve geçerli giriş öznitelik artı değer giriş adı.Ex:

    Bisiklet alıcı -> yaş eksik =

  • CHILDREN_CARDINALITY
    Düğüm olan çocuklar sayısı.

    Modeli kökmodeli artı 1 Marjinal istatistikleri düğüm öngörülebilir öznitelikleri sayısı.

    Marjinal istatistikleri tanımına göre alt öğesi yok.

    Öngörülebilir öznitelik için geçerli tahmin edilebilir öznitelik ilişkili giriş öznitelikleri sayısı.

    Giriş öznitelikgeçerli giriş öznitelik kesikli veya discretized değerleri sayısı.

    Giriş öznitelik durumuher zaman 0.

  • PARENT_UNIQUE_NAME
    Üst düğüm benzersiz adı.Üst ve alt düğümler ile ilgili daha fazla bilgi için bkz: kullanarak düğüm adları ve kimliklerinden.

  • NODE_DESCRIPTION
    Aynı düğüm resim yazısı.

  • NODE_RULE
    Düğüm resim yazısı bir xml betimlemesi.

  • MARGINAL_RULE
    Aynı düğüm kural.

  • NODE_PROBABILITY
    Bu düğüm ile ilişkili olasılık.

    Modeli kökher zaman 0.

    Marjinal istatistikleri her zaman 0.

    Öngörülebilir öznitelik her zaman 1.

    Giriş öznitelikher zaman 1.

    Giriş öznitelik durumuolasılığı, geçerli değerini temsil eden bir tamsayı.Ana giriş öznitelik düğümü toplam 1 altında tüm giriş özniteliği durumları için değerler.

  • MARGINAL_PROBABILITY
    Aynı düğüm olasılık.

  • NODE_DISTRIBUTION
    Düğüm için olasılık çubuk içeren bir tablo.Daha fazla bilgi için bkz: NODE_DISTRIBUTION tablo.

  • NODE_SUPPORT
    Bu düğüm destek servis taleplerinin sayısı.

    Modeli köktüm durumlarda eğitim veri sayısı.

    Marjinal istatistikleri her zaman 0.

    Öngörülebilir öznitelik tüm durumlarda eğitim veri sayısı.

    Giriş özniteliktüm durumlarda eğitim veri sayısı.

    Giriş öznitelik durumudurumlarda belirli bu değeri içeren eğitim veri sayısı.

  • MSOLAP_MODEL_COLUMN
    Görüntüleme amacıyla kullanılan bir etiket.Genellikle aynı öznitelik_adý.

  • MSOLAP_NODE_SCORE
    Öznitelik veya değer modeli içindeki önemini gösterir.

    Modeli kökher zaman 0.

    Marjinal istatistikleri her zaman 0.

    Öngörülebilir öznitelik her zaman 0.

    Giriş öznitelikInterestingness puanı geçerli giriş öznitelik geçerli tahmin edilebilir öznitelik ilişkili olarak için.

    Giriş öznitelik durumuher zaman 0.

  • MSOLAP_NODE_SHORT_CAPTION
    Bir metin dize adı veya sütun değerini temsil eder.

    Modeli kökboş

    Marjinal istatistikleri boş

    Öngörülebilir özniteliköngörülebilir öznitelik adı.

    Giriş öznitelikgiriş öznitelik adı.

    Giriş özniteliği durumuveya discretized giriş öznitelik değerinin.

Düğüm adları ve kimliklerinden kullanma

Önbelleğin Bayes modeli içindeki düğümlerin adlandırma modeli bilgileri arasındaki ilişkiyi anlamak daha kolay hale getirmek için düğümün türü hakkında ek bilgi sağlar.Aşağıdaki tablo farklı düğüm türü için atanan kimliklerinin kuralını gösterir.

Düğüm türü

Düğüm kimliği için kuralı

Modeli kök (1)

Her zaman 0.

Marjinal istatistikleri düğüm (26)

Rasgele bir kimlik değeri.

Öngörülebilir öznitelik (9)

Onaltılık sayı 10000000 ile başlayan

Örnek: 100000001, 10000000b

Giriş öznitelik (10)

Burada ilk bölümü her zaman 20000000 ve ikinci bölümü, iki bölümlü onaltılık tabandaki ilgili öngörülebilir öznitelik onaltılı tanımlayıcı ile başlar.

Örnek: 20000000b00000000

Bu durum, ilgili öngörülebilir öznitelik 10000000b olur.

Giriş öznitelik durumu (11)

Burada ilk bölümü her zaman 30000000, ikinci bölümü ilgili öngörülebilir öznitelik onaltılı tanımlayıcı ile başlar ve üçüncü bölüm tanımlayıcısı değeri temsil eden bir üç bölümlü onaltılık sayı.

Örnek: 30000000b00000000200000000

Bu durum, ilgili öngörülebilir öznitelik 10000000b olur.

Giriş öznitelikleri ve durumları için öngörülebilir bir öznitelik ile ilişkili kimlikleri kullanabilirsiniz.Örneğin, aşağıdaki sorgu adları ve giriş ve öngörülebilir öznitelikleri modeli için olası birleşimlerini temsil düğümler için resim yazısı verir TM_NaiveBayes.

SELECT NODE_NAME, NODE_CAPTION
FROM TM_NaiveBayes.CONTENT
WHERE NODE_TYPE = 10

Beklenen sonuçlar:

NODE_NAME

NODE_CAPTION

20000000000000001

Bisiklet alıcı -> uzaklık iletişim

20000000000000002

Bisiklet alıcı -> İngilizce eğitimi

20000000000000003

Bisiklet alıcı -> İngilizce meslek

20000000000000009

Bisiklet alıcı -> medeni durum

2.000.000.000.000.000a

Bisiklet alıcı -> numara Children At Giriş

2000000000000000b

Bisiklet alıcı -> bölge

2000000000000000c

Bisiklet alıcı -> toplam Children

Daha sonra üst düğümlerin kimliklerini alt düğümlerin almak için de kullanabilirsiniz.Aşağıdaki sorgu için değerleri içeren düğümleri alır Marital Status öznitelik, her düğümün olasılık ile birlikte.

SELECT NODE_NAME, NODE_CAPTION, NODE_PROBABILITY
FROM TM_NaiveBayes.CONTENT
WHERE NODE_TYPE = 11
AND [PARENT_UNIQUE_NAME] = '20000000000000009'

Not

Adı sütun, PARENT_UNIQUE_NAME, aynı adı ayrılmış anahtar sözcük ayırmak için ayraç içine alınmalıdır gerekir.

Beklenen sonuçlar:

NODE_NAME

NODE_CAPTION

NODE_PROBABILITY

3000000000000000900000000

Bisiklet alıcı -> medeni eksik =

0

3000000000000000900000001

Bisiklet alıcı -> medeni durum = s

0.457504004

3000000000000000900000002

Bisiklet alıcı -> medeni durum = m

0.542495996

NODE_DISTRIBUTION tablo

İç içe geçmiş tablo sütun, NODE_DISTRIBUTION, genellikle düğüm değerlerini dağıtım ile ilgili istatistikleri içerir.Önbelleğin Bayes modelinde, bu tablo için yalnızca aşağıdaki düğümler doldurulur:

Düğüm türü

İç içe geçmiş tablo içeriği

Modeli kök (1)

Boş.

Marjinal istatistikleri düğüm (24)

Özet bilgiler tüm öngörülebilir öznitelikleri ve tüm eğitim veri küme için giriş özniteliklerini içerir.

Öngörülebilir öznitelik (9)

Boş.

Giriş öznitelik (10)

Boş.

Giriş öznitelik durumu (11)

Bu bileşimi öngörülebilir değeri ve giriş için eğitim veri değerlerini dağıtım açıklayan istatistikleri içerir öznitelik değeri.

Artan düzeylerde ayrıntı almak için kimlikleri düğüm veya düğüm resim yazısı'nı kullanabilirsiniz.Örneğin, aşağıdaki sorgu NODE_DISTRIBUTION belirli sütunları alır tablo değer ilişkili öznitelik düğümleri yalnızca giriş için 'Marital Status = S'.

SELECT FLATTENED NODE_CAPTION,
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, [SUPPORT], [PROBABILITY], VALUETYPE
FROM NODE_DISTRIBUTION) as t
FROM TM_NaiveBayes.content
WHERE NODE_TYPE = 11
AND NODE_CAPTION = 'Bike Buyer -> Marital Status = S'

Beklenen sonuçlar:

NODE_CAPTION

t.ATTRIBUTE_NAME

t.ATTRIBUTE_VALUE

t.support

t.PROBABILITY

t.VALUETYPE

Bisiklet alıcı -> medeni durum = s

Bisiklet alıcı

Eksik

0

0

1

Bisiklet alıcı -> medeni durum = s

Bisiklet alıcı

0

3783

0.472934117

4

Bisiklet alıcı -> medeni durum = s

Bisiklet alıcı

1

4216

0.527065883

4

Bu sonuçlar destek değeri sütun ile belirtilen medeni bir bisiklet satın müşterilerin sayısını bildirir.OLASILIK sütun olarak yalnızca bu düğüm için hesaplanan her öznitelik değeri olasılığını içerir.NODE_DISTRIBUTION'de kullanılan terimlerin genel tanımları için tablo, bkz: İçerik modeli mining (Analysis Services - veri madenciliği).

Marjinal istatistikleri düğüm bilgileri

Önbelleğin Bayes modelinde, Marjinal istatistikleri düğüm için iç içe geçmiş tablo için tüm eğitim veri küme değerleri dağıtımını içerir.Örneğin, aşağıdaki tablo İstatistikler iç içe NODE_DISTRIBUTION, kısmi bir listesini içeren tablo modeli için TM_NaiveBayes:

ÖZNİTELİK_ADÝ

ATTRIBUTE_VALUE

DESTEK

OLASILIK

VARYANS

VALUETYPE

Bisiklet alıcı

Eksik

0

0

0

1

Bisiklet alıcı

0

8869

0.507263784

0

4

Bisiklet alıcı

1

8615

0.492736216

0

4

Medeni Durum

Eksik

0

0

0

1

Medeni Durum

S

7999

0.457504004

0

4

Medeni Durum

M

9485

0.542495996

0

4

Toplam Children

Eksik

0

0

0

1

Toplam Children

0

4865

0.278254404

0

4

Toplam Children

3

2093

0.119709449

0

4

Toplam Children

1

3406

0.19480668

0

4

The Bike Buyer column is included because the marginal statistics node always contains a description of the predictable attribute and its possible values.Listelenen tüm sütunları modelinde kullanılan değerleri ile birlikte giriş özniteliklerini temsil eder.Değerler yalnızca eksik, kesikli veya discretized olabilir.

Önbelleğin Bayes modelinde, sürekli niteliklerine olabilir; Bu nedenle, tüm sayısal verileri temsil olarak ayrı (value_type = 4) veya discretized (value_type = 5).

A Missing değeri (value_type = 1) eğitim veri. bugünkü olası değerleri temsil eden her bir giriş ve çıkış öznitelik eklenir"Eksik" arasında ayırt etmek dikkatli olmanız gerekir bir dize ve varsayılan olarak Missing değer.Daha fazla bilgi için bkz: Değerleri eksik (Analysis Services - veri madenciliği).