Önbelleğin Bayes modeller için içerik modeli mining (Analysis Services - veri madenciliği)
Bu konuda kullanan modelleri belirli araştırma modeli içeriği açıklar Microsoft önbelleğin Bayes algoritması.Nasıl yorumlanacağı istatistikleri ve yapısı hakkında bir açıklama tüm model türleri tarafından paylaşılan ve genel terim tanımları ile ilgili araştırma modeli içeriği, bkz: İçerik modeli mining (Analysis Services - veri madenciliği).
Önbelleğin Bayes modeli yapısını anlama
Önbelleğin Bayes modeli, model ve kendi meta veriler ve underneath üst düğüm, herhangi bir sayıda seçtiğiniz öngörülebilir öznitelikleri temsil eden bağımsız ağaçları temsil eden tek bir üst düğüm vardır.Öznitelikler için ağaçları yanı sıra, her model bir Marjinal istatistikleri düğüm içeriyor (node_type = 26) hakkında tanımlayıcı istatistik sağlayan küme eğitim talepleri.Daha fazla bilgi için bkz: Marjinal istatistikleri düğüm bilgileri.
Her tahmin edilebilir öznitelik ve değeri, modeli sonucunu bu öngörülebilir sütunlar nasıl çeşitli giriş açıklayan bilgiler içeren bir ağaç etkilenen çıkarır.Öngörülebilir öznitelik ve değeri, her ağacı içerir (node_type = 9) ve sonra bir dizi giriş özniteliklerini temsil düğümleri (node_type = 10).Giriş öznitelikleri genelde birden çok değere sahip olduğundan, her giriş öznitelik (node_type = 10) birden çok alt düğümleri olabilir (node_type = 11), her biri için belirli öznitelik durumu.
Not
Önbelleğin Bayes modeli sürekli veri türlerine izin vermediği için tüm değerleri giriş sütunları kesikli veya discretized olarak kabul edilir.Nasıl bir değer discretized belirtebilirsiniz.Daha fazla bilgi için Nasıl yapılır: Araştırma modelinde bir sütun Discretization Değiştir.
Önbelleğin Bayes modeli için içerik modeli
Bu bölümde, önbelleğin Bayes modeller için belirli yakınlık derecesine sahip yalnızca bu sütunlar araştırma modeli içerik için ayrıntı ve örnekler sağlar.
Şema satır kümesi, model_catalog ve model_adı, gibi genel amaçlı sütunlar hakkında bilgi için değil açıklanan burada veya araştırma modeli terminolojinin açıklamaları için bkz: İçerik modeli mining (Analysis Services - veri madenciliği).
MODEL_CATALOG
Model depolandığı veritabanının adı.MODEL_ADI
Modelinin adı.ÖZNİTELİK_ADÝ
Bu düğüm karşılık gelen öznitelik adları.Modeli kököngörülebilir öznitelik adı.
Marjinal istatistikleri geçerli değil
Öngörülebilir özniteliköngörülebilir öznitelik adı.
Giriş öznitelikgiriş öznitelik adı.
Giriş öznitelik durumuyalnızca giriş öznitelik adı.Durumu almak için MSOLAP_NODE_SHORT_CAPTION kullanın.
NODE_NAME
Düğüm adı.Bu sütun NODE_UNIQUE_NAME aynı değeri içerir.
Düğüm adlandırma kuralları hakkında daha fazla bilgi için bkz: kullanarak düğüm adları ve kimliklerinden.
NODE_UNIQUE_NAME
Düğümü benzersiz adı.Düğümler arasındaki ilişkileri hakkında bilgi sağlayan bir kuralına göre benzersiz adlar atanır.Düğüm adlandırma kuralları hakkında daha fazla bilgi için bkz: kullanarak düğüm adları ve kimliklerinden.NODE_TYPE
Önbelleğin Bayes modeli aşağıdaki düğüm türleri çıktısını verir:Düğüm türü No
Açıklama
26 (NaiveBayesMarginalStatNode)
Tüm açıklayan istatistikleri içeren küme modeli için eğitim taleplerinin.
9 (Öngörülebilir öznitelik)
Öngörülebilir-öznitelik adını içerir.
10 (Giriş öznitelik)
Öznitelik değerleri içeren adını giriş öznitelik sütun ve alt düğümler içerir.
11 (Giriş öznitelik durumu)
Değerleri veya discretized belirli çıkış özniteliği ile eşleştirilmiş tüm giriş öznitelik değerleri içerir.
NODE_CAPTION
Etiket veya düğüm ile ilişkili bir resim yazısı.Bu özellik öncelikle görüntüleme amaçlıdır.Modeli kökboş
Marjinal istatistikleri boş
Öngörülebilir özniteliköngörülebilir öznitelik adı.
Giriş özniteliköngörülebilir öznitelik ve geçerli giriş öznitelik adı.Ex:
Bisiklet alıcı -> yaş
Giriş öznitelik durumuöngörülebilir öznitelik ve geçerli giriş öznitelik artı değer giriş adı.Ex:
Bisiklet alıcı -> yaş eksik =
CHILDREN_CARDINALITY
Düğüm olan çocuklar sayısı.Modeli kökmodeli artı 1 Marjinal istatistikleri düğüm öngörülebilir öznitelikleri sayısı.
Marjinal istatistikleri tanımına göre alt öğesi yok.
Öngörülebilir öznitelik için geçerli tahmin edilebilir öznitelik ilişkili giriş öznitelikleri sayısı.
Giriş öznitelikgeçerli giriş öznitelik kesikli veya discretized değerleri sayısı.
Giriş öznitelik durumuher zaman 0.
PARENT_UNIQUE_NAME
Üst düğüm benzersiz adı.Üst ve alt düğümler ile ilgili daha fazla bilgi için bkz: kullanarak düğüm adları ve kimliklerinden.NODE_DESCRIPTION
Aynı düğüm resim yazısı.NODE_RULE
Düğüm resim yazısı bir xml betimlemesi.MARGINAL_RULE
Aynı düğüm kural.NODE_PROBABILITY
Bu düğüm ile ilişkili olasılık.Modeli kökher zaman 0.
Marjinal istatistikleri her zaman 0.
Öngörülebilir öznitelik her zaman 1.
Giriş öznitelikher zaman 1.
Giriş öznitelik durumuolasılığı, geçerli değerini temsil eden bir tamsayı.Ana giriş öznitelik düğümü toplam 1 altında tüm giriş özniteliği durumları için değerler.
MARGINAL_PROBABILITY
Aynı düğüm olasılık.NODE_DISTRIBUTION
Düğüm için olasılık çubuk içeren bir tablo.Daha fazla bilgi için bkz: NODE_DISTRIBUTION tablo.NODE_SUPPORT
Bu düğüm destek servis taleplerinin sayısı.Modeli köktüm durumlarda eğitim veri sayısı.
Marjinal istatistikleri her zaman 0.
Öngörülebilir öznitelik tüm durumlarda eğitim veri sayısı.
Giriş özniteliktüm durumlarda eğitim veri sayısı.
Giriş öznitelik durumudurumlarda belirli bu değeri içeren eğitim veri sayısı.
MSOLAP_MODEL_COLUMN
Görüntüleme amacıyla kullanılan bir etiket.Genellikle aynı öznitelik_adý.MSOLAP_NODE_SCORE
Öznitelik veya değer modeli içindeki önemini gösterir.Modeli kökher zaman 0.
Marjinal istatistikleri her zaman 0.
Öngörülebilir öznitelik her zaman 0.
Giriş öznitelikInterestingness puanı geçerli giriş öznitelik geçerli tahmin edilebilir öznitelik ilişkili olarak için.
Giriş öznitelik durumuher zaman 0.
MSOLAP_NODE_SHORT_CAPTION
Bir metin dize adı veya sütun değerini temsil eder.Modeli kökboş
Marjinal istatistikleri boş
Öngörülebilir özniteliköngörülebilir öznitelik adı.
Giriş öznitelikgiriş öznitelik adı.
Giriş özniteliği durumuveya discretized giriş öznitelik değerinin.
Düğüm adları ve kimliklerinden kullanma
Önbelleğin Bayes modeli içindeki düğümlerin adlandırma modeli bilgileri arasındaki ilişkiyi anlamak daha kolay hale getirmek için düğümün türü hakkında ek bilgi sağlar.Aşağıdaki tablo farklı düğüm türü için atanan kimliklerinin kuralını gösterir.
Düğüm türü |
Düğüm kimliği için kuralı |
---|---|
Modeli kök (1) |
Her zaman 0. |
Marjinal istatistikleri düğüm (26) |
Rasgele bir kimlik değeri. |
Öngörülebilir öznitelik (9) |
Onaltılık sayı 10000000 ile başlayan Örnek: 100000001, 10000000b |
Giriş öznitelik (10) |
Burada ilk bölümü her zaman 20000000 ve ikinci bölümü, iki bölümlü onaltılık tabandaki ilgili öngörülebilir öznitelik onaltılı tanımlayıcı ile başlar. Örnek: 20000000b00000000 Bu durum, ilgili öngörülebilir öznitelik 10000000b olur. |
Giriş öznitelik durumu (11) |
Burada ilk bölümü her zaman 30000000, ikinci bölümü ilgili öngörülebilir öznitelik onaltılı tanımlayıcı ile başlar ve üçüncü bölüm tanımlayıcısı değeri temsil eden bir üç bölümlü onaltılık sayı. Örnek: 30000000b00000000200000000 Bu durum, ilgili öngörülebilir öznitelik 10000000b olur. |
Giriş öznitelikleri ve durumları için öngörülebilir bir öznitelik ile ilişkili kimlikleri kullanabilirsiniz.Örneğin, aşağıdaki sorgu adları ve giriş ve öngörülebilir öznitelikleri modeli için olası birleşimlerini temsil düğümler için resim yazısı verir TM_NaiveBayes.
SELECT NODE_NAME, NODE_CAPTION
FROM TM_NaiveBayes.CONTENT
WHERE NODE_TYPE = 10
Beklenen sonuçlar:
NODE_NAME |
NODE_CAPTION |
---|---|
20000000000000001 |
Bisiklet alıcı -> uzaklık iletişim |
20000000000000002 |
Bisiklet alıcı -> İngilizce eğitimi |
20000000000000003 |
Bisiklet alıcı -> İngilizce meslek |
20000000000000009 |
Bisiklet alıcı -> medeni durum |
2.000.000.000.000.000a |
Bisiklet alıcı -> numara Children At Giriş |
2000000000000000b |
Bisiklet alıcı -> bölge |
2000000000000000c |
Bisiklet alıcı -> toplam Children |
Daha sonra üst düğümlerin kimliklerini alt düğümlerin almak için de kullanabilirsiniz.Aşağıdaki sorgu için değerleri içeren düğümleri alır Marital Status öznitelik, her düğümün olasılık ile birlikte.
SELECT NODE_NAME, NODE_CAPTION, NODE_PROBABILITY
FROM TM_NaiveBayes.CONTENT
WHERE NODE_TYPE = 11
AND [PARENT_UNIQUE_NAME] = '20000000000000009'
Not
Adı sütun, PARENT_UNIQUE_NAME, aynı adı ayrılmış anahtar sözcük ayırmak için ayraç içine alınmalıdır gerekir.
Beklenen sonuçlar:
NODE_NAME |
NODE_CAPTION |
NODE_PROBABILITY |
---|---|---|
3000000000000000900000000 |
Bisiklet alıcı -> medeni eksik = |
0 |
3000000000000000900000001 |
Bisiklet alıcı -> medeni durum = s |
0.457504004 |
3000000000000000900000002 |
Bisiklet alıcı -> medeni durum = m |
0.542495996 |
NODE_DISTRIBUTION tablo
İç içe geçmiş tablo sütun, NODE_DISTRIBUTION, genellikle düğüm değerlerini dağıtım ile ilgili istatistikleri içerir.Önbelleğin Bayes modelinde, bu tablo için yalnızca aşağıdaki düğümler doldurulur:
Düğüm türü |
İç içe geçmiş tablo içeriği |
---|---|
Modeli kök (1) |
Boş. |
Marjinal istatistikleri düğüm (24) |
Özet bilgiler tüm öngörülebilir öznitelikleri ve tüm eğitim veri küme için giriş özniteliklerini içerir. |
Öngörülebilir öznitelik (9) |
Boş. |
Giriş öznitelik (10) |
Boş. |
Giriş öznitelik durumu (11) |
Bu bileşimi öngörülebilir değeri ve giriş için eğitim veri değerlerini dağıtım açıklayan istatistikleri içerir öznitelik değeri. |
Artan düzeylerde ayrıntı almak için kimlikleri düğüm veya düğüm resim yazısı'nı kullanabilirsiniz.Örneğin, aşağıdaki sorgu NODE_DISTRIBUTION belirli sütunları alır tablo değer ilişkili öznitelik düğümleri yalnızca giriş için 'Marital Status = S'.
SELECT FLATTENED NODE_CAPTION,
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, [SUPPORT], [PROBABILITY], VALUETYPE
FROM NODE_DISTRIBUTION) as t
FROM TM_NaiveBayes.content
WHERE NODE_TYPE = 11
AND NODE_CAPTION = 'Bike Buyer -> Marital Status = S'
Beklenen sonuçlar:
NODE_CAPTION |
t.ATTRIBUTE_NAME |
t.ATTRIBUTE_VALUE |
t.support |
t.PROBABILITY |
t.VALUETYPE |
---|---|---|---|---|---|
Bisiklet alıcı -> medeni durum = s |
Bisiklet alıcı |
Eksik |
0 |
0 |
1 |
Bisiklet alıcı -> medeni durum = s |
Bisiklet alıcı |
0 |
3783 |
0.472934117 |
4 |
Bisiklet alıcı -> medeni durum = s |
Bisiklet alıcı |
1 |
4216 |
0.527065883 |
4 |
Bu sonuçlar destek değeri sütun ile belirtilen medeni bir bisiklet satın müşterilerin sayısını bildirir.OLASILIK sütun olarak yalnızca bu düğüm için hesaplanan her öznitelik değeri olasılığını içerir.NODE_DISTRIBUTION'de kullanılan terimlerin genel tanımları için tablo, bkz: İçerik modeli mining (Analysis Services - veri madenciliği).
Marjinal istatistikleri düğüm bilgileri
Önbelleğin Bayes modelinde, Marjinal istatistikleri düğüm için iç içe geçmiş tablo için tüm eğitim veri küme değerleri dağıtımını içerir.Örneğin, aşağıdaki tablo İstatistikler iç içe NODE_DISTRIBUTION, kısmi bir listesini içeren tablo modeli için TM_NaiveBayes:
ÖZNİTELİK_ADÝ |
ATTRIBUTE_VALUE |
DESTEK |
OLASILIK |
VARYANS |
VALUETYPE |
---|---|---|---|---|---|
Bisiklet alıcı |
Eksik |
0 |
0 |
0 |
1 |
Bisiklet alıcı |
0 |
8869 |
0.507263784 |
0 |
4 |
Bisiklet alıcı |
1 |
8615 |
0.492736216 |
0 |
4 |
Medeni Durum |
Eksik |
0 |
0 |
0 |
1 |
Medeni Durum |
S |
7999 |
0.457504004 |
0 |
4 |
Medeni Durum |
M |
9485 |
0.542495996 |
0 |
4 |
Toplam Children |
Eksik |
0 |
0 |
0 |
1 |
Toplam Children |
0 |
4865 |
0.278254404 |
0 |
4 |
Toplam Children |
3 |
2093 |
0.119709449 |
0 |
4 |
Toplam Children |
1 |
3406 |
0.19480668 |
0 |
4 |
The Bike Buyer column is included because the marginal statistics node always contains a description of the predictable attribute and its possible values.Listelenen tüm sütunları modelinde kullanılan değerleri ile birlikte giriş özniteliklerini temsil eder.Değerler yalnızca eksik, kesikli veya discretized olabilir.
Önbelleğin Bayes modelinde, sürekli niteliklerine olabilir; Bu nedenle, tüm sayısal verileri temsil olarak ayrı (value_type = 4) veya discretized (value_type = 5).
A Missing değeri (value_type = 1) eğitim veri. bugünkü olası değerleri temsil eden her bir giriş ve çıkış öznitelik eklenir"Eksik" arasında ayırt etmek dikkatli olmanız gerekir bir dize ve varsayılan olarak Missing değer.Daha fazla bilgi için bkz: Değerleri eksik (Analysis Services - veri madenciliği).