araştırma modeli Içerik (Analysis Services - veri madenciliği)

Tasarlanmış ve işlenen ettikten sonra bir araştırma modeli çıkarma yapısı temel verileri kullanarak araştırma modeli tamamlandıktan ve içerenaraştırma modeli İçerik.Öngörüler yapmak veya verilerinizi çözümlemek için bu içeriği'ni kullanabilirsiniz.

araştırma modeli İçerik modeli hakkında meta veriler, veri ve desenler çıkarma algoritması tarafından belirlenen ilgili istatistikleri içerir.Kullanılan algoritmayı bağlı gerileme formülleri, kurallar, itemsets ve ağırlıklarını tanımları ve diğer istatistikleri modeli içeriği içerebilir.

Kullanılan algoritma ne olursa olsun araştırma modeli içeriğini standart bir yapı içinde sunulur.Microsoft Office 2010 Suite genel içerik ağacı Görüntüleyici'de sağlanan yapısında gözatmakBusiness Intelligence Development Studiove bilgileri sağlar ve diğer grafik olarak gösterilen her model türü. nasıl özel kullanıcılar içinAyrıca sorguları oluşturabilirsiniz araştırma modeli MINING_MODEL_CONTENT şema satır kümesi kümesi destekleyen herhangi bir istemci kullanarak içerik.Daha fazla bilgi için bkz:Veri madenciliği modelleri sorgulama: Nasıl yapılır konuları (Analysis Services - veri madenciliği).

Bu bölüm madenciliği modelleri türleri için sağlanan içeriğin temel yapısını açıklar.Tüm araştırma modeli içeriği için ortak olan düğüm türü tanımlar ve bilgileri yorumlamak yönergeler sağlar.

araştırma modeli içerik yapısı

Düğüm

araştırma modeli İçeriği algoritma türü

araştırma modeli içeriği görüntülemek için Araçlar

Sorgulama araştırma modeli içerik araçları

araştırma modeli içerik yapısı

Her model içeriğini bir dizi olarak gösterilirdüğüm.Bir nesne içinde bir düğümdür bir araştırma modeli, meta veriler ve modelin bir bölümüyle ilgili bilgileri içerir.Düğüm, hiyerarşik olarak düzenlenir.Düğümlerin hiyerarşisinde tam düzenleme ve hiyerarşi, ne anlama geldiğini, kullanılan algoritmayı bağlıdır.Örneğin, bir karar ağacı model oluşturmak, model modeli köke bağlı tüm birden çok ağaç içerebilir; neural ağ modeli oluşturma, bir veya daha fazla ağ ile İstatistikler düğümünü model içerebilir.

Her modeli ilk düğüm adı verilenkök düğümveya modeli üst düğümü. Her model bir kök düğüm vardır (NODE_TYPE = 1).Kök düğüm genellikle bazı meta veriler, model ve alt düğüm sayısı hakkında ancak modeli tarafından belirlenen desen az ek bilgiler içerir.

Hangi model oluşturmak için kullanılan algoritma bağlı alt düğümlerin farklı bir dizi kök düğümü vardır.Alt düğümler farklı anlamları vardır ve farklı içerik, algoritmayı ve derinliği verilerin karmaşıklığı bağlı.

Başa Dön

Düğüm

Çıkarma modelinde, düğüm hakkındaki tüm bilgileri bir parçası veya bir bölümü modelinin saklayan bir genel amaçlı kapsayıcı.Her düğüm yapısını her zaman aynıdır ve veri madenciliği şema satır kümesi tarafından tanımlanan sütun içerir.Daha fazla bilgi için bkz:DMSCHEMA_MINING_MODEL_CONTENT satır kümesi.

Her düğümdeki her modeli içinde üst düğüm ve alt düğümü olan düğümlerin sayısı kimliği benzersiz bir tanımlayıcı içeren düğüm hakkındaki meta veriler içerir.meta veriler, düğüm olduğu modeli ve bu özel model depolandığı veritabanının katalog tanımlar.Düğüm sağlanan ek içerik modeli oluşturmak için kullanılan ve aşağıdakileri içerebilir algoritma türüne bağlı olarak farklılık gösterir:

  • Belirli bir tahmini değeri destekleyen eğitim verileri durumlarda sayısı.

  • İstatistikler, ortalama, standart sapma veya fark.

  • Katsayılar ve formülleri.

  • Kurallar ve lateral işaretçileri tanımı.

  • Modelin bir parçasını tanımlayan XML parçaları.

Düğüm türleri listesi

Aşağıdaki tablo, veri madenciliği modelleri çıkışı olan farklı türde listeler.Her model, her algoritma bilgileri farklı işler için yalnızca birkaç belirli tür düðümleri oluşturur.Algoritma değiştirirseniz, düğüm türünü değiştirebilirsiniz.Ayrıca, model reprocess, her düğümün içeriğini değiştirebilir.

Not

SQL Server 2008 Analysis Services sağlanan bir tane daha farklı veri madenciliği hizmetini kullanırsanız veya kendi eklenti algoritmalar oluşturmak, ek özel düğüm tipleri kullanılabilir.

NODE_TYPE KİMLİĞİ

Düğüm etiketi

İçindekiler düğümü

1

Model

Meta veriler ve kök içerik düğümü.Tüm model tipleri için geçerlidir.

2

Ağaç

Sınıflandırma ağaç kök düğümü.Karar ağacı modelleri için geçerlidir.

3

İç kısım

İç düğüm ağacına bölün.Karar ağacı modelleri için geçerlidir.

4

Dağıtım

Ağaç düğümü Terminal.Karar ağacı modelleri için geçerlidir.

5

Küme

Küme algoritması tarafından algılanan.Modelleri ve sıra modelleri küme küme oluşturma için geçerlidir.

6

bilinmiyor

Bilinmeyen düğüm türü.

7

ItemSet

Algoritması tarafından algılanan Itemset.İlişki modeli veya modelleri kümeleme sırası uygulanır.

8

AssociationRule

Algoritması tarafından algılanan ilişkisi kuralı.İlişki modeli veya modelleri kümeleme sırası uygulanır.

9

PredictableAttribute

Öngörülebilir özniteliği.Tüm model tipleri için geçerlidir.

10

InputAttribute

Giriş öznitelik.Karar ağaçları ve Naïve Bayes modelleri için geçerlidir.

11

InputAttributeState

Giriş bir öznitelik durumları hakkında istatistikler.Karar ağaçları ve Naïve Bayes modelleri için geçerlidir.

13

Sıra

Üst düğüm sıra küme Markov modeli bileşeni.Küme modelleri sırasına uygulanır.

14

Geçiş

Markov geçiş matrisi.Küme modelleri sırasına uygulanır.

15

TimeSeries

saat serisi ağaç düğümü kök olmayan.Yalnızca saat serisi modelleri için geçerlidir.

16

TsTree

Bir tahmin edilebilir bir saat serisine karşılık gelen saat serisi ağaç kök düğümü.saat serisi modelleri için geçerlidir ve yalnızca model MIXED parametresi kullanılarak oluşturulmuş.

17

NNetSubnetwork

Bir sub-network.Neural ağ modelleri için geçerlidir.

18

NNetInputLayer

Giriş katmanı düğümlerini içeren grubu.Neural ağ modelleri için geçerlidir.

19

NNetHiddenLayer

Gizli katmanda açıklayan düğümleri içeren gruplar.Neural ağ modelleri için geçerlidir.

21

NNetOutputLayer

Çıkış katman düğümlerini içeren gruplar.Neural ağ modelleri için geçerlidir.

21

NNetInputNode

Eşleşen bir giriş giriş katmanında düğüm öznitelik ile ilgili durum.Neural ağ modelleri için geçerlidir.

22

NNetHiddenNode

Gizli katmandaki düğümü.Neural ağ modelleri için geçerlidir.

23

NNetOutputNode

Çıkış katmanındaki düğümü.Bu düğüm, çıkış nitelik ve karşılık gelen durum genellikle eşleşir.Neural ağ modelleri için geçerlidir.

24

NNetMarginalNode

Eğitim Marjinal istatistikleri küme.Neural ağ modelleri için geçerlidir.

25

RegressionTreeRoot

Regresyon ağaç kökü.Doğrusal regresyon modeli ve sürekli giriş öznitelikleri içeren karar ağaçları modelleri için geçerlidir.

26

NaiveBayesMarginalStatNode

Eğitim Marjinal istatistikleri küme.Naïve Bayes modelleri için geçerlidir.

27

ArimaRoot

Kök düğüm, bir ARIMA modeli.ARIMA algoritmasını kullanmak yalnızca bu saat serisi modelleri için geçerlidir.

28

ArimaPeriodicStructure

Bir ARIMA modeli düzenli bir yapıda.ARIMA algoritmasını kullanmak yalnızca bu saat serisi modelleri için geçerlidir.

29

ArimaAutoRegressive

Autoregressive katsayısı için tek bir terim ARIMA bir model.

ARIMA algoritmasını kullanmak yalnızca bu saat serisi modelleri için geçerlidir.

30

ArimaMovingAverage

Hareketli ortalama katsayısı için bir ARIMA modeli, tek bir terim.ARIMA algoritmasını kullanmak yalnızca bu saat serisi modelleri için geçerlidir.

1000

CustomBase

Özel düğüm türü için başlangıç noktası.Özel düğüm türü, değer bu sabit büyük bir tamsayı olmalıdır.Özel eklenti algoritmaları kullanılarak oluşturulan modelleri için geçerlidir.

Düğüm kimliği, adı, başlık ve açıklama

Kök düğümü tüm modelinin benzersiz kimliği her zaman vardır ( NODE_UNIQUE_NAME ) 0. Tüm düğüm kimliği, Analysis Services tarafından otomatik olarak atanır ve değiştirilemez.

Her model için kök düğüm modeli hakkında temel bazı meta veriler de içerir.Model depolandığı bir Analysis Services veritabanı bu meta veriler içerir ( MODEL_CATALOG ), şema ( MODEL_SCHEMA) ve modeli adını ( MODEL_NAME) . Ancak bu meta veriler almak için kök düğümü sorgulamak gerekmez; böylece bu bilgileri modelinin, tüm düğümler yinelenir.

Benzersiz tanımlayıcı olarak kullanılan ad ek olarak, her düğümün sahip biradı (NODE_NAME).Bu ad görüntüleme amaçları için kullanılan bir algoritma tarafından otomatik olarak oluşturulur ve düzenlenemez.

Not

Her küme için kolay ad atamak kullanıcıları Microsoft Office 2010 Suite kümeleme algoritma sağlar.Ancak, kolay adları bu sunucuda kalıcı ve model reprocess algoritması yeni küme adları oluşturur.

The caption and description for each node are automatically generated by the algorithm, and serve as labels to help you understand the content of the node.Her alan için oluşturulan metin modeli türüne bağlıdır.Bazı durumlarda, tam olarak aynı dizeyi adını, başlığını ve açıklamasını içerebilir, ancak bazı modeller, açıklama ek bilgiler içerebilir.Uygulama ayrıntıları için tek tek model türü hakkında konusuna bakın.

Not

Analysis Services sunucusunun yalnızca yeniden uygulayan özel bir eklenti algoritmasını kullanarak modelleri oluşturmak, düğümleri yeniden destekleyen.Yeniden etkinleştirmek için eklenti algoritması oluşturduğunuzda yöntemleri geçersiz kılmak gerekir.

Düğüm ebeveyn ve düğüm alt düğüm önem

Ağaç yapısında, üst ve alt düğümler arasındaki ilişkiyi PARENT_UNIQUE_NAME sütun değerine göre belirlenir.Bu değer, alt düğümü depolanır ve ana düğüm kimliği bildirir.Bazı örnekler nasıl bu bilgi kullanılabilir birini izleyin:

  • null olan bir PARENT_UNIQUE_NAME anlamına gelir düğüm; yani üst düğüm modeli.

  • PARENT_UNIQUE_NAME değeri 0 ise, üst düğüm modelinde, doğrudan bir alt düğüm olması gerekir.Kök düğüm kimliği her zaman olur çünkü 0.

  • Alt öğelerin veya belirli bir düğümün üst bulmak için veri madenciliği Uzantıları (DMX) sorgu içinde işlevleri kullanabilirsiniz.Sorgularda, işlevleri kullanma hakkında daha fazla bilgi için bkz:Veri madenciliği modelleri sorgulama (Analysis Services - veri madenciliği).

Önem düzeyi numarayı öğelerinin bir kümesini. gösterir İşlenen çıkarma model bağlamında, önem, çocukların sayısı belirli bir düğüme bildirir.Örneğin, bir karar ağacı modeli [için yıllık gelir] düğüm varsa ve bu düğüm iki alt düğümü [yıllık gelir] koşul için bir yüksek ve bir koşulu, [yıllık gelir] = 2 [yıllık gelir] düğüm olur için düşük, CHILDREN_CARDINALITY değeri =.

Not

InAnalysis Servicesyalnızca alt düğümleri sayılan, hesaplama önem düğüm.Ancak, özel bir eklenti algoritması oluşturursanız, farklı önem saymak için CHILDREN_CARDINALITY tekrar.Örneğin, altlarý, yalnızca hemen altındaki alt toplamı hesaplamak istediğinizde bu yararlı olabilir.

Tüm modeller için aynı şekilde önem sayılır, ancak nasıl yorumlanacağı veya önem değeri modeli türüne bağlı olarak farklılık gösterir.Örneğin, küme modelinde, üst düğüm, önem, bulunan küme sayısı bildirir.Diğer tür modelleri önem düğüm tipine göre küme değer her zaman olabilir.Önem yorumlama hakkında daha fazla bilgi için tek tek model türüyle ilgili konuya bakın.

Not

Microsoft Office 2010 Suite Neural ağ algoritması tarafından oluşturulanlar gibi bazı modeller, ayrıca ilgili eğitim veri tanımlayıcı istatistikler tüm modelini sağlayan bir özel düğüm türü içerir.Tanım olarak, bu düğümlerin hiç alt düğümü vardır.

Düğüm dağıtım

NODE_DISTRIBUTION sütun, birçok düğümlerin algoritması tarafından belirlenen desen önemli ve ayrıntılı bilgi sağlayan bir iç içe tablo içerir.Bu konuda sağlanan tam istatistik tablo modeli türünü konumunu düğüm ağacında bağlı olarak değişir ve olup predic tablo özniteliğidir sürekli sayısal bir değer veya farklı bir değer; ancak, minimum ve maksimum değerleri, öznitelik değerleri, bir düğüm durumlarda regresyon formül ve standart sapma ve Varyans gibi istatistiksel ölçüleri kullanılan katsayıları sayısı atanan ağırlık içerebilir.Düğüm dağıtım yorumlama hakkında daha fazla bilgi için çalıştığınız model türü türünü için bölüme bakın.

Not

NODE_DISTRIBUTION tablosu, düğümün türüne bağlı olarak boş olabilir.Örneğin, yalnızca alt düğümler koleksiyon düzenlemek için bazı düğümler hizmet ve ayrıntılı istatistikleri içeren alt düğümleri olarak.

İç içe geçmiş tablo, NODE_DISTRIBUTION, her zaman aşağıdaki sütunları içerir.Her sütunun içeriğini modeli türüne bağlı olarak değişir.Belirli bir modeli türleri hakkında daha fazla bilgi için bkz:Algoritma türüne göre içerik modeli çıkarma.

  • ÖZNİTELİK_ADÝ
    Algoritması tarafından içeriği değişir.Algoritma, bir formülün bir bölümü gibi iç öngörülebilir öznitelik, bir kural, bir itemset ya da bir bilgiyi bir sütun adı olabilir.

    Bu sütun, bir öznitelik-değer çifti de içerebilir.

  • ATTRIBUTE_VALUE
    ATTRIBUTE_NAME adlı özniteliği değeri.

    Öznitelik adı sütunu, sonra en basit durumda, the ATTRIBUTE_VALUE o sütun için ayrı değerlerden birini içerir.

    Nasıl algoritma değerleri işleme bağlı olarak, the ATTRIBUTE_VALUE de öznitelik için bir değer olup bildiren bir bayrak içerebilir ( Existing), veya değer null olup ( Missing).

    Örneğin, model ayarlandığından müşteriler kimin satın en az bir kez, belirli bir öğe bulmak için ATTRIBUTE_NAME sütun içeren, tanımlar faiz maddenin gibi öznitelik-değer çiftiModel = 'Water bottle', ATTRIBUTE_VALUE sütun yalnızca anahtar sözcük içerir veExistingorMissing.

  • Destek
    Bu öznitelik-değer çifti olan ya da içeren bu itemset veya servis talebi sayısı kural.

    Genel olarak, her düğüm için destek değeri, ne kadar eğitim küme durumlarda geçerli düğümün içerdiği açıklanır.Birçok model türü desteği tam bir servis talebi sayısını gösterir.Destek değerleri, veri dağıtım eğitim verileri sorgulamak gerekmeden eğitim taleplerinizi içinde görüntüleyebilirsiniz sağladığından kullanışlıdır.Analysis Services sunucusuna kesmesi güçlü veya zayıf olup olmadığını belirlemek için önceki olasılık, ve saklı olasılığını hesaplamak için de bu depolanan değerleri kullanır.

    Örneğin, bir sınıflandırma ağacında destek değerini gösterir açıklanan birleşimi olan servis taleplerinin sayısı öznitelikleri.

    Karar ağacında bir ağacın her düzey destek toplamı, üst düğümün desteklemek için toplar.Örneğin, modeli içeren, 1200 durumlarda cinsiyet tarafından eşit olarak bölünen ve daha sonra aynı üç değerleri gelir için alt; düşük, orta ve yüksek — düğümleri (4) (5), alt düğümler düğüm (2) ve (6) (2) düğüm aynı sayıda servis talebi için her zaman toplamak,.

    Düğüm kimliği ve düğüm öznitelikleri

    Destek sayısı

    (1) Modeli kök

    1200

    (2) Cinsiyet erkek =

    (3) Cinsiyetin Female =

    600

    600

    (4) Cinsiyet erkek ve gelir = yüksek =

    (5) Cinsiyet erkek ve gelir = Orta =

    (6) Cinsiyet erkek ve gelir = düşük =

    200

    200

    200

    (7) Cinsiyetin Female ve gelir = yüksek =

    (8) Cinsiyetin Female ve gelir = Orta =

    (9) Cinsiyetin Female ve gelir = düşük =

    200

    200

    200

    Birden çok kümeye ait olan değerler eklemek için bir küme modeli için destek numarasını ağırlıklı.Birden çok küme üyeliği yöntem kümeleme varsayılandır.Bu senaryoda, çünkü her durum değil mutlaka ait yalnızca bir kümeye desteği Bu modellerden en fazla yüzde 100'e tüm kümeleri arasında eklemek.

  • OLASILIK
    Bu belirli bir düğümün tüm modelindeki olasılığını gösterir.

    Genel olarak, olasılık durumda düğümü (NODE_SUPPORT) içinde toplam sayısı bölü bu belirli değer desteğini gösterir.

    Bununla birlikte, olasılık düzeltilir biraz sapma değerleri eksik veri. neden ortadan kaldırmak için

    Örneğin, toplam [alt] için geçerli değerler 'Bir' ve 'İki' ise, hiçbir alt ya da üç alt olanaksız olduğu tahmin modeli oluşturmaktan kaçının isteyebilirsiniz.Eksik değerler improbable, ancak imkansız değil, algoritma her zaman 1 gerçek değerleri sayısı için tüm ekler emin olmak için öznitelik.

    örnek::

    Olasılığını [toplam alt bir =] = [durumda yeri sayısı toplam çocuklar bir =] + 1 / [saymak her zaman] + 3

    Olasılığını [toplam çocuklar iki =] = [durumda yeri sayısı toplam çocuklar iki =] + 1 / [saymak her zaman] + 3 arası

    Not

    3 Düzeltilmesi, varolan değerler, toplam sayısı 1 eklenerek hesaplanırn.

    Düzeltmeden sonra tüm değerleri için olasılıklar hala en çok 1 ekleyin.Olasılık değeri veri içermeyen (Bu örnekte, [alt toplam 'Sıfır', '3' veya başka bir değer =]), çok düşük bir düzeyde sıfırdan başlar ve daha fazla zaman eklenen yavaşça artar.

  • FARKI
    Düğümü içindeki değerlerin farkını gösterir.Tanım olarak, fark, her zaman ayrı değerleri için 0 olur.Farkı hesaplanır, sürekli değer modelini destekleyen olarakσ (sigma), düğümü. kullanarak payda n veya servis talebi sayısı

    Genel kullanımda standart göstermek için iki tanım vardır ( StDev).Standart sapmayı hesaplamak için bir yöntem hesap sapma alır ve başka bir yöntem sapma kullanmadan standart sapmayı hesaplar.Genel olarak, Microsoft Office 2010 Suite veri madenciliği algoritmaları sapma standart hesaplarken kullanmayın.

    NODE_DISTRIBUTION tablosunda görüntülenen tüm ayrı ve discretized öznitelikleri için gerçek değer ve sürekli değerler için ortalama değerdir.

  • VALUE_TYPE
    Veri türü değeri veya öznitelik ve değer kullanımını gösterir.Belirli değer türleri yalnızca belirli model türleri için geçerlidir:

    VALUE_TYPE KİMLİĞİ

    Değer etiketi

    Değer türü adı

    1

    MISSING:

    durum verilerini bu öznitelik için bir değer içermiyor gösterir.The Missing state is calculated separately from attributes that have values.

    2

    Varolan

    Büyük veri değeri bu içerdiğini gösterir öznitelik.

    3

    Sürekli

    Belirten değeri öznitelik sürekli sayısal değer ve bu nedenle sapma ve standart sapma ile birlikte bir ortalaması olarak gösterilebilir.

    4

    Kesikli

    Bir değeri gösterir sayısal veya metin, ayrı olarak kabul edilir.

    NotFarklı değerler de eksik olabilir; ancak bunlar farklı yaparken hesaplamaları. işlenir Bilgi için bkz:Değerleri eksik (Analysis Services - veri madenciliği).

    5

    Discretized

    Öznitelik discretized sayısal değerler içerdiğini gösterir.Discretization demetleri biçimlendirilmiş bir dize değeri olacaktır.

    6

    Varolan

    Indicates that the attribute has continuous numeric values and that values have been supplied in the data, vs.values that are missing or inferred.

    7

    Katsayısı

    Gösterir bir sayısal değer, temsil eden bir katsayısı.

    Bir katsayısı bağımlı değişkenin değerini hesaplamak için uygulandığında bir değerdir.Örneğin, model, yaş gelir dayanarak tahmin eder regresyon formül oluşturursa, yaş, gelir için ilgili formül katsayısı kullanılır.

    8

    Puan kazanç

    Bir öznitelik için puan kazanç gösteren sayısal bir değeri gösterir.

    9

    Statistics:

    Bir regresör için bir istatistik gösteren sayısal bir değeri gösterir.

    10

    Düğüm benzersiz adı

    Değer sayısal veya dize olarak değil, ancak bir model başka bir içerik düğümü benzersiz tanımlayıcısı olarak işleneceğini yok olduğunu gösterir.

    Örneğin, neural ağ modelinde, kimliklerini gizli katmanda düğümler çıkış katmana düğümler ve düğümlere giriş katmanın gizli katmanda düğümler işaretçilerini.

    11

    Kesme noktası

    Kesme noktası regresyon formülde gösteren sayısal bir değeri gösterir.

    12

    Periodicity

    Değer modeli. düzenli bir yapı gösterir gösterir

    Yalnızca bir ARIMA modeli içeren saat serisi modelleri için geçerlidir.

    NoteNote:
    Microsoft Office 2010 Suite saat serisi algoritması, eğitim verilerini temel alan Periyodik yapıları otomatik olarak algılar.Sonuç olarak, son model periodicities model oluştururken bir parametre olarak sağlamadı periodicity değerleri içerebilir.

    13

    Autoregressive sırası

    Değer autoregressive seri numarasını temsil ettiğini gösterir.

    ARIMA algoritmasını kullanmak saat serisi modelleri için geçerlidir.

    14

    Ortalama sipariş taşıma

    Bir dizideki hareketli Ortalamalar sayısını gösteren bir değeri temsil eder.

    ARIMA algoritmasını kullanmak saat serisi modelleri için geçerlidir.

    15

    Fark sipariş

    Değerini gösteren bir dizinin kaç kez belirten bir değer tanır olduğunu gösterir.

    ARIMA algoritmasını kullanmak saat serisi modelleri için geçerlidir.

    16

    Boole

    Bir Boole türü gösterir.

    17

    Diğer

    Algoritması tarafından tanımlanan özel bir değeri temsil eder.

    18

    Prerendered dize

    Bir dize olarak algoritma işleyen özel bir değeri temsil eder.Nesne modeli tarafından herhangi bir biçimlendirme uygulandığı.

    Değer türleri ADMOMD.NET numaralandırma türetilir.Daha fazla bilgi için bkz:MiningValueType.

Düğümün sonuç

Düğüm puan ne anlama geldiğini modeli türüne bağlı olarak değişir ve düğümün türüne de olabilir.Hakkında bilgi için NODE_SCORE hesaplanan her model ve düğüm türü için bkz:araştırma modeli İçeriği algoritma türü.

Düğüm olasılık ve Marjinal olasılık

Çıkarma modeli şema satır kümesi model türleri NODE_PROBABILITY ve MARGINAL_PROBABILITY sütunlarını içerir.Bu sütun, bir olasılık değeri anlamlı olduğu düğümlerin değerlerini içerir.Örneğin, modelin kök düğümü hiçbir zaman bir olasılık puan içerir.

Bu düğümlerin sağlayan olasılık puanlar, Marjinal olasılıklar ve düğüm olasılık temsil hesaplamaları.

  • Marjinal olasılık , üst. düğümden ulaşma olasılığı olan

  • Düğüm olasılık kök. düğümden ulaşma olasılığı olan

  • Düğüm olasılık ise her zaman küçük Marjinal olasılık .

Örneğin, karar ağacındaki tüm müşterilerin nüfusun cinsiyet tarafından eşit olarak ayrılır (ve hiçbir değer yok), alt düğümlerin olasılığı 0 olmalıdır.Ancak her cinsiyet için düğümü gelir düzeylerine göre eşit şekilde bölünür varsayalım — yüksek, orta ve düşük.Bu durumda her bir alt düğümü MARGINAL_PROBABILITY Skoru.33 her zaman olmalıdır ancak NODE_PROBABILTY değeri bu düğüme önde gelen tüm değerler ürün olması ve bu nedenle her zaman MARGINAL_PROBABILITY'den küçük değer.

Düğüm/niteliği ve düzey

Marjinal olasılık

Düğüm olasılık

Model kök

Tüm hedef müşterilere

1

1

Hedef müşterilere göre cinsiyet bölme

.5

.5

Hedef müşterilere göre cinsiyet bölmek ve gelir yeniden üç yolu bölme

.33

.5 * .33 = .165

Düğüm kural ve Marjinal kuralı

Çıkarma modeli şema satır kümesi model türleri NODE_RULE ve MARGINAL_RULE sütunlarını da içerir.Bu sütunlar, bir model seri hale getirmek için veya bazı bölümleri modeli yapısını göstermek için kullanılan XML parçalarını içerir.Bu sütun değeri anlamsız olacaktır, bazı düğümler için boş olabilir.

İki tür XML kuralları belirtilmezse, olasılık değerleri iki tür benzer.XML parçası olarak NODE_RULE yol geçerli düğümün modeli kökünden açıklar, ancak XML parçası MARGINAL_RULE, öznitelik ve değer geçerli düðümün tanımlar.

Başa Dön

araştırma modeli İçeriği algoritma türü

Her algoritma farklı türde bilgiler, içerik şemasının bir parçası olarak depolar.ÖrneğinMicrosoftKümeleme algoritması oluşturduğu çok sayıda alt düğümlerin, her biri gösteren olası bir küme.Her düğüm, kümedeki öğeleri paylaşılan özelliklerini tanımlayan kurallar içerir.Aksine,MicrosoftDoğrusal regresyon algoritması, tüm alt düğümlerini içermez; bunun yerine model için ana düğüm içerir bulunan Analiz. doğrusal ilişkiyi açıklayan denklemi

Aşağıdaki tabloda, her tür algoritması için konulara bağlantılar sağlar.

  • İçerik modeli konular: Her düğüm türü her algoritması için ne anlama geldiğini açıklamak ve hangi düğümlerin çoğu belirli bir modeli türü ilgilendiren Kılavuzu sağlar.

  • Sorgulama konular: sonuçlar yorumlamak nasıl bir özel model türü ve kılavuz sorguları örnekleri sağlar.

Algoritma veya modeli türü

İçerik modeli

Sorgulama madenciliği modelleri

İlişki modelleri kuralları

araştırma modeli Ilişkilendirmesi modeller için içerik (Analysis Services - veri madenciliği)

Bir ilişkilendirme modeli sorgulama (Analysis Services - veri madenciliği)

kümeleme modelleri

araştırma modeli Karar ağacı modeller için içerik (Analysis Services - veri madenciliği)

kümeleme Modeli sorgulama (Analysis Services - veri madenciliği)

Karar ağaçları modeli

araştırma modeli Karar ağacı modeller için içerik (Analysis Services - veri madenciliği)

Karar ağaçları model sorgulama (Analysis Services - veri madenciliği)

Doğrusal regresyon modeli

araştırma modeli Doğrusal regresyon modeller için içerik (Analysis Services - veri madenciliği)

Bir doğrusal regresyon modeli sorgulama (Analysis Services - veri madenciliği)

Logistic regresyon modeli

araştırma modeli Logistic regresyon modeller için içerik (Analysis Services - veri madenciliği)

Bir doğrusal regresyon modeli sorgulama (Analysis Services - veri madenciliği)

Naïve Bayes modelleri

araştırma modeli Naive Bayes modeller için içerik (Analysis Services - veri madenciliği)

Naive Bayes Model sorgulama (Analysis Services - veri madenciliği)

Neural ağ modelleri

Model içerik Neural ağ modeller için mining (Analysis Services - veri madenciliği)

Neural ağ modeli (Analysis Services-CVE-2006-veri madenciliği) sorgulanıyor.

Küme oluşturma sırası

araştırma modeli Sırası modeller kümeleme için içerik (Analysis Services - veri madenciliği)

Model kümeleme bir sıra sorgulama (Analysis Services - veri madenciliği)

saat serisi modelleri

araştırma modeli Saat Series modeller için içerik (Analysis Services - veri madenciliği)

saat serisi model sorgulama (Analysis Services - veri madenciliği)

araştırma modeli içeriği görüntülemek için Araçlar

Göz atma veya bir modeline keşfedinBusiness Intelligence Development Studio, bilgileri görüntüleyebileceğinizMicrosoft Office 2010 Suite genel içerik ağacı GörüntüleyicisiHer iki Business Intelligence Development Studiove , SQL Server Management Studio.

The Microsoft Generic Content Viewer displays the columns, rules, properties, attributes, nodes, and other content from the model by using the same information that is available in the content schema rowset of the mining model.İçerik şema satır kümesi kümesi bir veri araştırma modeli içeriği hakkında ayrıntılı bilgi sunmak için genel bir çerçevedir.Hiyerarşik Satır kümeleri destekleyen bir istemci modeli içeriği görüntüleyebilirsiniz.GörüntüleyicideBusiness Intelligence Development Studio, tüm modellerini oluşturduğunuz modelleri yapısını anlamak daha kolay, tutarlı bir biçimde gösteren bir HTML tablosu Görüntüleyicisi bu bilgiyi sunar.Daha fazla bilgi için bkz:Microsoft Genel içerik ağacı Görüntüleyici ile modeli ayrıntılarını görüntüleme.

Başa Dön

Sorgulama araştırma modeli içerik araçları

Çıkarma model almak için içeriği, gerekir oluşturduğunuz sorguda karşı veri araştırma modeli.

İçerik bir sorgu oluşturmak için en kolay yolu ise, aşağıdaki DMX deyim çalıştırmak içinSQL Server Management Studio:

SELECT * FROM [<mining model name>].CONTENT

Daha fazla bilgi için bkz:Veri madenciliği modelleri sorgulama (Analysis Services - veri madenciliği).

Veri madenciliği şema Satır kümeleri kullanarak içerik araştırma modeli de sorgulayabilirsiniz.şema satır kümesi kümesi keşfedin, göz ve çıkarma yapıları ve modelleri hakkındaki bilgileri sorgulamak için istemcilerin kullandığı standart bir yapıdır.XMLA, Transact-SQL veya DMX ifadeleri kullanarak şema Satır kümeleri sorgulayabilirsiniz.

InSQL Server 2008aynı zamanda erişebileceğiniz bilgileri veri madenciliği şema Satır kümeleri Analysis Services sunucusuna bir bağlantı açarak ve sorgulama tablolar.Sorgu veri madenciliği şema Satır kümeleri için bkz: SELECT ifadeleri kullanma hakkında daha fazla bilgi içinAraçlar sorun giderme (Analysis Services - veri madenciliği).

Başa Dön