Share via


araştırma modeli Karar ağacı modeller için içerik (Analysis Services - veri madenciliği)

Bu konuyu kullanan modelleri belirli çıkarma modeli içerik açıklarMicrosoftKarar ağaçları algoritması.Genel bir açıklaması için araştırma modeli içerik modeli türleri için bkz:araştırma modeli Içerik (Analysis Services - veri madenciliği).Microsoft Office 2010 Suite karar ağaçları algoritması modelleri ile çok farklı işlevler oluşturmak için bir karma algoritma olduğunu unutmamak önemlidir: karar ağacı, ilişkileri, kuralları veya hatta doğrusal regresyon. gösterebilir Ağaç yapısı temelde aynıdır, ancak, bilgileri nasıl yorumlanacağı amacı, model oluşturulan bağlıdır.

Karar ağaçları model yapısını anlama

Karar ağaçları model, modeli ve meta veriler gösteren tek bir ana düğüm vardır.Üst düğüm altında seçtiğiniz tahmin edilebilir özniteliklerini temsil eden bağımsız ağaçları var.Örneğin, müşteri bir şey satın alma ve girişleri, cinsiyet ve gelir sağlamak tahmin etmek için karar ağacı modelinizi ayarlarsanız, model satın almak için tek bir ağaç oluşturur öznitelik, cinsiyet ve gelir ilgili koşullara bölmek birçok dalı ile.

Bununla birlikte, tahmin edilebilir ayrı bir sonra eklerseniz öznitelik program bir müşteri katılım kazandırır için algoritma üst düğüm altında iki ayrı ağaçları oluşturur.Bir ağaç satın almak için çözümleme ve başka bir ağaç müşteri ödüller programın analiz yer alır.Karar ağaçları algoritması bir ilişki modeli oluşturmak için kullandığınız, öngörülen her ürün için ayrı bir ağaç algoritması oluşturur ve ağaç hedef seçimi katkıda bulunan tüm diğer ürün birleşimlerini içeren öznitelik.

Not

Model birden fazla ağaçları içeriyorsa, bir anda yalnızca bir ağaç görüntüleyebilirsinizMicrosoft Office 2010 Suite ağacı Görüntüleyicisi.Ancak,Genel içerik ağacı Görüntüleyicisi , aynı modeli tüm ağaçlarında aynı saat. görüntülenir

structure of model content for decision tree

Öngörülebilir her öznitelik için konsol ağacında, seçtiğiniz giriş sütunları belirli tahmin edilebilir özniteliğe sonucunu nasıl etkilediğini açıklayan bilgiler içerir.Her ağaç düğümü tarafından başlı (NODE_TYPE = 9) öngörülebilir içeren öznitelik, izlenen bir dizi düğümü (NODE_TYPE = 10) giriş öznitelik s gösterir.Bir öznitelik bir durum düzey sütun veya iç içe geçmiş tablo sütun değerlerine karşılık gelen olduğu genellikle değerlerKeysütun iç içe geçmiş tablo.

İç ve yaprak düğümlerin bölme koşulları temsil eder.Ağaç aynı bölme öznitelik birden çok kez.ÖrneğinTM_DecisionTree modeli bölme [yıllık gelir] ve [Çocuklarının Sayısı] ve sonra bölme yıllık [gelir], yeniden daha kapalı ağaç.

Karar ağaçları Microsoft Office 2010 Suite algoritması doğrusal eksiklikleri, konsol ağacında bir bölümünü veya tümünü de içerebilir.öznitelik, Model bir sürekli sayısal veri türü olan regresyon ağaç düğümü model oluşturabilirsiniz (NODE_TYPE = 25) öznitelik s arasındaki ilişkiyi linearly nerede modellenebilir.Bu durumda, düğüm regresyon formülü içerir.

Ancak, öngörülebilir öznitelik farklı değerlere sahip veya sayısal değerler bucketed veya discretized, model her zaman bir sınıflandırma ağaç oluşturur (NODE_TYPE = 2).Sınıflandırma ağaç birden fazla dalı veya iç ağaç düğümü olabilir (NODE_TYPE = 3) her değer için öznitelik.Ancak, bölmenin özniteliğin her değeri olmak zorunda değildir.

Karar ağaçları Microsoft Office 2010 Suite algoritması sürekli veri türlerini girişleri izin vermez; sütun sürekli sayısal veri türü, değerleri bu nedenle, discretized.Algoritma sürekli tüm özniteliklerini bir bölünme sırasında noktasına, kendi discretization yapar.

Not

Analysis Servicesbucketing sürekli öznitelikler için bir yöntem otomatik olarak seçer ancak girdileri nasıl sürekli değerleri denetleyebilirsiniz çıkarma yapısı sütuna içerik türünü ayarlayarak discretizedDiscretizedve daha sonraDiscretizationBucketCount()orDiscretizationMethod()özellik.

Karar ağaçları model içerik modeli

Bu bölümde yalnızca o sütun için bilgi ve örnekler sunar araştırma modeli modelleri karar ağaçları için belirli uygun olan içerik.Genel amaçlı çıkarma modeli terimleri, açıklamalarını ve şema satır kümesi kümesi, sütun hakkında bilgi için bkz:araştırma modeli Içerik (Analysis Services - veri madenciliği).

  • MODEL_CATALOG
    Model depolandığı veritabanının adı.

  • MODEL_ADI
    Modelinin adı.

  • ÖZNİTELİK_ADÝ
    Adı öznitelik karşılık gelen bu düğümü.

  • NODE_NAME
    NODE_UNIQUE_NAME her zaman aynı.

  • NODE_UNIQUE_NAME
    Düğüm modelindeki için benzersiz bir tanımlayıcı.Bu değer değiştirilemez.

    Karar ağacı modeller için benzersiz adlar tüm algoritmalar için geçerli olan aşağıdaki yöntemi uygulayın:

    Belirli bir düğümün alt düğümü tüm alt düğümü üst içindeki sırasını gösteren başka bir onaltılı sayı ve ardından aynı onaltılık öneke sahip olur.Bir yol anlaması için önekleri kullanabilirsiniz.

  • NODE_TYPE
    Karar ağacı modellerinde, düğümler aşağıdaki türde oluşturulur:

    Düğüm türü

    Açıklama

    1 (Model)

    Kök düğüm modeli.

    2 (Ağacı)

    Üst düğüm modelinde sınıflandırma ağaçlar için.Etiketli"All".

    3 (İç)

    İç şubesinin kafası bulunan içinde bir sınıflandırma ağacındaki veya regresyon ağaç.

    4 (Dağıtım)

    Yaprak düğüm, bir sınıflandırma ağaç içinde bulunan veya regresyon ağaç.

    25 (Regresyon ağacı)

    Üst düğüm modelindeki gerileme ağacı için.Etiketli olarak"All".

  • NODE_CAPTION
    Görüntüleme amaçları için bir kolay ad.

    Bir model oluşturmak, NODE_UNIQUE_NAME değerini otomatik olarak resim yazısı olarak kullanılır.Ancak, görüntü adı, küme için program aracılığıyla veya görüntüleyiciyi kullanarak güncelleştirmek NODE_CAPTION değerini değiştirebilirsiniz.Resim yazısı modeline göre otomatik olarak oluşturulur.Başlık, içerik modeli türü ve düğüm türü bağlıdır.

    Karar ağaçları modelinde, the NODE_CAPTION ve NODE_DESCRIPTION farklı bilgileri, bağlı olan düzey ağacında.Daha fazla bilgi ve örnekler için bkz:Düğüm başlık ve açıklama düğümü.

  • CHILDREN_CARDINALITY
    Tahmini sayının alt düğümü vardır.

    Üst düğümModel öngörülebilir özniteliklerini gösterir.Her biri için oluşturulan bir ağaç öngörülebilir öznitelik.

    Ağaç düğümüTüm düğüm her ağaç için ne kadar değerleri hedef için kullanılan söyler öznitelik.

    • , Hedef öznitelik ise ayrı, değeri ayrı ayrı değerleri ile 1 sayısı eşittirMissingdurumu.

    • Öngörülebilir öznitelik sürekli ise, değer ne kadar demetleri sürekli özniteliği modeli için kullanılan bildirir.

    Yaprak düğümHer zaman 0.

  • PARENT_UNIQUE_NAME
    Düğümün üst benzersiz adı.Kök düzeyindeki tüm düğümler için NULL döndürür.

  • NODE_DESCRIPTION
    Düğüm bir açıklaması.

    Karar ağaçları modelinde, the NODE_CAPTION ve NODE_DESCRIPTION sahip ağaç. düzeyine bağlı olarak farklı bilgiler

    Daha fazla bilgi ve örnekler için bkz:Düğüm başlık ve açıklama düğümü.

  • NODE_RULE
    Kural, hemen üst düğümü geçerli düğümün yolunu tanımlayan bir XML açıklaması.

    Daha fazla bilgi ve örnekler için bkz:Düğüm kural ve Marjinal kuralı.

  • MARGINAL_RULE
    XML açıklaması geçerli düğüm model ana düğümden yol tanımlayan kural.

    Daha fazla bilgi için bkz:Düğüm kural ve Marjinal kuralı.

  • NODE_PROBABILITY
    Bu düğümü. ilişkili olasılık

    Daha fazla bilgi için bkz:Olasılık.

  • MARGINAL_PROBABILITY
    Ana düğümden düğüme ulaşma olasılığı.

    Daha fazla bilgi için bkz:Olasılık.

  • NODE_DISTRIBUTION
    Düğümün olasılık çubuk içeren bir tablo.Bu tablodaki bilgiler mi bağlı olarak farklı öngörülebilir öznitelik sürekli veya ayrık bir değişkendir.

    Model kök düğümüBu tablo yok.

    (Tümü) düğümüModel için bir Özet içeren bir bütün.

    İç düğümToplanan, yaprak düğümlerin. istatistikleri içerir.

    Yaprak düğümDestek ve olasılık geçerli yaprak düğüm. için önde gelen yol tüm koşullar verilen öngörülen sonuçlarını içerir.

    Regresyon düğümüGirdileri ve önceden kestirilebilir özniteliği. arasındaki ilişkiyi temsil eden gerileme formül

    Daha fazla bilgi için bkz:Düğüm dağıtım fr ayrı özellikleri ve sürekli bir öznitelik düğümü verilir .

  • NODE_SUPPORT
    Bu düğüm destekleyen bir servis talebi sayısı.

  • MSOLAP_MODEL_COLUMN
    Öngörülebilir içeren sütun gösterir öznitelik.

  • MSOLAP_NODE_SCORE
    Düğüm ile ilgili bir sonuç görüntüler.Daha fazla bilgi için bkz:Düğümün sonuç.

  • MSOLAP_NODE_SHORT_CAPTION
    Bir etiket görüntüleme amacıyla kullanılır.

Remarks

Karar ağaçları model tüm modeli, farklı bir Naive Bayes veya neural ağ modeli bulunan Marjinal İstatistikler düğümünü istatistiklerini depolayan ayrı bir düğüm yok.Bunun yerine model (tümü) bir düğüm ağacının en üstündeki öngörülebilir her öznitelik için ayrı bir ağaç oluşturur.Her ağaç diğerlerinden bağımsızdır.Yalnızca bir tahmin edilebilir modeliniz varsa öznitelik, tek bir ağaç ve (tümü) bir nedenle tek düğüm yok.

Bir çıktıyı her ağaç öznitelik ayrıca iç dalları içinde bölünür (NODE_TYPE = 3) bölmeleri gösterir.Bu ağaçların her hedef dağıtımı ile ilgili istatistikleri içeren öznitelik.Buna ek olarak, her yaprak düğüm (NODE_TYPE = 4) giriş öznitelikleri ve değerleri zaman'ın her öznitelik-değer çifti sayısı birlikte istatistikleri içerir.Bu nedenle, herhangi bir karar ağacı dalında değerler veya veri dağıtımı kolayca kaynak verileri sorgulamak gerekmeden görüntüleyebilirsiniz.Ağacın her düzey, mutlaka, alt toplamı gösterir.

Bu istatistikler almak örnekler için bkz:Karar ağaçları model sorgulama (Analysis Services - veri madenciliği).

Karar ağacı yapısını örneği

Karar ağacında nasıl çalıştığını anlamak için örnek, AdventureWorks bisiklet alıcı senaryo gibi düşünün.Müşterinin satınalma tahmin edilebilir öznitelik varsayılarak, karar ağaçları algoritması, bir bisiklet ve bir bisiklet satın almak olası olan bu satın alma olasılığı yüksek olan müşterilerin en etkin şekilde algılayan sağladığınız, tüm girdileri arasında veri sütun bulmak çalışır.Örneğin, model geçerlilik süresi satın alma davranışı en iyi göstergesi olduğunu bulabilirsiniz.Özellikle, müşterilerin 30 yaş üzerinde bir bisiklet satın almak çok yüksektir ve tüm diğer müşteriler alışveriş yapmak düşüktür.Bu senaryoda, model oluşturur birbölme Yaş özniteliğini.Bu, konsol ağacında, bir geçerlilik süresi 30 ve diğer içeren müşteriler altında 30 müşterileri içeren iki dalı böler, anlamına gelir.Yeni dalları modeli yapısında iki yeni iç ağaçları gösterilir (NODE_TYPE = 3).

Her dal için model müşterilerin differentiating olarak kullanmak ek öznitelik için arama devam eder.Veriler müşteri gruplarının oluşturmaya devam etmek için yeterli kanıt yoksa, model ağacı oluşturma durdurulur.Ağaç düğümü durumlarda sayısı, nasıl bölmenin olmasına bakılmaksızın, devam etmek için çok küçük olduğunda veya değeri null veya eksik ise oluşturma modelini de durdurur.Erken büyüme ağacının durdurma, model eğitim arasında çok yakın bir belirli veri kümesi için engeller.

Geçerli sınıflandırma sonuçlar verilen sonucunu bir çözümleme sağlayan yaprak düğümlerin her iç ağaç düğümü içerir.Örneğin, sahip bir iç düğümü temsil eder, geçerlilik süresi>= 30 ve cinsiyet erkek. =Düğüm bu grup için bu kategorideki kaç müşteri satın alınan ya da bir şey satın gösterir.Örneğin, sınıflandırma aşağıdaki ağaç bölmelerini içerebilir:

İç ağaç

Bölme

Geçerlilik süresi>= 30

Geçerlilik süresi>= 30 ve cinsiyet erkek =

  

Geçerlilik süresi>= 30 ve cinsiyet Female =

Geçerlilik süresi<30

Geçerlilik süresi<30 ve cinsiyet erkek =

  

Geçerlilik süresi<30 ve cinsiyet Female =

Bir karar ağacı modeli için tahmin kullandığınızda, model bağımsız değişken olarak sağlayan nitelikleri alır ve özniteliklerin yolunu kullanarak ağaç izler.Genel olarak, bir yaprak için tüm önerileri gidin ve iç düğüm yalnızca sınıflandırılması için kullanılır.

Yaprak düğüm her zaman 4 (dağıtım) bir NODE_TYPE vardır ve özniteliklerini size verilen her sonucu (satın alma veya satın alma değil) olasılığını belirten bir çubuk grafik içerir.Örneğin, bir erkek üzerinde 60 olan yeni bir müşteri için bir tahmin için sorun, model karşılık gelen düğümü görünümünü (yaş >30 ve cinsiyet erkek =) ve ardından belirttiğiniz sonucu için olasılık geri dönün.Bu değerler saklananNODE_DISTRIBUTION Tablo düğümü.

, Öngörülebilir öznitelik algoritması çalışır, öngörülebilir arasındaki ilişki modelleri regresyon formül oluşturmak için sürekli bir sayı öznitelik girdi.

Düğüm başlık ve açıklama düğümü

Karar ağacı modeli düğümün başlık ve açıklama düğümü benzer bilgiler içerir.Ancak, düğümün açıklamasını daha kapsamlı ve yaprak düğümlerine yakın bir yere geçtiğinizde daha fazla bilgi içerir.Yerelleştirilmiş dizeleri düğümün başlık ve açıklama düğümü olur.

NODE_CAPTION

Görüntüler öznitelik, belirli o düğümün üst düğüme göreli olarak ayırır.Bir sub-segment, düğüm başlığı tanımlar nüfusun bölme koşula.Üç alt düğümleri olabilir için bölmenin [yaş] üzerinde olan üç yollu bölme olduğu, düğüm örneğin captions "[yaş<40 "," 40<= [Age<50 "," [Yaş>= 50".

NODE_DESCRIPTION

Düğüm modeli üst düğümünden başlayan diğer düğümlerden ayırt özniteliklerin tam listesini içerir.Örneğin, ürün adı Apple ve rengi = kırmızı =.

Düğüm kural ve Marjinal kuralı

NODE_RULE ve MARGINAL_RULE sütunları NODE_CAPTION ve NODE_DESCRIPTION sütunları aynı bilgileri içerir, ancak XML parçaları bilgileri temsil eder.En son bölme Marjinal kural gösterir, ancak düğüm kuralı bir tam yol, XML sürümüdür.

XML parçası gösterilen özniteliği basit veya karmaşık olabilir.Basit bir öznitelik modelin bulunduğu sütun ve özniteliği değeri.Model sütun iç içe geçmiş bir tablo içeriyorsa, iç içe geçmiş tablo öznitelik tablo adı, anahtar değerini ve öznitelik bir birleşimi temsil edilir.

Not

SQL Server Analysis Services sürüm 2.0 standart, PMML uzantılı iç içe geçmiş tablo kullanımını destekler.Verilerinizi iç içe geçmiş tablolar içeren bir model PMML sürüm oluşturmak, koşullarına içeren tüm öğeler modelinde bir uzantısı olarak işaretlenir.

Ayrı bir öznitelik düğümü verilir.

Karar ağaçları modelinde, NODE_DISTRIBUTION tablo yararlı istatistikleri içerir.Ancak, ağaç kesikli veya sürekli öznitelik yoksa tahmin istatistik türüne bağlıdır.Bu bölüm için ayrı öznitelik düğümü dağılım istatistiklerini anlamını açıklar.

Öznitelik adı ve öznitelik değeri

Bir sınıflandırma ağacındaki öznitelik adı her zaman bulunduğu tahmin edilebilir sütun.Bu değer, hangi ağaç tahmin bildirir.Tek bir ağaç her zaman tek bir tahmin edilebilir öznitelik temsil ettiğinden, bu değer ağaç yinelenir.

Ayrı bir veri türü için öznitelik değeri alan öngörülebilir sütunun olası değerleri listeler veMissingdeğer.

Destek

Her düğüm için destek değeri, bu düğüm kaç servis taleplerinin ekleneceğini bildirir.(Tümü) düzeyinde, model geliştirmek için kullanılan durumda tam sayısı görmeniz gerekir.Ağacın her bölme için ağacının düğüm gruplandırılmış servis taleplerinin sayısı destek değerdir.Durumlarda yaprak düğümlerin toplamını gerekmeyen durumlarda üst düğüm ağacının sayısı eşittir.

Sürekli özniteliklerini temsil eden düğüm olarak null veri varlığını counterintuitive bazı sonuçlara yol açabilir.Örneğin, varm durumlarda, ortalama bir değer hesaplanması burada nd numara küçüktür ve değerler. eksik olan servis taleplerinin sayısı m-n gösterir toplam (tüm servis talepleri) /n , Destek da gösterdiği gibin.

Olasılık

Her düğüm ile ilgili olasılık, bu belirli düğüm herhangi bir durumda tüm veri kümesi koddan olasılığını bildirir.Olasılık puan hem Konsol ağacında bir bütün olarak ve hemen bölme hesaplanmış.

Örneğin, 100 durumda olan çok basit bir modeli aşağıdaki tabloda gösterilmektedir.

İç ağaç

Servis talepleri

Yaprak düğüm

Servis talepleri

Üst düğüm göreli olarak olasılık

Üst düğüm göreli olarak olasılık

Geçerlilik süresi>= 30

60

Geçerlilik süresi>= 30 ve cinsiyet erkek =

50

50/60 = .83

50/100 = .5

  

  

Geçerlilik süresi>= 30 ve cinsiyet Female =

10

10/60 = .16

10/100 = .10

Geçerlilik süresi<30

40

Geçerlilik süresi<30 ve cinsiyet erkek =

30

30/40 = .75

30/100 = .30

  

  

Geçerlilik süresi<30 ve cinsiyet Female =

10

10/40 = .25

10/100 = .10

Olası eksik değerleri hesap için tüm modellerinde küçük bir ayarlama yapılır.Durumu olarak sürekli öznitelikler için her bir değer veya değerler aralığıdır gösterilir (örneğin, geçerlilik süresi <30, Age = 30 ve yaş >30) ve değerler aşağıdaki gibi hesaplanır: durumu yok (değer = 1), diğer bir durum var (değer = 0), durumdur Missing.Eksik değerleri nasıl değerler düzeltilmiş göstermek için daha fazla bilgi için bkz:Değerleri eksik (Analysis Services - veri madenciliği).

Dağıtıma karşı doğrudan hemen hemen her düğüm için değerler aşağıdaki gibi hesaplanır:

Olasılık = (destek durum) + önceki durumu için destek / (düğüm desteği ve önceki düğüm destekler)

Analysis Servicessaklı olasılığını belirlemek alt düğümü üst yoldan olup olmadığını gösteren önceki olasılığı ile karşılaştırmak her düğüm için değerler kullanır. güçlü kesmesi.

Öngörüler yapılırken olasılık dağılımının değerler smoothen düğümü, olasılığı ile dengelenmelidir.Örneğin, bir bölmedeki ağaç durumlarda 9000/1000 bir oranı ayırır, ağaç çok dengesiz olur.Sonuç olarak, küçük daldan gelen bir tahmini Ağırlık çoğu durumda olan bir dal coming bir tahmin olarak yürütmesini değil.

Farkı

Örnek değerler nasıl Saçılan ölçüsü olan beklenen bir dağıtım verilen farkı var.Farklı değerler için fark tanım olarak sıfırdır.

Nasıl fark hesaplanır, sürekli değerleri hakkında bilgi için bkz:araştırma modeli Doğrusal regresyon modeller için içerik (Analysis Services - veri madenciliği).

Değer türü

Değer türü sütun NODE_DISTRIBUTION tablosunda diğer sütunlardaki sağlanan sayısal değerinin anlamı hakkında bilgi sağlar.Değer türü, iç içe geçmiş tablolar belirli satırları almak için sorguları kullanabilirsiniz.Örnekleri için bkz:Karar ağaçları model sorgulama (Analysis Services - veri madenciliği).

TürleriMiningValueTypesıralama, sınıflandırma ağaçları. aşağıdaki kullanılır

Değer türü

Açıklama

1 (Eksik)

Bir sayı, olasılık veya eksik değerler için ilgili diğer istatistik gösterir.

4 (Discrete)

Sayısı, olasılık ve ayrık ya da discretized değerine ilgili diğer istatistik gösterir.

Model sürekli öngörülebilir bir özniteliði varsa, konsol ağacında da benzersiz değer türlerini içerebilir regresyon formülleri.Regresyon ağaçları, kullanılan değer türlerinin listesi için bkz:araştırma modeli Doğrusal regresyon modeller için içerik (Analysis Services - veri madenciliği).

Düğümün sonuç

Düğüm puan ağacının her düzeyine biraz farklı bilgileri temsil eder.Genel olarak, sonuç ne iyi bölme belirten sayısal bir değer koşula bağlı bölerek elde olur.Değer daha yüksek bir değer olduğu daha iyi bir çift temsil edilir.

Tanım olarak, bir düğüm puan 0 modeli düğümü ve tüm yaprak düğümleri vardır.

Her ağaç üstünde gösterir (tümü) düğümünün MSOLAP_NODE_SCORE sütun içerir iyi bölme puan tüm ağaç.

Tüm diğer düğümler için (dışında yaprak düğümlerin) konsol ağacında, geçerli düğümün üst düğümün bölme Skoru eksi bölme en iyi Skoru her düğüm için puan gösterir.Genellikle, bir üst düğüm için bölme sonuç her zaman, alt düğümler, herhangi bir bölme puan daha iyi olmalıdır.Karar ağaçları modeli ideal en önemli nitelikleri üzerinde ilk böler olmasıdır.

Seçtiğiniz algoritma parametresine bağlı olarak, bir bölme için bir puan hesaplama birçok yolu vardır.Tartışma nasıl Puanlar her skor yöntemi hesaplanır, bu konunun kapsam dışındadır ' dir.Daha fazla bilgi için bkz: "Bayesian ağlar öğrenme:Birleşik, bilgi ve istatistik veri ", üzerinde MicrosoftAraştırma Web sitesi.

Not

Sürekli ve ayrık öngörülebilir özniteliklere sahip bir karar ağacı modeli oluşturursanız, her ağaç türünü temsil eden (tümü) düğümlerin tamamen farklı Puanlar görürsünüz.Her model bağımsız olarak değerlendirilmesi gereken ve regresyon skor için kullanılan yöntemleri tamamen sınıflandırma skor için kullanılan farklıdır.Düğüm sonuç değerlerini karşılaştırılamaz.

Karar ağacı model içinde regresyon düğümleri

Karar ağaçları model sürekli sayısal verilerle öngörülebilir öznitelik varsa, tahmin edilen durumu ve giriş değişkenler arasındaki ilişkiyi doğrusal olduğu veri alanları bulmak Microsoft Office 2010 Suite karar ağaçları algoritması arar.Algoritma doğrusal bir ilişki bulma işlemi başarılı olursa özel bir ağaç oluşturur (NODE_TYPE = 25), bir doğrusal regresyon temsil eder.Bu regresyon ağaç düğümlerini ayrı değerleri temsil eden düğüm karmaşık.

Genel olarak, bir regresyon sürekli bağlı (öngörülebilir değişken) değişiklikleri girdileri değişikliklerinin bir işlev olarak eşler.Bağımlı değişken sürekli bir girdi varsa ve giriş ve tahmini değeri arasındaki ilişki bir çizgi grafiği hesaplanması için kararlı, gerileme ilgili bir formül içerir.

Ancak giriş ve öngörülen değer ilişkisi olup olmadığınıdoğrusal olmayan, bölme bunun yerine, oluşturulan yeni bir standart karar ağacı. gibi Örneğin, bir tahmin edilebilir öznitelik ve burada C bir sürekli bir değer türü, girdileri, B ve C olduğunu varsayalım.A arasındaki ilişkiyi ve C, verilerin bir bölümü de oldukça kararlı, ancak diğerleri de kararsız, algoritma farklı veri alanları göstermek için bölmeleri oluşturacaktır.

Koşul bölme

Düğüm neden

n<5

İlişki Denklem (1) ifade edilebilir

n, 5 ile 10 arasında

Hiçbir Denklem

n>10

İlişki Denklem (2) ifade edilebilir

Regresyon düğümler hakkında daha fazla bilgi için bkz:araştırma modeli Doğrusal regresyon modeller için içerik (Analysis Services - veri madenciliği).