Karar ağaçları model sorgulama (Analysis Services - veri madenciliği)

Bir veri araştırma modeli yönelik bir sorgu oluşturduğunuzda, çözümlemesinde keşfedilen desenleri ayrıntılarını sağlar, içerik bir sorgu oluşturabilirsiniz veya desenleri modelde Öngörüler için yeni veri sağlamak için kullanır. tahmin bir sorgu oluşturabilirsiniz.Örneğin, bir karar ağacı modeli için içerik sorguda durumlarda, konsol ağacında veya durumlar arasında ayrım kuralları, her düzeyde sayısı hakkındaki istatistikleri sağlayabilir.Alternatif olarak, tahmin sorguda model için yeni veri önerileri, sınıflandırmalar vb. oluşturmak için eşleştirir.Ayrıca, bir sorgulama kullanarak meta veriler modeli hakkında da alabilirsiniz.

Bu bölüm için modelleri temel alan sorgular oluşturma açıklar Microsoft Karar ağaçları algoritması.

  • Içerik sorgular

    Alınan veri madenciliği modeli Parametreler alınıyor şema satır kümesi

    Ağaçlar hakkında ayrıntılar DMX kullanarak modelde döndürülüyor.

    Regresyon düğümler bir karar ağacı modeli döndürülüyor

  • Tahmin sorgular

    Döndürmeyi Öngörüler ve değerler

    Bir karar ağacı'ndan ilişkiler tahmin

Karar ağaçları model hakkında bilgi bulma

Karar ağaçları model içeriğine anlamlı bir sorgu oluşturmak için , içerik modeli yapısını anlamalısınız ve hangi düğüm türü, ne tür bilgiler depolar.Daha fazla bilgi için bkz:araştırma modeli Karar ağacı modeller için içerik (Analysis Services - veri madenciliği).

Başa dön

Örnek sorgu 1: Veri madenciliği Schema satır kümesi modeli Parametreler alınıyor

Veri madenciliği şema satır kümesi kümesi sorgulayarak, meta veriler ne zaman oluşturulduğunu, model son işlendi, araştırma yapısı modelini temel alan adını ve öngörülebilir bir öznitelik olarak kullanılan bir sütun adı, modeli konusunda bulabilirsiniz.Ayrıca, model oluşturulduğunda kullanılan parametreleri dönebilirsiniz.

select MINING_PARAMETERS 
from $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'TM_Decision Tree'

Örnek sonuçlar:

mining_parameters

complexity_penalty 0.5 maximum_input_attributes = 255 maximum_output_attributes = 255 minimum_support = = 10, score_method = 4, split_method = 3, force_regressor =

Başa dön

Örnek sorgu 2: DMX kullanarak, modelde ağaçları ile ilgili ayrıntıları döndürülüyor

Aşağıdaki sorgu oluşturduğunuz karar ağacı modeli hakkında bazı temel bilgileri döndürür Temel veri madenciliği Öğreticisi. Bu sorgu, tahmin edilebilir belirli öznitelik temsil eden bir ağacın en üst düzey düğümlerin, tüm düğümlerin Tür 2 döndürür.Bu model, tek ve öngörülebilir bir öznitelik içerdiğinden, yalnızca bir ağaç düğümü yok.Ancak, bir ilişkilendirme modelini karar ağaçları algoritmasını kullanarak oluşturursanız, olabilir ağaçları, her ürün için yüzlerce.

Not

sütun CHILDREN_CARDINALITY, aynı adı ayrılmış bir MDX anahtar sözcük, birbirinden ayırmak için ayraç içine alınması gerekir.

SELECT MODEL_NAME, NODE_NAME, NODE_CAPTION, 
NODE_SUPPORT, [CHILDREN_CARDINALITY]
FROM TM_DecisionTrees.CONTENT
WHERE NODE_TYPE = 2

Örnek sonuçlar:

MODEL_ADI

node_name

node_caption

node_support

children_cardinality

TM_DecisionTree

000000001

Tümü

12939

5

Karar ağaçları modeli önem belirli bir düğümün, ne kadar çabuk alt bildirir düğüm vardır.Bu nedenle, önem için önceki bir sorgu tarafından döndürülen bir düğüm, model 5 gruplarının olası bisikleti alıcıların hedef popülasyonunu bölünmüş bildirir.Aşağıdaki ilgili sorgu ile birlikte dağıtılması, öznitelikleri ve değerleri alt düğümlerin bu beş gruplarının için çocuklarınızın döndürür.Destek ve olasılık varyansı gibi istatistikleri iç içe geçmiş bir tabloda saklanması nedeniyle NODE_DISTRIBUTION, bu örnek kullanır FLATTENED iç içe geçmiş tablo sütunları çıkış için anahtar'ı tıklatın.

Not

Iç içe geçmiş tablo sütun SUPPORT, aynı ada sahip ayrılmış anahtar sözcük, birbirinden ayırmak için ayraç içine alınması gerekir.

SELECT FLATTENED NODE_NAME, NODE_CAPTION,
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, [SUPPORT]
FROM NODE_DISTRIBUTION) AS t
FROM TM_DecisionTree.CONTENT
WHERE [PARENT_UNIQUE_NAME] = '000000001'

Örnek sonuçlar:

node_name

node_caption

t.attribute_name

t.attribute_value

DESTEK

00000000100

Otomobilleri ait numara = 0

Bisiklet alıcı

Eksik

0

00000000100

Otomobilleri ait numara = 0

Bisiklet alıcı

0

1067

00000000100

Otomobilleri ait numara = 0

Bisiklet alıcı

1

1875

00000000101

Otomobilleri ait numara = 3

Bisiklet alıcı

Eksik

0

00000000101

Otomobilleri ait numara = 3

Bisiklet alıcı

0

678

00000000101

Otomobilleri ait numara = 3

Bisiklet alıcı

1

473

Bu sonuçlar, anlarsınız bir bisikletin (satın alan müşteriler[Bike Buyer] = 1), 1067 müşteriler 0 otomobiller ve 473 müşteriler 3 otomobilleri.

Bir bisiklet satın müşteriler hakkında daha fazla bulmaya istediğinizi varsayın.Ek ayrıntı için sub-trees birini kullanarak görüntüleyebilirsiniz IsDescendant (DMX) Aşağıdaki örnekte gösterildiği gibi sorguda işlev. Sorgu, bisikleti Satınalmacı sayısı yaprak düğümlerin alarak verir (NODE_TYPE = 4) üzerinde 42 yılları yaştaki müşterilerimiz içeren ağaç.Iç içe satır sorgunun engeller tablo bu yer için Bike alıcı = 1.

SELECT FLATTENED NODE_NAME, NODE_CAPTION,NODE_TYPE,
(
SELECT [SUPPORT] FROM NODE_DISTRIBUTION WHERE ATTRIBUTE_NAME = 'Bike Buyer' AND ATTRIBUTE_VALUE = '1'
) AS t
FROM TM_DecisionTree.CONTENT
WHERE ISDESCENDANT('0000000010001')
AND NODE_TYPE = 4

Örnek sonuçlar:

node_name

node_caption

t.SUPPORT

000000001000100

Yıllık gelir >= 26000 ve < 42000

266

00000000100010100

Alt toplam = 3

75

0000000010001010100

Çocuklarının sayısı giriş = 1

75

Başa dön

Örnek sorgu 3: Regresyon düğümler bir karar ağacı modeli döndürülüyor

Sürekli öznitelik bulunan bir gerileme içeren bir karar ağacı modeli oluşturduğunuzda, Öngörüler yapmak regresyon formülde kullanabilirsiniz veya regresyon formülün hakkında bilgi ayıklayabilirsiniz.Regresyon modelleri sorgular hakkında daha fazla bilgi için bkz: Bir doğrusal regresyon modeli sorgulama (Analysis Services - veri madenciliği).

Model regresyon düğümlerin ve ayrı bir öznitelik veya aralıklarını ayırma düğümlerin karışımını içeriyorsa, yalnızca regresyon düğümü döndüren bir sorgu oluşturabilirsiniz.NODE_DISTRIBUTION tablo regresyon formülün ayrıntıları içerir.Örneğin, sütunları düzleştirilir ve NODE_DISTRIBUTION tablo başka ad verilmiş için daha kolay olur.Ancak, bu modelde, hiçbir regressors ilişkilendirmede bulunamadı. Geliri sürekli diğer özniteliklere sahip.Bu gibi durumlarda, Analysis Services Bu öznitelik modelinde özniteliği ve toplam sapma ortalama değerini döndürür.

SELECT FLATTENED NODE_DISTRIBUTION AS t
FROM DT_Predict. CONTENT
WHERE NODE_TYPE = 25

Örnek sonuçlar:

t.ATTRIBUTE_NAME

t.ATTRIBUTE_VALUE

t.SUPPORT

t.PROBABILITY

t.VARIANCE

t.VALUETYPE

Yıllık gelir

Eksik

0

0.000457142857142857

0

1

Yıllık gelir

57220.8876687257

17484

0.999542857142857

1041275619.52776

3

  

57220.8876687257

0

0

1041216662.54387

11

Değer türleri ve regresyon modellerinde kullanılan istatistikleri hakkında daha fazla bilgi için bkz: araştırma modeli Doğrusal regresyon modeller için içerik (Analysis Services - veri madenciliği).

Başa dön

Modelini kullanarak Öngörüler yapma

Karar ağaçları, bir karar ağacı modeli bir tahmin sorgu oluşturduğunuzda, sınıflandırma, regresyon ve hatta ilişkilendirmesi, aşağıdakiler dahil olmak üzere, çeşitli görevleri için kullanılabilir olduğundan, birçok seçenek kullanılabilir olması gerekir.Için modeli sonucunu tahmin anlamak için oluşturulduğu amacını anlaması gerekir.Aşağıdaki sorgu örnekleri, üç farklı senaryo gösterilmiştir:

  • Doğru ve sonra da sonuçlar tarafından olasılık; süzme öngörü olasılığıyla birlikte bir sınıflandırma modeli bir tahmin döndürülüyor

  • Ilişkilendirmeler; tahmin etmek için tek bir sorgu oluşturma

  • Giriş ve çıkış arasındaki ilişkiyi olduğu doğrusal karar ağacı bir parçası regresyon formülünü alınıyor.

Başa dön

Örnek sorgu 4: Öngörüler ve değerler döndürülüyor

Aşağıdaki örnek sorgu oluşturulan karar ağacı modeli kullanan Temel veri madenciliği Öğreticisi ve geçiş örnek verileri, tablo. AdventureWorks DW, müşterilerin bir listede, bir bisiklet satınalma tahmin modellerini içine dbo.ProspectiveBuyers'i tıklatın. Sorgu tahmin işlev içerir. PredictHistogram (DMX), hangi modeli tarafından belirlenen değerler hakkında yararlı bilgiler içeren bir iç içe geçmiş tablo döndürür. Yalnızca olanlar ile % 50'den büyük bir olasılık olası bisikleti alıcıların öngörülen dönmek için WHERE yan tümce, ekleyerek Öngörüler süzülür.

SELECT
  [TM_DecisionTree].[Bike Buyer],
  PredictHistogram([Bike Buyer]) as Results
FROM
  [TM_DecisionTree]
PREDICTION JOIN
  OPENQUERY([Adventure Works DW],
    'SELECT
      [FirstName],
      [LastName],
      [MaritalStatus],
      [Gender],
      [YearlyIncome],
      [TotalChildren],
      [NumberChildrenAtHome],
      [HouseOwnerFlag],
      [NumberCarsOwned]
    FROM
      [dbo].[ProspectiveBuyer]
    ') AS t
ON
  [TM_DecisionTree].[First Name] = t.[FirstName] AND
  [TM_DecisionTree].[Last Name] = t.[LastName] AND
  [TM_DecisionTree].[Marital Status] = t.[MaritalStatus] AND
  [TM_DecisionTree].[Gender] = t.[Gender] AND
  [TM_DecisionTree].[Yearly Income] = t.[YearlyIncome] AND
  [TM_DecisionTree].[Total Children] = t.[TotalChildren] AND
  [TM_DecisionTree].[Number Children At Home] = t.[NumberChildrenAtHome] AND
  [TM_DecisionTree].[House Owner Flag] = t.[HouseOwnerFlag] AND
  [TM_DecisionTree].[Number Cars Owned] = t.[NumberCarsOwned]
WHERE [Bike Buyer] = 1
AND PredictProbability([Bike Buyer]) >'.05'

Varsayılan olarak, Analysis Services iç içe geçmiş tablolar sütun etiketi ifade döndürür. Bu etiket, diğer ad verilen sütun değiştirebilirsiniz.Diğer ad (Bu durumda, bunu sonuçlar) Her iki sütun başlığını ve iç içe geçmiş tablo değeri olarak kullanılır.sonuçlar görmek için bir iç içe geçmiş tablo genişletmelisiniz.

Örnek sonuçlar:

Bisiklet alıcı

Sonuçlar

1

Sonuçlar

Bisiklet alıcı$ DESTEĞİ$ OLASILIK$ adjustedprobability$ VARYANSI$ stdev
125400.6348492420456440.01356216828156200
014600.3649841745793770.0066133693255091500
00.0001665833749791770.00016658337497917700

sonuçlar aþaðýda gösterildiði gibi sıradüzensel Satır kümeleri sağlayıcınız desteklemiyorsa, yinelenen sütun değerlerini yerine boşluk içeren bir tablo olarak sonuçlar döndürmek için sorguda FLATTENED anahtar kullanabilirsiniz.Daha fazla bilgi için bkz: Tabloları iç içe geçmiş (Analysis Services - veri madenciliği) veya SELECT deyimi (DMX) anlama.

Başa dön

Örnek sorgu 5: Bir karar ağacı ilişkileri tahmin

Aşağıdaki sorguyu kullanmak için , öğretici ilişkilendirme modelini bir kopyasını oluşturun ve algoritmayı karar ağaçları algoritması için değiştirebilirsiniz.Daha fazla bilgi için bkz:Ders 3: Bir (ara) veri madenciliği Öğreticisi) Pazar Basket senaryo oluşturma.

Aşağıdaki örnek sorgu içinde kolayca oluşturabilirsiniz aynı cinsten tek adet sorguda olur. Business Intelligence Development Studio alanları seçerek ve sonra da bu alanların değerlerini aþaðý açýlan listeden seçerek.

SELECT PredictAssociation([DT_Association].[v Assoc Seq Line Items],3)
FROM
  [DT_Association]
NATURAL PREDICTION JOIN
(SELECT (SELECT 'Patch kit' AS [Model]) AS [v Assoc Seq Line Items]) AS t

Beklenen sonuçlar:

Model

Dağ-200

Dağ Tekeri Borusu

Lastiği iç Lastik yarış

sonuçlar düzeltme eki paketi ürünü satın almış olan müşteriler için önermek için üç en iyi ürünlere söyleyin.Öneriler için değerleri yazarak veya kullanarak yaptığınızda giriş olarak da birden çok ürün sağlayabilir Aynı cinsten tek adet Query giriş iletişim kutusu ve ekleme veya değerleri kaldırılıyor.Aşağıdaki örnek sorgu nasıl birden çok değer, bağlı olan bir tahmin yapmak sağlanan gösterir.Değerleri, bir UNION yan tümce giriş değerlerini tanımlayan deyim içinde bağlı durumdasınız.

SELECT PredictAssociation([DT_Association].[v Assoc Seq Line Items],3)
From
  [DT_Association]
NATURAL PREDICTION JOIN
(SELECT (SELECT 'Racing Socks' AS [Model]
  UNION SELECT 'Women''s Mountain Shorts' AS [Model]) AS [v Assoc Seq Line Items]) AS t

Beklenen sonuçlar:

Model

Uzun Sleeve Logo bölgesi

Dağ-400-W

Klasik vest

Başa dön

Tahmin işlevleri listesi

Tüm Microsoft algoritmalar, sık kullanılan bir işlevler kümesi destekler. Ancak, Microsoft Karar ağaçları algoritması, aşağıdaki tabloda listelenen ek işlevleri destekler.

Tüm ortak olan işlevlerin listesi için Microsoft algoritmalar için bkz: Types (DMX) sorgu için işlevler'i eşleme. Belirli işlevlerin sözdizimi için bkz: Veri madenciliği Uzantıları (DMX) işlev başvurusu.

Değişiklik Geçmişi

Güncelleştirilmiş içerik

Sorgu örnekleri gözden geçirin daha kolay hale getirmek için eklenen konu içindeki bağlantılar.

Regresyon düğüm örnek içerik sorgulara uygun bölümü taşındı.