Karar ağaçlar modeli sorgulama (- Analysis Services veri madenciliği)
Bir veri karşı bir sorgu oluşturduğunuzda, araştırma modeli, analizinde keşfedilen desenleri hakkında ayrıntılı bilgi sağlayan içerik bir sorgu oluşturabilir veya yeni veri için Öngörüler yapmak modelinde desenleri kullanır tahmin sorgu oluşturabilirsiniz.Örneğin, her servis talebi sayısı hakkındaki istatistikleri için karar ağaçları modeli içerik sorgu sağlayabilir düzey ağaç veya servis talepleri arasında ayırt kuralları.Alternatif olarak, bir tahmin sorgu önerileri, sınıflandırmaları ve benzeri oluşturmak için yeni veri modeli eşleştirir.Bir sorgu kullanarak modeli hakkında meta veriler de alabilirsiniz.
Bu bölümde dayalı modelleri için sorgular oluşturmak açıklar Microsoft karar ağaçlar algoritması.
İçerik sorguları
Veri madenciliği şeması satır kümesi modeli Parametreler alınıyor
Ağaçlar hakkında ayrıntılar modelde dmx kullanarak alma
Alt ağaçlar modelinden alınıyor
Tahmin sorgular
Öngörüler ile olasılıklar döndürme
Karar ağaçları modeli bu ilişkileri tahmin etmek
Karar ağaçları modeli regresyon formül alınıyor
Karar ağaçları modeli hakkında bilgi bulma
Karar ağaçları modeli içeriği üzerinde anlamlı sorguları oluşturmak için içerik modeli yapısını anlamanız gerekir ve hangi düğüm türü ne tür bilgiler depolar.Daha fazla bilgi için bkz: Karar ağacı modeller için içerik modeli mining (Analysis Services - veri madenciliği).
Örnek sorgu 1: Veri madenciliği şeması satır kümesi modeli Parametreler alınıyor
Veri madenciliği şema satır kümesi sorgulayarak, ne zaman oluşturulduğunu, ne zaman modeli son işlendiği, modelin temel araştırma yapısı adını ve öngörülebilir bir öznitelik olarak kullanılan sütun adı gibi modeli hakkında meta veriler bulabilirsiniz.Model oluşturulduğunda kullanılan parametreleri de döndürebilir.
select MINING_PARAMETERS
from $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'TM_Decision Tree'
Örnek sonuçlar:
MINING_PARAMETERS
COMPLEXITY_PENALTY = 0,5, MAXIMUM_INPUT_ATTRIBUTES 255 MAXIMUM_OUTPUT_ATTRIBUTES = 255 MINIMUM_SUPPORT = = 10, SCORE_METHOD = 4, SPLIT_METHOD = 3, FORCE_REGRESSOR =
Başa dön
Örnek sorgu 2: dmx kullanarak modeli içeriği hakkında bilgi döndüren
Karar ağaçları modeli yerleşik olduğunda, oluşturulan ilgili temel bazı bilgileri aşağıdaki sorgu döndürür Temel veri madenciliği öğreticisi.Her ağaç yapısı içinde kendi düğüm depolanır.Bu model tek bir öngörülebilir öznitelik içerdiğinden, tek bir ağaç düğümü vardır.Ancak, ilişkilendirme modelini karar ağaçlar algoritma kullanarak oluşturursanız, olabilir, ağaçları, her ürün için bir yüz.
Belirli bir tahmin edilebilir öznitelik temsil eden bir ağacın üst düzey düğümlerin tüm düðümleri olan tip 2, bu sorgu döndürür.
Not
Sütun CHILDREN_CARDINALITY, içine yerleştirilmesi gerekir karşı aynı adı. ayrılmış mdx anahtar sözcük ayırmak için ayraç içine
SELECT MODEL_NAME, NODE_NAME, NODE_CAPTION,
NODE_SUPPORT, [CHILDREN_CARDINALITY]
FROM TM_DecisionTrees.CONTENT
WHERE NODE_TYPE = 2
Örnek sonuçlar:
MODEL_ADI |
NODE_NAME |
NODE_CAPTION |
NODE_SUPPORT |
CHILDREN_CARDINALITY |
---|---|---|---|---|
TM_DecisionTree |
000000001 |
Tümü |
12939 |
5 |
Ne bu sonuçlar, bildirin?Karar ağaçları modeli, belirli bir düğüm kardinalite, kaç anlık alt söyler bu düğümü vardır.Önem modeli hedef bölünmüş 5 bu düğüm için yani popülasyon potansiyel bisiklet alıcıların 5 alt gruplar halinde.
Çocuklar için öznitelikleri ve değerleri alt düğümlerdeki dağıtımı ile birlikte bu beş alt gruplara ilgili aşağıdaki sorgu döndürür.Destek ve olasılık farkı gibi istatistikleri iç içe geçmiş tablo içinde saklandığından NODE_DISTRIBUTION, bu örnek kullanır FLATTENED anahtar çıktı iç içe geçmiş tablo sütunları.
Not
İç içe geçmiş tablo sütun SUPPORT, içine yerleştirilmesi gerekir aynı adı. ayrılmış anahtar sözcüğü buradan ayırmak için ayraç içine
SELECT FLATTENED NODE_NAME, NODE_CAPTION,
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, [SUPPORT]
FROM NODE_DISTRIBUTION) AS t
FROM TM_DecisionTree.CONTENT
WHERE [PARENT_UNIQUE_NAME] = '000000001'
Örnek sonuçlar:
NODE_NAME |
NODE_CAPTION |
T.ATTRIBUTE_NAME |
T.ATTRIBUTE_VALUE |
DESTEK |
---|---|---|---|---|
00000000100 |
Otomobilleri ait numara = 0 |
Bisiklet alıcı |
Eksik |
0 |
00000000100 |
Otomobilleri ait numara = 0 |
Bisiklet alıcı |
0 |
1067 |
00000000100 |
Otomobilleri ait numara = 0 |
Bisiklet alıcı |
1 |
1875 |
00000000101 |
Otomobilleri ait numara = 3 |
Bisiklet alıcı |
Eksik |
0 |
00000000101 |
Otomobilleri ait numara = 3 |
Bisiklet alıcı |
0 |
678 |
00000000101 |
Otomobilleri ait numara = 3 |
Bisiklet alıcı |
1 |
473 |
Bu sonuçlar, müşterilerin, kim bir bisiklet satın söyleyebilir ([Bike Buyer] = 1), 1067 müşteriler 0 otomobilleri vardı ve 473 müşterileri var. 3 otomobilleri
Başa dön
Örnek sorgu 3: Alt ağaçlar modelinden alınıyor
Bir bisiklet satın müşteriler hakkında daha fazla keşfetmek istediğinizi varsayın.Kullanarak alt için ek ayrıntı görüntüleyebilirsiniz. IsDescendant (dmx) işlev sorguda gösterildiği gibi aşağıdaki örnek.Yaprak düğümlerin alarak bisiklet Satınalmacılar sayısı sorgu döndürür (node_type = 4) üzerinde 42 yaşının müşteriler içeren ağaç.Sorgu satır yuvalanmış sınırlar tablo bu yeri bisiklet alıcı = 1.
SELECT FLATTENED NODE_NAME, NODE_CAPTION,NODE_TYPE,
(
SELECT [SUPPORT] FROM NODE_DISTRIBUTION WHERE ATTRIBUTE_NAME = 'Bike Buyer' AND ATTRIBUTE_VALUE = '1'
) AS t
FROM TM_DecisionTree.CONTENT
WHERE ISDESCENDANT('0000000010001')
AND NODE_TYPE = 4
Örnek sonuçlar:
NODE_NAME |
NODE_CAPTION |
t.support |
---|---|---|
000000001000100 |
Yıllık gelir >= 26000 ve < 42000 |
266 |
00000000100010100 |
Çocuklar toplam = 3 |
75 |
0000000010001010100 |
Alt öğeler için numara Giriş = 1 |
75 |
Başa dön
Karar ağaçları modeli kullanılarak Öngörüler yapmak
Karar ağaçları bir karar ağacı modeli bir tahmin sorgu oluşturduğunuzda, sınıflandırma, regresyon ve hatta Birliği de dahil olmak üzere çeşitli görevler için kullanılan çünkü kullanabileceğiniz birçok seçenek vardır.Anlamak için modeli kendisi için oluşturulmuş amacı anlamak gerekir sonuçlar eğilimi.Üç farklı senaryo aşağıdaki sorgu örnekleri gösterilmiştir:
Döndürme olasılığını tahmin doğru ve sonra sonuçlar tarafından Olasılık Filtresi ile birlikte bir sınıflandırma modeli için bir öngörü;
İlişkileri tahmin etmek bir singleton sorgu oluşturma;
Giriş ve çıkışı arasındaki ilişki doğrusal olduğu bir karar ağacı parçası regresyon formülü alınıyor.
Örnek sorgu 4: Öngörüler ile olasılıklar döndürme
Aşağıdaki örnek sorgu oluşturulan karar ağacı modelini kullanır, Temel veri madenciliği öğreticisi.Gelen yeni bir örnek veri küme sorgu geçen tablo dbo.ProspectiveBuyers , AdventureWorks2008R2 tahmin etmek hangi müşterilerin yeni veri kümendeki satın için dwbisiklet.
Sorgu tahmin işlev kullanır PredictHistogram (dmx), tarafından keşfedilen olasılıklar hakkında yararlı bilgiler içeren iç içe geçmiş tablo işlevmodeli. Son where yan tümce tümce tümce sorgunun sonuçlar yalnızca % 0 ' büyük bir olasılık ile bir bisiklet satın almak büyük olasılıkla olarak öngörülen müşteriler döndürmek için filtre uygular.
SELECT
[TM_DecisionTree].[Bike Buyer],
PredictHistogram([Bike Buyer]) as Results
From
[TM_DecisionTree]
PREDICTION JOIN
OPENQUERY([Adventure Works DW],
'SELECT
[FirstName],
[LastName],
[MaritalStatus],
[Gender],
[YearlyIncome],
[TotalChildren],
[NumberChildrenAtHome],
[HouseOwnerFlag],
[NumberCarsOwned]
FROM
[dbo].[ProspectiveBuyer]
') AS t
ON
[TM_DecisionTree].[First Name] = t.[FirstName] AND
[TM_DecisionTree].[Last Name] = t.[LastName] AND
[TM_DecisionTree].[Marital Status] = t.[MaritalStatus] AND
[TM_DecisionTree].[Gender] = t.[Gender] AND
[TM_DecisionTree].[Yearly Income] = t.[YearlyIncome] AND
[TM_DecisionTree].[Total Children] = t.[TotalChildren] AND
[TM_DecisionTree].[Number Children At Home] = t.[NumberChildrenAtHome] AND
[TM_DecisionTree].[House Owner Flag] = t.[HouseOwnerFlag] AND
[TM_DecisionTree].[Number Cars Owned] = t.[NumberCarsOwned]
WHERE [Bike Buyer] = 1
AND PredictProbability([Bike Buyer]) >'.05'
Varsayılan olarak, Analysis Services sütun etiketi ile iç içe geçmiş tablo döndüren ifade.Bu etiket yumuşatma tarafından döndürülen sütun değiştirebilirsiniz.Böylece, diğer ad ad (Bu durum, sonuçları) iç içe geçmiş tablo değeri olarak her iki sütun başlığı olarak kullanılır.sonuçlar görmek için iç içe geçmiş tablo genişletmeniz gerekir.
Örnek sonuçlar:
Bisiklet alıcı |
Sonuçlar |
---|---|
1 |
Sonuçlar
Bisiklet alıcı$DESTEK$OLASILIK$ADJUSTEDPROBABILITY$SAPMA$STDSAPMA
125400.6348492420456440.01356216828156200
014600.3649841745793770.0066133693255091500
00.0001665833749791770.00016658337497917700
|
Yoksa sizin sağlayıcı olanlar nulls yerine yinelenen sütun değerlerini içeren bir tablo olarak sonuçlar döndüren sorguda flattened anahtar sözcüğünü kullanabilirsiniz burada gösterildiği gibi hiyerarşik satır kümeleri desteklemez.Daha fazla bilgi için bkz: İç içe tablolar (Analysis Services - veri madenciliği) veya Select deyimi (dmx) Anlama.
Başa dön
Örnek sorgu 5: Karar ağaçları modeli bu ilişkileri tahmin etmek
Aşağıdaki örnek sorgu dayandığı Association Araştırma yapısı.Bu örnek ile birlikte izlemek için yeni bir model için ekleyebileceğiniz araştırma yapısı, Microsoft karar ağaçlar algoritması seçin.Oluşturma hakkında daha fazla bilgi için Association araştırma yapısı, bkz: Ders 3: Pazar sepeti senaryo (Ara veri madenciliği Öğreticisi) oluşturma.
Aşağıdaki örnek sorgu da kolayca oluşturabilirsiniz bir singleton sorgu ise Business Intelligence Development Studio alanları seçerek ve sonra da değerleri için bu alanlardan'ı seçerekbir kapalı açılan liste.
SELECT PredictAssociation([DT_Association].[v Assoc Seq Line Items],3)
FROM
[DT_Association]
NATURAL PREDICTION JOIN
(SELECT (SELECT 'Patch kit' AS [Model]) AS [v Assoc Seq Line Items]) AS t
Beklenen sonuçlar:
Model |
---|
Dağ-200 |
Dağ Tekeri Borusu |
Yarış lastiği iç lastik |
sonuçlar düzeltme eki Kit ürünü satın almış olan müşteriler için önermek için üç en iyi ürünlere söyleyin.Öneriler, değerler yazarak, veya kullanarak yaptığınızda de birden fazla ürünü giriş sağlayabilirsiniz Singleton sorgu giriş iletişim kutusu ve ekleme veya değerleri kaldırılıyor.Aşağıdaki örnek sorgu nasıl birden çok değer, bağlı bir tahmin yapmak sağlanan gösterir.Giriş değerleri tanımlayan deyim içinde bir birleşim yan tümce tümce tümce tarafından değerlere bağlı.
SELECT PredictAssociation([DT_Association].[v Assoc Seq Line Items],3)
From
[DT_Association]
NATURAL PREDICTION JOIN
(SELECT (SELECT 'Racing Socks' AS [Model]
UNION SELECT 'Women''s Mountain Shorts' AS [Model]) AS [v Assoc Seq Line Items]) AS t
Beklenen sonuçlar:
Model |
---|
Uzun kabında Logo Jersey |
Dağ-400-W |
Klasik Vest |
Başa dön
Örnek sorgu 6: Karar ağaçları modeli regresyon formül alınıyor
Sürekli öznitelik üzerinde bir gerileme içeren bir karar ağacı model oluşturmak, Öngörüler yapmak için regresyon formülü kullanabilirsiniz ya da yapabilirsiniz ayıklamak regresyon formül hakkında bilgi.Regresyon modelleri sorgular hakkında daha fazla bilgi için bkz: Doğrusal regresyon modeli sorgulama (- Analysis Services veri madenciliği).
Karar ağaçları modeli regresyon düğümleri ve kesikli öznitelikleri veya aralıklara bölme düğümleri bir karışımını içeriyorsa, yalnızca regresyon düğümü döndüren bir sorgu oluşturabilirsiniz.NODE_DISTRIBUTION tablo regresyon formül ayrıntılarını içerir.Bu örnekte, sütunları düzleştirilir ve rahat NODE_DISTRIBUTION tablo bilinir.Ancak, bu modelde, hiçbir regressors arasında ilişki bulundu Income ile sürekli diğer öznitelikleri.Bu gibi durumlarda Analysis Services ortalama değerini öznitelik ve toplam sapma modelinde bu öznitelik.
SELECT FLATTENED NODE_DISTRIBUTION AS t
FROM DT_Predict. CONTENT
WHERE NODE_TYPE = 25
Örnek sonuçlar:
t.ATTRIBUTE_NAME |
t.ATTRIBUTE_VALUE |
t.support |
t.PROBABILITY |
t.VARIANCE |
t.VALUETYPE |
---|---|---|---|---|---|
Yıllık gelir |
Eksik |
0 |
0.000457142857142857 |
0 |
1 |
Yıllık gelir |
57220.8876687257 |
17484 |
0.999542857142857 |
1041275619.52776 |
3 |
|
57220.8876687257 |
0 |
0 |
1041216662.54387 |
11 |
Değer türleri ve regresyon modellerinde kullanılan istatistikleri hakkında daha fazla bilgi için bkz: Doğrusal regresyon modeller için içerik modeli mining (Analysis Services - veri madenciliği).
Başa dön
Tahmin işlevlerin listesi
Tüm Microsoft algoritmaları desteği ortak küme işlevleri.Ancak, Microsoft karar ağaçlar algoritması aşağıdaki tablo. listelenen ek işlevleri destekler
Tüm ortak işlevlerin listesi için Microsoft algoritmalar, bkz: Eşleştirme türleri (dmx) sorgu işlevler.Belirli işlevleri sözdizimini görmek Veri madenciliği Extensions (dmx) işlev başvurusu.