Makale
07/26/2011

Modeli kümeleme bir sıra sorgulama (- Analysis Services veri madenciliği)

Bir veri karşı bir sorgu oluşturduğunuzda, araştırma modeli, model içinde depolanan bilgiler hakkında ayrıntılı bilgi sağlayan ya da bir içerik sorgu oluşturabilirsiniz veya sağladığınız yeni verileri esas Öngörüler yapmak modelinde desenleri kullanır tahmin sorgu oluşturabilirsiniz.Modeli kümeleme bir sıra için içerik sorguları genellikle bulundu kümeleri veya bu kümeleri içinde geçişler hakkında ek ayrıntılar sağlar.Bir sorgu kullanarak modeli hakkında meta veriler de alabilirsiniz.

Genellikle modeli kümeleme bir sıra tahmin sorgulamaları serileri ve geçişleri modelinde ya da sıra birlikte gelen ve sıra dışı öznitelikleri olan sıra dışı öznitelikleri ya da temel öneriler yapın.

Bu bölümde dayalı modelleri için sorgular oluşturmak açıklar Microsoft Dizi Kümeleme algoritması.Sorgu oluşturma hakkında genel bilgi için bkz: Veri madenciliği modelleri sorgulama (- Analysis Services veri madenciliği).

İçerik sorguları

Veri Mining şeması satır kümesi modeli Parametreler dönmek için kullanma

Bir durumu için sequences listesi alma

Sistem saklı yordamları kullanma

Tahmin sorgular

Sonraki durumu veya Devletler tahmin

Model kümeleme sırası hakkında bilgi bulma

Bir araştırma modeli içeriği üzerinde anlamlı sorguları oluşturmak için içerik modeli yapısını anlamak ve hangi düğüm türü ne tür bilgiler depolar.Daha fazla bilgi için bkz: Sıra modeller kümeleme için içerik modeli mining (Analysis Services - veri madenciliği).

Örnek sorgu 1: Veri madenciliği şeması satır kümesi modeli Parametreler dönmek için kullanma

Veri madenciliği sorgulamak şema satır kümesi, çeşitli temel meta veriler de dahil olmak üzere bu modeli hakkında bilgi bulabilirsiniz, tarih ve model oluşturulduğu saat ve son işlenen, modelin temel araştırma yapısı adıve öngörülebilir bir öznitelik olarak kullanılan sütun.

Aşağıdaki sorgu oluşturmak ve model eğitmek için kullanılan parametreler verir [Sequence Clustering].Ders 5'te bu modeli oluşturmak Temel veri madenciliği öğreticisi.

SELECT MINING_PARAMETERS 
from $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'Sequence Clustering'

Örnek sonuçlar:

MINING_PARAMETERS
CLUSTER_COUNT = 15, MINIMUM_SUPPORT = 10, MAXIMUM_STATES = 100, MAXIMUM_SEQUENCE_STATES = 64

Bu model cluster_count için varsayılan değer 10 kullanarak oluşturulan unutmayın.cluster_count için bir sıfır olmayan sayı kümeleri belirttiğinizde, algoritma bu sayı kümeleri bulmak için yaklaşık sayısı için bir ipucu olarak davranır.Ancak, analiz sürecine algoritma daha fazla veya daha az kümeleri bulabilirsiniz.15 En iyi kümeleri algoritması bu durumda bulunan uyma eğitim veri.Bu nedenle, model oluştururken, geçirilen değer algoritması tarafından saptanan kümelerinin sayısı tamamlanmış modeli için parametre değerleri listesini bildirir.

Bu davranış kümeleri en iyi sayısını belirlemek için algoritması izin vererek karşı nasıl ayırt edilir?Bir deney bu aynı verileri kullanan başka bir kümeleme modeli oluşturabilirsiniz, ancak kümeleme cluster_count 0.Bunu yaptığınızda, algoritma 32 kümeleri algılar.Bu nedenle, cluster_count için varsayılan değer 10 olarak kullanarak, elde edilen sonuçlar sayısını sınırlamak.

Küme sayısını azaltarak göz atmak ve veri gruplandırmaları anlamak çoğu kişi çünkü kolaylaştırır 10 değerinin varsayılan olarak kullanılır.Ancak, her model ve veri küme farklıdır.Kümeleri en doğru model hangi parametre değeri sağlar görmek için farklı sayıda denemek isteyebilirsiniz.

Başa dön

Örnek sorgu 2: Bir durumu için Sequences listesi alma

Tüm ilgili ikinci durumlar listesini ilk durumu olarak eğitim veri bulunan sıralar konusundaki araştırma modeli içerik depoları.İlk durumuna sıra için etiket olarak kullanılır ve ilgili ikinci durumları geçişleri denir.

Örneğin, aşağıdaki sorgu sıralar kümeler halinde gruplandırılmadan önce modelinde, ilk durum tam listesini döndürür.Sequences listesi döndürerek, bu listeyi alabilirsiniz (node_type = 13) olarak üst modeli kök düğümü vardır (PARENT_UNIQUE_NAME = 0).flattened anahtar sözcük sonuçlar okunması kolay hale getirir.

Not

PARENT_UNIQUE_NAME, destek ve olasılık sütun adını, bunları aynı adı ayrılmış anahtar sözcükleri ayırmak için ayraç içine alınmalıdır.

SELECT FLATTENED NODE_UNIQUE_NAME,
(SELECT ATTRIBUTE_VALUE AS [Product 1],
[Support] AS [Sequence Support], 
[Probability] AS [Sequence Probability]
FROM NODE_DISTRIBUTION) AS t
FROM [Sequence Clustering].CONTENT
WHERE NODE_TYPE = 13
AND [PARENT_UNIQUE_NAME] = 0

Kısmi sonuçlar:

NODE_UNIQUE_NAME	Ürün 1	Sıra destek	Sıra olasılık
1081327	Eksik	0	#######
1081327	Çok amaçlı bisiklet Standı	17	0.00111
1081327	Bisiklet Yıkama	64	0.00418
1081327	(satır 4-36 atlanmış)
1081327	Bayan Dağ Şortu	506	0.03307

Model sıralarında listesi her zaman alfabetik olarak artan düzende sıralanır.Sıra sipariş sayısı bakarak ilgili geçişler bulabilirsiniz kısımlarının sırası önemlidir.The Missing value is always transition 0.

Örneğin, önceki sonuçlar, "Kadınlar'ın dağ kısayoluyla" Ürün sıra 37 modeli sayısıdır."Sonra Kadınlar'ın dağ kısayoluyla." şimdiye kadar satın alınan ürünlerin tümünü görmek için bu bilgiyi kullanabilirsiniz

Bunu yapmak için öncelikle, modeli için tüm serilerini içeren düğüm kimliği almak için önceki sorguyu NODE_UNIQUE_NAME için döndürülen değeri başvuru.Üst düğüm modeli için al sıraları listesini içerecek şekilde olmuyor bu düğüm dahil geçişleri kimliği olarak sorguya bu değeri geçirir.Ancak, geçişler belirli bir küme için listesini görmek isterseniz, size düğüm kimliği içinde geçmesi ve yalnızca bu kümeyle ilişkili serileri bakın.

SELECT NODE_UNIQUE_NAME
FROM [Sequence Clustering].CONTENT
WHERE NODE_DESCRIPTION = 'Transition row for sequence state 37'
AND [PARENT_UNIQUE_NAME] = '1081327'

Örnek sonuçlar:

NODE_UNIQUE_NAME
1081365

Bu kimliği tarafından temsil edilen düğüm "Kadınlar'ın dağ kısayoluyla" izleyin sıraları listesini içerir. Ürün Destek ve olasılık değerleri ile birlikte.

SELECT FLATTENED
(SELECT ATTRIBUTE_VALUE AS Product2,
[Support] AS [P2 Support],
[Probability] AS [P2 Probability]
FROM NODE_DISTRIBUTION) AS t
FROM [Sequence Clustering].CONTENT
WHERE NODE_UNIQUE_NAME = '1081365'

Örnek sonuçlar:

t.Product2	t.P2 destek	t.P2 olasılık
Eksik	230.7419	0.456012
Klasik Vest	8.16129	0.016129
CAP geçiş yapma	60.83871	0.120235
Yarı Finger Gloves	30.41935	0.060117
Uzun kabında Logo Jersey	86.80645	0.171554
SOCKS racing	28.93548	0.057185
Kısa kabında Klasik Jersey	60.09677	0.118768

Destek için Kadınlar 's Sıradağlar kısayoluyla ilişkili çeşitli serileri için 506 modelinde olduğuna dikkat edin.Geçişler için destek değerleri de en çok 506 ekleyin.Ancak, sayıları her geçiş içeren servis taleplerinin sayısı sadece göstermek için destek düşünüyorsanız biraz tuhaf görünüyor tam sayılar değildir.Ancak, kümeleri oluşturma yöntem kısmi üyelik hesapladığı için bir küme içindeki herhangi bir geçiş olasılığını tarafından belirli bir kümeye ait olan kendi ihtimali ağırlıklı gerekir.

Örneğin, dört kümeler varsa, belirli bir sırada küme 1, 2 kümeye ait, % 30 şans, 3 numaralı kümeye ait, % 20 şans ve 4 numaralı kümeye ait, % 10 şans ait, % 40 şans olabilir.Geçişi çoğunlukla ait büyük olasılıkla küme algoritması belirler sonra küme içindeki bir olasılıklar kümesi önceki olasılığa göre Ağırlık verir.

Başa Dön

Örnek sorgu 3: Saklı yordamları kullanarak sistem

Model içinde saklanan bilgileri karmaşıktır ve gereksinim duyduğunuz bilgileri elde etmek için birden fazla sorguları oluşturmak gereksinim duyabileceğiniz bu sorgu örnekleri görebilirsiniz.Ancak, Microsoft sırası kümeleme görüntüleyiciyi modeli kümeleme bir sıra içinde yer alan bilgileri grafik olarak görüntülemek için güçlü araçlar küme sağlar ve sorgulamak ve ulaşmak için Görüntüleyicisi'ni kullanabilirsiniz kapalı modeli içine.

Çoğu durumda, Microsoft sıra küme Görüntüleyici'de sunulan bilgileri Analysis Services kullanılarak oluşturulan sistem saklı yordamları modeli sorgulamak için.Modeli içeriği aynı bilgileri, ancak Analiz Hizmetleri almak için veri Mining Extensions (dmx) sorgular yazabilirsiniz sistem saklı yordamları tanımaya zaman veya modelleri sınamak için kullanışlı kısayol sağlar.

Not

Analysis Services sunucusu ile etkileşim için sistem iç sunucu ve istemciler tarafından Microsoft işlemek için kullanılan saklı yordamlar sağlar.Bu nedenle, Microsoft herhangi bir değiştirme hakkını saklı saat.Kolaylık olması için burada açıklanan rağmen biz bir üretim ortamında kullanılmaları destekler.Kararlılık ve üretim ortamında uyumluluğu sağlamak için her zaman kendi sorguları dmx kullanarak yazmanız gerekir.

Bu bölümde sistem saklı yordamları sorgular modeli kümeleme bir sıra oluşturmak için nasıl kullanılacağı bazı örnekler verilmiştir:

Küme profilleri ve örnek durumlar

Küme profilleri sekmesi, kümelerin listesini gösterir modeli, her küme ve kümeye dahil durumlarını gösteren bir çubuk grafik boyutu.İki vardır sistem saklı yordamları benzer bilgileri almak için sorguları kullanabilirsiniz:

GetClusterProfile NODE_DISTRIBUTION'de bulunan tüm bilgiler küme karakteristiğini verir tablo küme için.
GetNodeGraph düğümler ve ilk sıra kümeleme Görünüm sekmesinde gördüklerinizi için karşılık gelen kümeleri, bir matematik grafik gösterimini oluşturmak için kullanılan kenarları döndürür.Küme düğümleri olan ve kenarları ağırlıkları veya gücü temsil eder.

Aşağıdaki örnek, nasıl kullanılacağını göstermektedir sistem saklı yordamı, GetClusterProfiles, tüm kümeleri ile modelinde dönmek içinilgili kendi profillerini. Bu saklı yordam, bir dizi tam profilleri küme modelinde dönmek dmx deyimi yürütür.Ancak, bu saklı yordam kullanılacak modelinin adresini bilmeniz gerekir.

CALL System.Microsoft.AnalysisServices.System.DataMining.Clustering.GetClusterProfiles('Sequence Clustering', 2147483647, 0)

Aşağıdaki örnek kullanarak belirli bir kümeyi, küme 12 için bir profili almak üzere verilmektedir sistem saklı yordamı GetNodeGraphve, genellikle aynı küme adı. küme kimliği belirtme

CALL System.Microsoft.AnalysisServices.System.DataMining.Clustering.GetNodeGraph('Sequence Clustering','12',0)

Küme kimliği, aşağıdaki sorgu gösterildiği gibi atlarsanız, GetNodeGraph tüm küme profilleri sıralı, düzleştirilmiş bir listesini verir:

CALL System.Microsoft.AnalysisServices.System.DataMining.Clustering.GetNodeGraph('Sequence Clustering','',0)

The Cluster Profile tab also displays a histogram of model sample cases.Bu örnek durumlar ıskalası modeli durumlarda temsil eder.Bu gibi durumlarda modelde eğitim verileri aynı şekilde depolanır; Örnek durumlar için model almak için özel bir sözdizimi kullanmanız gerekir.

SELECT * FROM [Sequence Clustering].SAMPLE_CASES WHERE IsInNode('12')

Daha fazla bilgi için bkz: select from <modeli>.SAMPLE_CASES (DMX).

Küme karakteristiğini ve küme Ayrımcılığı

The Cluster Characteristics tab summarizes the main attributes of each cluster, ranked by probability.Kaç servis taleplerini bir kümeye ait ve dağıtım taleplerinin kümede nasıl nedir öğrenebilirsiniz: Her bir özelliğini belirli bir desteğe sahiptir.Belirli bir küme özelliklerini görmek için küme Kimliğini bilmeniz gerekir.

Aşağıdaki örnekler kullanır sistem saklı yordamı, GetClusterCharacteristics, 0.0005 belirtilen eşik değeri üzerinden bir olasılık puan olan tüm özelliklerini küme 12 dönmek için.

CALL System.Microsoft.AnalysisServices.System.DataMining.Clustering.GetClusterCharacteristics('Sequence Clustering','12',0.0005)

Tüm küme özelliklerine dönmek için küme kimliği boş bırakabilirsiniz.

CALL System.Microsoft.AnalysisServices.System.DataMining.Clustering.GetClusterCharacteristics('Sequence Clustering','',0.0005)

Aşağıdaki örnek çağrıları sistem saklı yordamı GetClusterDiscrimination 1 küme ve küme 12 özelliklerini karşılaştırmak için.

CALL System.Microsoft.AnalysisServices.System.DataMining.Clustering.GetClusterDiscrimination('Sequence Clustering','1','12',0.0005,true)

İki küme karşılaştırmak veya onun tamamlayıcı rengi olan bir küme karşılaştırmak için dmx, kendi sorgu yazmak istiyorsanız, ilk önce bir özellikler kümesi almak ve gerekir sonra ilgilendiğiniz belirli küme özelliklerini alırve iki adet karşılaştırın.Bu senaryo daha karmaşıktır ve genellikle bazı istemci işlem gerektirir.

Durumları ve geçişler

The State Transitions tab of the Microsoft Sequence Clustering performs complicated queries on the back end to retrieve and compare the statistics for different clusters.Bu sonuçlar üretmek için daha karmaşık bir sorgu işleme bazı istemci gerektirir.

Ancak, bölümün Örnek 2'de açıklanan dmx sorguları kullanabilirsiniz İçerik sorguları, olasılıklar ve durumları serileri için veya tek tek geçişler için almak için.

Başa Dön

Öngörüler yapmak için Model kullanma

Tahmin sorgulamaları modeli kümeleme bir sıra pek çok başka kümeleme modelleri ile kullanılan tahmin işlevleri kullanabilirsiniz.Buna ek olarak, özel tahmin işlev kullanabilirsiniz PredictSequence (dmx), öneriler yapmak veya tahmin sonraki durumları.

Örnek sorgu 4: Sonraki durum veya durumlar tahmin

Kullanabileceğiniz PredictSequence (dmx) işlev sonraki en olası durum, verilen bir değer tahmin etmek.Ayrıca, birden fazla sonraki durum tahmin edebilir: Örneğin, bir müşteri satın almak, bir öneriler listesi sunmak için büyük olasılıkla en üç ürün listesini döndürebilir.

Aşağıdaki örnek üst beşe, kendi olasılık ile birlikte veren bir singleton tahmin sorgu sorgudur.Model bir iç içe tablo içerdiğinden, iç içe geçmiş tablo kullanmak [v Assoc Seq Line Items], sütun başvurusu Öngörüler. yaparken olarakAyrıca, giriş olarak değerlerini sağlamak, gerekir birleştirmek hem durum tablo ve iç içe select deyimleri tarafından gösterildiği gibi iç içe geçmiş tablo sütunları.

SELECT FLATTENED PredictSequence([v Assoc Seq Line Items], 7)
FROM [Sequence Clustering]
NATURAL PREDICTION JOIN
(SELECT  (SELECT 1 as [Line Number],
   'All-Purpose Bike Stand' as [Model]) AS [v Assoc Seq Line Items]) 
AS t

Örnek sonuçlar:

Deyim.$ sırası	Expression.Line numarası	Expression.model
1		CAP geçiş yapma
2		CAP geçiş yapma
3		Spor-100
4		Uzun kabında logo Jersey
5		Yarı Finger Gloves
6		Çok amaçlı bisiklet Standı
7		Çok amaçlı bisiklet Standı

Üç sütun vardır almak, sorgu her zaman durum için bir sütun döndürür çünkü yalnızca bir sütun bekleyebilirsiniz olsa tablo.sonuçlar burada düzleştirilir; Aksi durumda, sorgu iki iç içe geçmiş tablo sütunları içeren tek bir sütun döner.

Varsayılan olarak tarafından döndürülen bir sütunun sütun $sırası olan PredictSequence öngörü sipariş etmek için işlev sonuçlar.Sütun [Line Number], gerekli modelinde tuşları sırasıyla eşleşmesi için ancak anahtarları çıktı. değil

Duydukça, çok amaçlı bisiklet Standı sonra üst öngörülen serileri Cap geçiş yapma ve geçiş yapma Cap ' dir.Bu bir hata değil.Nasıl veri müşteriye sunulur ve nasıl bu eğitim modeli, gruplandırılmış türüne bağlı olarak, bu tür içermeyen çok mümkündür.Örneğin, bir müşteri bir dönüşüm cap (kırmızı) satın ve daha sonra başka bir geçiş yapma (mavi) cap veya miktar belirtmek için mümkün olsaydı, ikisi bir satırda satın.

6 Ve 7 satırlardaki değerleri yer tutuculardır.Sonlandırma yerine olası geçişleri zincirini sonuna ulaştığınızda tahmin sonuçlar, sonuçlar bir giriş olarak değer geçildi.Öngörüler için 20, 6-20 satırlar için değerleri sayısını artırmış, tüm aynı, çok amaçlı bisiklet Standı olacaktır.

Başa Dön

Fonksiyon listesi

Tüm Microsoft algoritmaları desteği ortak küme işlevleri.Ancak, Microsoft sırası kümeleme algoritmasını destekler üzerinde ek işlevleri listelenen aşağıdaki tablo.

Küme (dmx)	PredictHistogram (dmx)
ClusterDistance (dmx)	PredictNodeId (dmx)
ClusterProbability (dmx)	PredictProbability (dmx)
IsInNode (dmx)	PredictSequence (dmx)
PredictAdjustedProbability (dmx)	PredictStdev (dmx)
PredictAssociation (dmx)	PredictSupport (dmx)
PredictCaseLikelihood (dmx)	PredictVariance (dmx)