Aracılığıyla paylaş


araştırma modeli Sırası modeller kümeleme için içerik (Analysis Services - veri madenciliği)

Bu konu, Microsoft kümeleme, sıra algoritmasını kullanmak için modelleri belirli araştırma modeli içerik açıklar.Tüm modeli tipleri için geçerlidir, araştırma modeli içeriği ile ilgili genel ve istatistiksel terminolojinin açıklaması için bkz: araştırma modeli Içerik (Analysis Services - veri madenciliği).

Model kümeleme bir sıra yapısını anlama

Tek bir üst düğüm modeli kümeleme BIR sıra vardır (NODE_TYPE = 1), model ve meta veriler temsil eder.Etiketli bir üst düğüm (Tümü), ilgili sıra düğüm olan (NODE_TYPE 13 =) olan eğitim verilerde algılanan tüm geçişler listeler.

Structure of sequence clustering model

Algoritma, kümeler verileri ve müşteri demografisi gibi modeli, vb. oluştururken dahil diğer giriş özniteliklerini bulunmadı geçişleri göre bir dizi de oluşturur.Her küme (NODE_TYPE = 5), kendi sırası düğüm içeriyor (NODE_TYPE 13 =), yalnızca o belirli bir küme oluşturmak için kullanılan geçişleri listeler.Sıra düğümü, bağımsız durumu geçişleri ayrıntılarını görüntülemek için detaya (NODE_TYPE 14 =).

Sıra ve durumu geçişleri, örneklerle birlikte bir açıklama için bkz: Microsoft Dizi Kümeleme algoritmasısı.

Model içerik modeli kümeleme bir sıra için

Bu bölüm kümeleme sırası için belirli uygunluğu olan sütunlarda araştırma modeli içerik hakkında ek bilgi sağlar.

  • model_catalog
    Modelin nerede depolandığını veritabanının adı.

  • MODEL_ADI
    Model adı.

  • ÖZNİTELİK_ADÝ
    Her zaman boş.

  • node_name
    Düğümün adı.Şu anda aynı değeri NODE_UNIQUE_NAME.

  • node_unique_name
    Düğüm benzersiz adı.

  • node_type
    Model kümeleme sırası aşağıdaki düğüm tiplerinden verir:

    Düğüm türü No

    Açıklama

    1 (Modeli)

    Kök düğüm modeli

    5 (Küme)

    Kümedeki geçiş sayısı, öznitelikleri ve değerleri kümedeki tanımlayan istatistikleri listesini içerir.

    13 (Sıra)

    Kümede bulunan geçişleri listesini içerir.

    14 (Geçiş)

    Ilk satırın başlangıç durumunu içerir ve art arda durumları, destek ve olasılık istatistikleri ile birlikte diğer tüm satırları içeren bir tablo olarak bir olay sırasını açıklar.

  • node_guid
    Boş.

  • node_caption
    Bir etiket ya da görüntüleme amacıyla düğümle ilişkili bir resim yazısı.

    Model kullanırken küme başlıkları yeniden adlandırabilirsiniz, model kapatırsanız, ancak yeni ad kalıcıdır değil.

  • children_cardinality
    Tahmini numarasını alt düğümü vardır.

    Model kök   Önem değeri küme sayısını TL'ye eşittir.Daha fazla bilgi için bkz: Önem düzeyi.

    Küme düğümleri   Her küme kümedeki sıralarının listesini içeren bir tek bir alt düğüm olduğundan önem düzeyi, her zaman 1 ' dir.

    Sıra düğümü    Önem düzeyi, kümede bulunan geçişleri gösterir.Örneğin, model kökü için Sıra düğümünün önem, kaç geçiş tüm modelinde bulunan bildirir.

  • parent_unique_name
    Düğümün üst benzersiz adı.

    BOŞ, tüm düğümlerin kökündeki döndürülür düzey.

  • node_description
    Düğüm başlık ile aynıdır.

  • node_rule
    Her zaman boş.

  • marginal_rule
    Her zaman boş.

  • node_probability
    Model kök   Her zaman 0.

    Küme düğümleri    Küme modelinde olasılığını ayarlanmış.Sıra Kümelemede kullanılan kümeleme yöntem birden çok küme kısmi üyeliği verir çünkü ayarlanan değerler 1, toplama değil.

    Sıra düğümü   Her zaman 0.

    Geçiş düğümü   Her zaman 0.

  • marginal_probability
    Model kök   Her zaman 0.

    Küme düğümleri    NODE_PROBABILITY aynı değeri.

    Sıra düğümü   Her zaman 0.

    Geçiş düğümü   Her zaman 0.

  • node_distribution
    Değerler ve diğer bilgileri içeren bir tablo.Daha fazla bilgi için bkz: node_distribution tablo.

  • node_support
    Bu düğüm destekleyen geçiş sayısı.Bu nedenle, varsa sıra 30 örnekleri "Ürün BIR ürün (B) tarafından izlenen" eğitim verileri, toplam destek 30'dur.

    Model kök   Geçişleri modelinde toplam sayısı.

    Küme düğümleri    Ham durumlarda bu kümeye katılma eğitim servis talebi sayısı; yani bir kümenin desteği.

    Sıra düğümü   Her zaman 0.

    Geçiş düğümü    Belirli bir geçiş temsil eden küme zaman yüzdesi.Pozitif bir değer olabilir veya 0 olabilir.Küme düğümü için ham destek alma ve küme tarafından olasılığını çarpımının hesaplanır.

    Bu değer, ne kadar eğitim durumlarda geçiş katkıda olmadığını size söyleyebilir.

  • msolap_model_column
    Uygulanamaz.

  • msolap_node_score
    Uygulanamaz.

  • msolap_node_short_caption
    NODE_DESCRIPTION aynıdır.

Anlama sýra, durumlar ve geçişleri

Model kümeleme BIR sıra nesnelerinin iki tür çok farklı türde bilgiler bir araya getiren benzersiz bir yapısı vardır: ilk küme ve ikinci olduğu duruma geçişler.

Microsoft kümeleme algoritması tarafından oluşturulan küme küme oluşturma sırası tarafından oluşturulan küme gibidir.Her küme için bir profil ve özellikleri vardır.Bununla birlikte, sıra kümeleme, her küme, ayrıca, küme serilerinde listeleyen bir tek bir alt düğüm içeriyor.Her sıra düğümün durumu geçişler, değerler ile ayrıntılı olarak açıklayan birden çok alt düğümlerin içerir.

Hemen hemen her zaman içinde herhangi bir tek bulabilirsiniz çok daha fazla serilerinde model vardır durum, çünkü, serilerini birlikte zincirleme.Böylece, her bir geçiş olmuyor sayısını sayabilirsiniz Microsoft Analysis Services işaretçiler bir durumundan diğer depolar.Ayrıca kaç kez sıra oluştu hakkında bilgi bulmak ve, kümesinin tümü, gözlemlenen durumları karşılaştırıldığında oluşma olasılığını ölçen kullanabilirsiniz.

Aşağıdaki tablo bilgi modelde nasıl depolandığını ve düğümlerin nasıl ilişkilendirildiğini özetler.

Düğüm

Alt düğümü vardır.

node_distribution tablo

Model kök

Birden çok küme düğümleri

Tüm model sıralamalarını düğümüyle

Model, destek ve olasılığı olan tüm ürünleri listeler.

Kümeleme yöntem kısmi üyeliği içinde birden çok küme verir çünkü desteği ve olasılık kesirli değerler olabilir.Diğer bir deyişle, tek bir durum bir kez sayım yerine, her iki durumda olabilecek birden çok kümeye ait olabilir.Bu nedenle, son küme üyeliği belirlenir, değeri olasılığını bu küme tarafından ayarlanır.

Model için sıra düğümü

Birden fazla Geçiş düğümü

Model, destek ve olasılığı olan tüm ürünleri listeler.

Numara sıralarının bilindiğinden, sırasında bu model için düzey, destek ve olasılık basit hesaplamalardır:

  • Destek servis talebi sayısı =

  • Olasılık = ham olasılık modelindeki her sırası.Tüm değerler, 1'için sum.

Tek tek küme düğümleri

Sıralamalarını, yalnızca o küme düğümü

Bir kümedeki tüm ürünleri listelenir, ancak yalnızca küme özelliği olan ürünler için destek ve olasılığı değerlerini sağlar.

Destek, her durumda bu küme için ayarlanan destek değerini temsil eder.Olasılık ayarlanan olasılık değerlerdir.

Tek tek küme düğümlerinde sırası

Yalnızca bu kümedeki sıralarının geçişleri ile birden çok düğüm

Tam olarak aynı bilgileri gibi tek tek küme düğümleri.

Geçişleri

Alt

Ilgili ilk durumuna ilişkin geçişleri listeler.

Destek bölümü her bir geçiş yapması servis taleplerini gösteren bir ayarlanan destek değeridir.Olasılık yüzdesi olarak temsil edilen ayarlanan, olasılıktır.

node_distribution tablo

NODE_DISTRIBUTION tablo geçişleri için olasılık ve Destek ayrıntılı bilgiler sağlar ve belirli bir küme için sequences.

Bir satırı her zaman olası göstermek için geçiş tablosuna eklenir. Missing değerleri. Ne hakkında bilgi için Missing değer anlamına gelir ve hesaplamalarını nasıl etkilediğini görmek Değerleri eksik (Analysis Services - veri madenciliği).

Hesaplamaları için destek ve olasılık hesaplama eğitim servis taleplerine veya tamamlanmış modeli uygulanır bağlı olarak değişir.Varsayılan yöntem, Beklenti Maximization (EM), kümeleme, herhangi bir durum birden çok kümeye ait olabilir varsayar olmasıdır.Model durumlarda desteğini hesaplanırken, işlenmemiş sayıları ve raw olasılıklar kullanmak mümkündür.Ancak, kümedeki belirli bir sıra için değerler toplamını tüm olası sıra ve küme bileşimlerini tarafından ağırlıklı gerekir.

Önem düzeyi

Küme modelinde, önem üst düğüm genellikle, modelde kaç kümeleri olan bildirir.Ancak, model kümeleme bir sıra küme düzeyinde iki düğüm türü vardır: Küme düğümü bir tür içerir ve diğer düğüm türünü bir bütün olarak modeli sıralamalarını listesini içerir.

Bu nedenle, küme modelinde sayısını öğrenmek için , edebilir (tümü) düğümünün NODE_CARDINALITY değerini alır ve bir çıkarmak.Örneğin, model 9 küme oluşturduysanız, önem düzeyini modeli kök 10'dur.9 Küme düğümlerinin her biri kendi sıra düğümü ve model sıralamalarını temsil eden küme 10 etiketli bir ek sırası düğüm modeli içerir olmasıdır.

Yapı, adım adım işlem aşamaları

Örnek bilgileri nasıl depolandığını ve nasıl yorumlayabileceğinden açıklığa kavuşturmak önüne geçilmesine yardımcı olabilir.Örneğin, en uzun gözlenen zincirdeki temel AdventureWorksDW verileri aşağıdaki sorgu kullanarak başka bir deyişle en büyük siparişin bulabilirsiniz:

USE AdventureWorksDW
SELECT DISTINCT OrderNumber, Count(*)
FROM vAssocSeqLineItems
GROUP BY OrderNumber
ORDER BY Count(*) DESC

Bu sonuçlar, en büyük sıraları, her sekiz maddelerle 'SO72656', 'SO58845' ve 'SO70714' sipariş numaralarını içeren bulun.Sipariş Kimliği'ni kullanarak, hangi maddeleri satın alınan görmek için belirli bir sıraya ve hangi sırayla ayrıntıları görüntüleyebilirsiniz.

OrderNumber

LineNumber

Model

SO58845

1

Dağ-500

SO58845

2

LL Dağ Tekeri

SO58845

3

Dağ Tekeri Borusu

SO58845

4

Fender Seti - Dağ

SO58845

5

Dağ Şişe Kafesi

SO58845

6

Su Şişesi

SO58845

7

Spor 100

SO58845

8

Uzun Sleeve Logo bölgesi

Ancak, bazı müşteriler Mountain-500 satınalma farklı ürünlerin satınalma.Sıradağlar 500 modelde sıralarının listesini görüntüleyerek izleyen tüm ürünleri görüntüleyebilirsiniz.Aşağıdaki yordamlar , bu sıraları görüntüleme aracılığıyla sağlanan bir iki görüntüleyiciler kullanarak yürütmek Analysis Services:

Ilgili sıralarının sıra kümeleme görüntüleyiciyi kullanarak görüntülemek için

  1. Nesne Explorer'da [sırası kümeleme] modelini sağ tıklatın ve Gözat'ı seçin.

  2. Sıra kümeleme görüntüleyiciyi tıklatın Durum geçişi tab.

  3. Içinde Küme aşağı açılan listesinde, bu emin olunPopülasyon (tümü) seçilir.

  4. Kaydırıcı çubuğu sol bölmesindeki tüm bağlantıları görüntülemek için en üstüne, taşıyın.

  5. Şemada, bulun. Dağ 500ve diyagramın düğümünü tıklatın.

  6. Vurgulanan satırlar sonraki durumlar (sonra Sıradağlar 500 satın alınan ürünler) üzerine gelin ve sayıları olasılığını gösterir.Bu genel model içerik görüntüleyiciyi sonuçlar karşılaştırın.

Ilgili sıralarının genel model içerik görüntüleyiciyi kullanarak görüntülemek için

  1. Nesne Explorer'da [sırası kümeleme] modelini sağ tıklatın ve Gözat'ı seçin.

  2. Görüntüleyici açılır liste kutusunda seçin Microsoft Genel içerik ağacı Görüntüleyicisi.

  3. Içinde Düğüm resim yazısı bölmesinde adlı bir düğümü tıklatın.Sıra düzey için Küme 16.

  4. Düğüm Ayrıntılar bölmesinde, NODE_DISTRIBUTION satırını bulun ve herhangi bir iç içe geçmiş tablo.

    Eksik değeri her zaman en üst satırı var.Bu satır sırası durumudur 0.

  5. kapalı Ok tuşuna basın veya satır, Mountain-500 görünceye kadar iç içe tablo kapalı taşımak için kaydırma çubuklarını kullanın.

    Bu satır sırası durumudur 20.

    Not

    Satır sayısı için bir özel sıra durumu program aracılığıyla elde edebilirsiniz, ancak yalnızca gözatma, yalnızca iç içe geçmiş tablo, bir Excel çalışma kitabına kopyalamak daha kolay olabilir.

  6. Düğüm resim yazısı bölmesine dönmek ve düğümü genişletin. Sıra düzey için Küme 16zaten genişletildi,.

  7. Için alt düğümler arasında bakın. Sıra durumu 20 geçiş satır.Geçiş düğümü tıklatın.

  8. Iç içe geçmiş tablo NODE_DISTRIBUTION aşağıdaki ürünleri ve değerler içerir.Bu sonuçlar karşılaştırın Durum geçişi sekme sırası kümeleme görüntüleyicinin.

Aşağıdaki tablo, sonuçlar NODE_DISTRIBUTION tablosundan grafik görüntüleyicide görüntülenen yuvarlak olasılık değerleriyle birlikte göstermektedir.

Ürün

Destek (NODE_DISTRIBUTION tablo)

Olasılık (NODE_DISTRIBUTION) tablo)

Olasılık gelen (grafik)

Eksik

48.447887

0.138028169

(gösterilmez)

Harf geçiş yapma

10.876056

0.030985915

0.03

Fender Seti - Dağ

80.087324

0.228169014

0.23

Yarım Finger Gloves

0.9887324

0.002816901

0.00

Hydration Pack

0.9887324

0.002816901

0.00

LL Dağ Tekeri

51.414085

0.146478873

0.15

Uzun Sleeve Logo bölgesi

2.9661972

0.008450704

0.01

Dağ Şişe Kafesi

87.997183

0.250704225

0.25

Dağ Tekeri Borusu

16.808451

0.047887324

0.05

Kısa Sleeve Klasik bölgesi

10.876056

0.030985915

0.03

Spor 100

20.76338

0.05915493

0.06

Su Şişesi

18.785915

0.053521127

0.25

Ürün biz eğitim verilerden başlangıçta seçili durumda bulunan, ancak ' Mountain-500 'arkasından Sıradağlar Tire 'LL', pek çok olası serilerini olduğunu görebilirsiniz.Belirli bir küme için ayrıntılı bilgi için , kapalı listeden sıralarının kümedeki her il veya ürün için gerçek geçişleri için Delme işlemi yinelemeniz gerekir.

Geçiş satıra olarak belirli bir küme içinde listelenen sırasından atlayabilirsiniz.Bu geçiş satırdan hangi ürünün sonraki olduğunu belirlemek ve sıralarının listesinde bu ürünün atlamak.Birinci ve ikinci her durum için bu işlemi yineleyerek durumlarını uzun zincirlerini ile çalışabilirsiniz.

Sıra bilgilerini kullanma

Sıra kümeleme için ortak BIR senaryoda, kullanıcı izlemek için olan bir Web sitesi.Müşteri verileri kayıtları, Adventure Works e-ticaret, Satınalmalar Web sitesi, elde edilen sıra küme modeli, e-ticaret sitesi Gezinti sorunları çözümlemek veya satış yükseltmek için yeniden tasarlamanız kullanıcı davranış, anlaması için kullanılabilir.

Örneğin, kullanıcıların her zaman belirli bir zincir demografisi ne olursa olsun, ürünlerin izleyin çözümlemesi gösterebilir.Ayrıca, kullanıcıların sık siteyi belirli bir ürünle ilgili ek Yardım düğmesini tıklatınca çıkmanız bulabilirsiniz.Bulma koşuluyla, kullanıcılar kalmasını yapar kullanıcılara sağlayabilir hangi ek yollar isteyebilir Web sitesi.

Kullanıcılarınıza sınıflandırma içinde kullanmak için ek bilgi yoksa, sonra yalnızca sıra bilgileri daha iyi genel davranış anlamak için gezinme hakkında veri toplamak için kullanabilirsiniz.Ancak, müşterilerle ilgili bilgileri toplamak ve bu bilgileri, müşteri veritabanınızı eşleşen, kullanıcıya özel olarak tasarlanmış ya da yol geçerli sayfa gezinti temel alarak öneriler sağlamak için tahmin ile sıraları kümeleme güç birleştirebilirsiniz.

Başka bir model kümeleme, bir sıra tarafından derlenen kapsamlı durumu ve geçiş bilgileri olası hangi yolların hiçbir zaman kullanılacağını belirlemek için kullanılır.Örneğin, 1-4 sayfalara geçmeden birçok ziyaretçilerinin vardır, ancak sayfa 5 ziyaretçilerinin hiçbir zaman devam etmek, sayfa 5 Gezinti engelleyen sorunları olup olmadığını araştırmak.Içerik modeli sorgulamak ve bu olası bir yol listesi karşı karşılaştırma olarak bunu yapabilirsiniz.Program aracılığıyla veya çeşitli sitesini çözümleme araçlarını kullanarak, Web sitesindeki tüm gezinti yollarını açıklayan grafikler oluşturulabilir.

Içerik modeli sorgulayarak gözlenen yollar listesini elde etmek ve modeli küme üzerinde bir sıra diğer sorgularının örneklerini görmek için nasıl bulmak için bkz: Model kümeleme bir sıra sorgulama (Analysis Services - veri madenciliği).