Sıra modeller kümeleme için içerik modeli mining (Analysis Services - veri madenciliği)

Bu konuda kullanan modelleri belirli araştırma modeli içeriği açıklar Microsoft Dizi Kümeleme algoritması.İlgili genel ve istatistiksel terimler açıklaması için araştırma modeli tüm model türleri için geçerlidir içeriği görmek İçerik modeli mining (Analysis Services - veri madenciliği).

Modeli kümeleme bir sıra yapısını anlama

Bir tek üst düğümün modeli kümeleme bir sıra vardır (node_type = 1) modeli ve meta veriler temsil eder.Etiketli üst düğüm (tümü), ilgili sıra düğümü vardır (node_type = 13), eğitim verileri algılanan tüm geçişleri listeler.

Sıra kümeleme modeli yapısı

Algoritma de kümeler verileri ve müşteri demografisi gibi modeli vb. oluştururken dahil diğer giriş öznitelikler bulundu geçişleri dayanarak, bir dizi oluşturur.Her küme (node_type = 5) kendi sıra düğümü içerir (node_type = 13) yalnızca o belirli bir küme oluşturmak için kullanılan geçişler listeler.Sıra düğümden inebilir kapalı bağımsız durum geçişlerini ayrıntılarını görüntülemek için (node_type = 14).

Sırası ve örneklerle, durumu geçişleri hakkında bir açıklama için bkz: Microsoft sırası kümeleme algoritması.

Modeli kümeleme bir sıra için içerik modeli

Bu bölüm kümeleme sırası için belirli yakınlık derecesine sahip sütunlar araştırma modeli içerik hakkında ek bilgi sağlar.

  • MODEL_CATALOG
    Model depolandığı veritabanının adı.

  • MODEL_ADI
    Modelinin adı.

  • ÖZNİTELİK_ADÝ
    Her zaman boş.

  • NODE_NAME
    Düğümün adı.Şu anda aynı değere NODE_UNIQUE_NAME.

  • NODE_UNIQUE_NAME
    Düğümü benzersiz adı.

  • NODE_TYPE
    Modeli kümeleme bir sıra aşağıdaki düğüm türleri çıktısını verir:

    Düğüm türü No

    Açıklama

    1 (Model)

    Kök düğüm modeli için

    5 (Küme)

    Kümedeki geçişleri sayısı, nitelikleri ve değerleri kümedeki açıklayan istatistikleri listesini içerir.

    13 (Sıra)

    Kümeye dahil geçişleri listesini içerir.

    14 (Geçiş)

    Başlangıç durumu ilk satırı içerir ve art arda durumları, destek ve olasılık istatistikleri ile birlikte diğer tüm satırları içeren bir tablo olarak olayların sırasını açıklar.

  • NODE_GUID
    Boş.

  • NODE_CAPTION
    Bir etiket ya da görüntüleme amaçları için düğüm ile ilişkilendirilmiş bir başlık.

    Modeli kullanırken, küme resim yazılarını yeniden adlandırabilirsiniz; model kapatırsanız, ancak, yeni adı kalıcı olmaz.

  • CHILDREN_CARDINALITY
    Düğüm olan çocuklar sayısı tahmini.

    Modeli kökönem değer kümeleri için artı bir tane sayısı eşittir.Daha fazla bilgi için bkz: önem.

    Küme düğümleriönem ise her zaman 1, her küme sıraları kümedeki listesini içeren bir tek alt düğümün sahip olduğu.

    Sıra düğümlerönem bu kümeye dahil geçişleri sayısını gösterir.Örneğin, sıra düğüm modeli kök için kardinalite, kaç geçişleri tüm modelinde bulunan söyler.

  • PARENT_UNIQUE_NAME
    Düğümün üst benzersiz adı.

    Kök tüm düğümler için null döner düzey.

  • NODE_DESCRIPTION
    Düğüm resim yazısı ile aynıdır.

  • NODE_RULE
    Her zaman boş.

  • MARGINAL_RULE
    Her zaman boş.

  • NODE_PROBABILITY
    Modeli kökher zaman 0.

    Küme düğümleriküme modelinde ayarlanan olasılığı.Kümeleme sırası içinde kullanılan kümeleme yöntem birden çok kümeye kısmi üyelik verdiği için ayarlanan değerler 1, toplamak.

    Sıra düğümlerher zaman 0.

    Geçiş düğümüher zaman 0.

  • MARGINAL_PROBABILITY
    Modeli kökher zaman 0.

    Küme düğümleriNODE_PROBABILITY değeri ile aynı.

    Sıra düğümlerher zaman 0.

    Geçiş düğümüher zaman 0.

  • NODE_DISTRIBUTION
    Olasılıklar ve diğer bilgileri içeren bir tablo.Daha fazla bilgi için bkz: NODE_DISTRIBUTION tablo.

  • NODE_SUPPORT
    Bu düğüm destek geçişleri sayısı.30 Örnekleri ise "Ürün a b ürünü ve ardından" Bu nedenle, sıra Eğitim verileri, toplam 30 desteğidir.

    Modeli kökgeçişleri modelinde toplam sayısı.

    Küme düğümleriham durumlarda bu kümeye katkıda bulunan eğitim durumlarda sayısı yani küme desteği.

    Sıra düğümlerher zaman 0.

    Geçiş düğümütaleplerinin, belirli bir geçiş gösteren küme içindeki yüzdesi.Pozitif bir değer olabilir veya 0 olabilir.Küme düğümü için raw desteği alma ve küme olasılığını tarafından çarpmadan tarafından hesaplanır.

    Bu değeri, geçiş kaç eğitim durumlarda katkıda söyleyebilirsiniz.

  • MSOLAP_MODEL_COLUMN
    Uygulanamaz.

  • MSOLAP_NODE_SCORE
    Uygulanamaz.

  • MSOLAP_NODE_SHORT_CAPTION
    NODE_DESCRIPTION ile aynı.

Anlama Sequences, durumları ve geçişler

Modeli kümeleme bir sıra, çok farklı türde bilgiler iki tür nesneleri bir araya getiren benzersiz bir yapıya sahiptir: ilk kümeleri ve ikinci durumdaki geçişleri.

Microsoft Kümeleme algoritması tarafından oluşturulan kümelerle kümeleme sırası tarafından oluşturulan kümelerle gibidir.Her küme profil ve özelliklere sahiptir.Ancak, sıra kümeleme her küme ayrıca o küme serilerini listeler bir tek alt düğümü içerir.Her sıra düğümün olasılık değerleriyle birlikte ayrıntılı durum geçişlerini açıklayan birden çok alt düğümler içerir.

Hemen hemen her zaman herhangi bir tek bulabilirsiniz çok daha fazla sıralarında modeli olan durum, sıraları birbirine zincirleme lisanslı olduğundan.Microsoft Analysis Services işaretçiler bir durumundan diğer saklayarak her geçiş olacağını sayısını sayabilirsiniz.Ayrıca, sıra hakkında bilgileri kaç kez bulmak ve karşılaştırıldığında tüm oluşma, olasılık ölçmek küme gözlenen Devletleri.

Aşağıdaki tablo bilgiler modelinde nasıl depolanır ve düğümleri nasıl ilişkili özetler.

Düğüm

Alt düğümü vardır.

NODE_DISTRIBUTION tablo

Modeli kök

Birden çok küme düğümleri

Tüm model serileri ile düğüm

Olasılık ve Destek ile modelinde tüm ürünleri listeler.

Kümeleme yöntem birden çok kümeye kısmi üyelik verdiği için destek ve olasılık kesirli değerler olabilir.Diğer bir deyişle, tek bir sayım yerine durum bir kez, her durum birden çok kümeye ait olabilir.Bu nedenle, son Küme üyeliği saptandığında, değer olasılığı, bu küme tarafından ayarlanır.

Model için sıra düğümü

Birden fazla Geçiş düğümü

Olasılık ve Destek ile modelinde tüm ürünleri listeler.

Modeli, bunun için sıraların sayısı bilindiği için düzey, destek ve olasılık hesaplamalarını basit:

  • Destek taleplerinin sayısı =

  • Olasılık = her serisinin modelinde raw olasılık.Tüm olasılıklar 1 toplamak.

Tek tek küme düğümleri

Yalnızca o küme serileri ile düğüm

Bir kümedeki tüm ürünleri listelenir, ancak Küme özelliği olan ürünler için destek ve olasılık değerleri sağlar.

Destek her biri için ayarlanan destek değeri temsil durum bu kümede.Olasılık, ayarlanan olasılık değerleridir.

Tek tek kümeleri için sıra düğümler

Yalnızca o küme serilerini geçişlerini sahip birden çok düğüm

Tam olarak aynı bilgileri tek tek küme düğümleri.

Geçişler

Hiçbir çocuk

Geçişler ilgili ilk durumuna ilişkin listeler.

Destek bölümü her geçiş olabilmesi servis taleplerini gösteren bir düzeltilmiş destek değerdir.Yüzde olarak temsil edilen ayarlanan olasılık olasılıktır.

NODE_DISTRIBUTION tablo

NODE_DISTRIBUTION tablo ve serileri için belirli bir küme geçişleri ayrıntılı olasılık ve destek bilgileri sağlar.

Bir satır her zaman geçiş eklenir tablo olası göstermek için Missing değerler.Ne hakkında bilgi için Missing değer anlamına gelir, ve hesaplamaları nasıl etkilediğini görmek Değerleri eksik (Analysis Services - veri madenciliği).

Destek ve olasılık hesaplamaları hesaplama eğitim durumlarda veya bitmiş modeli geçerlidir türüne bağlı olarak farklılık gösterir.Bunun nedeni kümeleme yöntem, beklentisiyle Maximization (em), varsayılan herhangi bir durum için birden çok küme ait olduğunu varsayar.Modeli durumlarda desteği hesaplanırken, ham sayar ve ham bir olasılıklar kullanmak mümkündür.Ancak, bir küme içindeki belirli bir sırada için olasılıklar tarafından tüm olası sırası ve küme birleşimleri toplamı ağırlıklı gerekir.

Önem düzeyi

kümeleme modelinde, üst düğüm kardinalite genellikle, kaç kümeleme modelinde olduğunuzu gösterir.Ancak, iki tür düğümleri konumundaki küme modeli kümeleme bir sıra vardır düzey: bir tür düğüm kümeleri içerir ve diğer tür düğüm modeli bir bütün olarak sıralamalarını listesini içerir.

Bu nedenle, küme modelinde sayısını öğrenmek için (tümü) düğümü için NODE_CARDINALITY değerini alabilir ve çıkarmak biri.Örneğin, model 9 küme oluşturduysanız, modeli kök kardinalite 10'dur.Bunun nedeni 9 küme düğümleri, her biri kendi sıra düğümü plus modeli için sıraları temsil eden 10, küme olarak etiketlenmiş bir ek sıra düğüm modeli içerir.

İzlenecek yol yapısı

Örnek bilgileri nasıl depolandığını ve nasıl yorumlayabilir açıklığa yardımcı olabilir.Örneğin, aşağıdaki sorguyu kullanarak en uzun gözlenen zincirindeki temel AdventureWorksDW2008R2 verileri, yani en büyük siparişi bulabilirsiniz:

USE AdventureWorksDW2008R2
SELECT DISTINCT OrderNumber, Count(*)
FROM vAssocSeqLineItems
GROUP BY OrderNumber
ORDER BY Count(*) DESC

Bu sonuçlar, 'so72656', 'so58845' ve 'so70714' emri numaralarını olduðunu en büyük sıralarıyla, her sekiz öğeleri içerir.Kimlikleri kullanarak, hangi sırayla ve hangi öğelerin satın alınan görmek için belirli bir siparişin ayrıntılarını görüntüleyebilirsiniz.

OrderNumber

LineNumber

Model

SO58845

1

Dağ-500

SO58845

2

LL Dağ Tekeri

SO58845

3

Dağ Tekeri Borusu

SO58845

4

Fender Seti - Dağ

SO58845

5

Dağ Şişe Kafesi

SO58845

6

Su şişe

SO58845

7

Spor-100

SO58845

8

Uzun kabında Logo Jersey

Ancak, bazı müşteriler satın Mountain-500 farklı ürün satın.Mountain-500 modelinde sıralarının listesini görüntüleyerek izleyen tüm ürünleri görebilirsiniz.Aşağıdaki yordamları sağlanan iki görüntüleyicileri kullanarak bu sıraları görüntüleme ile Yürüyüş Analysis Services:

İlgili sıraları sıra kümeleme görüntüleyiciyi kullanarak görüntülemek için

  1. Object Explorer'da [Sequence Clustering] modelini sağ tıklatın ve Gözat'ı seçin.

  2. Sıra kümeleme görüntüleyiciyi'ı Durumu geçişleri sekmesi.

  3. De Küme aşağı açılan listesinde, emin popülasyonu (tümü) seçilir.

  4. Kaydırıcı çubuğu bölmesinin sol tarafındaki tüm bağlantıları göstermek için en üstüne, götürün.

  5. Çizimde, bulun Mountain-500ve Diyagram düğümünü tıklatın.

  6. Vurgulanan satırlar sonraki durumları (Mountain-500 sonra satın alınan ürünler) üzerine gelin ve numaralar olasılığını gösterir.Karşılaştırmak için bu sonuçlar genel model içerik görüntüleyicide.

İlgili sıraları genel modeli içerik Görüntüleyicisi'ni kullanarak görüntülemek için

  1. Object Explorer'da [Sequence Clustering] modelini sağ tıklatın ve Gözat'ı seçin.

  2. Görüntüleyici açılır liste kutusunda seçin Microsoft Genel içerik ağacı Görüntüleyici.

  3. De düğüm resim yazısı bölmesinde adlı düğümü tıklatın sırası düzey için küme 16.

  4. Düğüm Ayrıntılar bölmesinde NODE_DISTRIBUTION satırını bulun ve iç içe geçmiş tablo içinde herhangi bir yeri tıklatın.

    Üst satır her zaman eksik değerdir.Bu satır sırası durumudur 0.

  5. kapalı Ok tuşuna basarak anahtar, ya da satır Mountain-500 görene kadar iç içe geçmiş tablo kapalı taşımak için kaydırma çubuklarını kullanın.

    Bu satır sırası durumudur 20.

    Not

    Satır numarası belirli bir sırada durumu için programlı olarak elde edebilirsiniz, ancak yalnızca gözatma, yalnızca iç içe geçmiş tablo bir Excel'e kopyalama daha kolay olabilir çalışma kitabı.

  6. Düğüm resim yazısı bölmesine geri dönün ve düğümünü açın, sırası düzey için küme 16, zaten genişletilmiş durumda ise.

  7. Aramak için alt düğümler arasında geçiş satır sırası il 20.Geçiş düğümü tıklatın.

  8. İç içe geçmiş tablo NODE_DISTRIBUTION aşağıdaki ürün ve değerler içerir.Bu sonuçlar karşılaştırmak Durum geçişi sekme sırası kümeleme Görüntüleyici.

Aşağıdaki tablo NODE_DISTRIBUTION sonuçlarnı gösteren tablo, grafik görüntüleyicide görüntülenen yuvarlatılmış olasılık değerleri ile birlikte.

Ürün

Destek (tablo NODE_DISTRIBUTION)

Olasılık (NODE_DISTRIBUTION) tablo)

Olasılığını (grafik)

Eksik

48.447887

0.138028169

(gösterilmez)

CAP geçiş yapma

10.876056

0.030985915

0.03

Fender Seti - Dağ

80.087324

0.228169014

0.23

Yarı Finger Gloves

0.9887324

0.002816901

0.00

Hydration Pack

0.9887324

0.002816901

0.00

LL Dağ Tekeri

51.414085

0.146478873

0.15

Uzun kabında Logo Jersey

2.9661972

0.008450704

0.01

Dağ Şişe Kafesi

87.997183

0.250704225

0.25

Dağ Tekeri Borusu

16.808451

0.047887324

0.05

Kısa kabında Klasik Jersey

10.876056

0.030985915

0.03

Spor-100

20.76338

0.05915493

0.06

Su şişe

18.785915

0.053521127

0.25

Başta biz eğitim verileri durum yer alan ürün 'Mountain-500' de arkasından dağ resimlerden sıkılırsanız ', çok sayıda olası sıraları olduğunu görebilirsiniz.Ayrıntılı bilgi için belirli bir küme bulmak için Delme işlemi yineleyin kapalı sıraları kümedeki her durum veya ürün gerçek geçişler listesinden.

Geçiş satır belirli bir küme içinde listelenen serisinden atlayabilirsiniz.Bu geçiş satırdan hangi ürünün sonraki belirlemek ve bu ürün serileri listesinde geri atlamak.Birinci ve ikinci her durum için bu işlemi yineleyerek durumlarının uzun zincirler ile çalışabilirsiniz.

Sıra bilgilerini kullanarak

Kullanıcı izlemek için sıra kümeleme için ortak bir senaryoda ise bir Web sitesi.Örneğin, verileri kayıtlardan, Adventure Works e-ticaret müşteri satın Web sitesi, elde edilen sıra kümeleme modeli gerçekleştirip kullanıcı davranışı, e-ticaret sitesi gezinti sorunları çözmek ya da satış yükseltmek için yeniden tasarlamanız için kullanılabilir.

Örneğin, kullanıcılar her zaman belirli bir nüfus ne olursa olsun ürünler zinciri izleyerek analiz gösterebilir.Ayrıca, kullanıcılar sık sık siteyi belirli bir ürünle ilgili tıklattıktan sonra çıkış bulabilirsiniz.Bulma köklü biçimde verdiğiniz kullanıcılar açık kalmasını induce kullanıcılara hangi ek yollar isteyebilir Web sitesi.

Kullanıcılarınızın sınıflandırma içinde kullanmak için ek bilgi yoksa, sonra basitçe sıra bilgileri genel davranış daha iyi anlamak için gezinme hakkında veri toplamak için kullanabilirsiniz.Ancak, müşterilerle ilgili bilgileri toplamak ve bu bilgileri Müşteri veritabanınıza uyan, Kümeleme ile güç birleştirebilirsiniz tahmin kullanıcı için özel olarak tasarlanmış veya belki de geçerli sayfa gezinti yolunu temel öneriler sağlamak için serileri üzerinde.

Başka bir modeli kümeleme bir sıra tarafından derlenmiş kapsamlı durumu ve geçiş bilgileri hangi olası yolları asla kullanýldýðýný belirlemek için kullanılır.Örneğin, sayfa 1-4, giderek birçok ziyaretçi vardır, ancak ziyaretçilerin sayfa 5 hiçbir zaman devam, 5 sayfaya gezinti engelleyen sorunları olup olmadığını araştırmak.Bu modeli içeriği sorgulama ve olası yolları listesini karşı karşılaştırma yapabilirsiniz.Tüm gezinti yollarını söylemek grafikler bir Web sitesi program aracılığıyla veya çeşitli site analiz araçları kullanılarak oluşturulabilir.

Gözlemlenen yol listesi modeli içeriği sorgulayarak edinme ve modeli kümeleme bir sıra diğer sorgu örnekleri görmek için öğrenmek için bkz: Modeli kümeleme bir sıra sorgulama (- Analysis Services veri madenciliği).