Microsoft sırası kümeleme algoritması

The Microsoft Sequence Clustering algorithm is a sequence analysis algorithm provided by Microsoft SQL Server Analysis Services.Bu algoritma aşağıdaki yolları tarafından bağlı olayları içeren veri keşfetmek için kullanabilirsiniz ya da sıralarını.Algoritması tarafından aynı gruplandırma veya kümeleme, sıralarını en yaygın sıralarını bulur.Sıraları bazı örnekler şunlardır:

  • Kullanıcıları gidin veya göz oluşturan tıklatın yollarını açıklayan verileri bir Web sitesi.

  • İçinde Müşteri maddeleri alışveriş sepeti adresindeki çevrimiçi bir satıcıya ekler siparişi tanımlayan veriler.

Birçok yönden Bu algoritma benzer Microsoft kümeleme algoritması.Ancak, bulma kümeleri içeren benzer özniteliklere, taleplerinin yerine Microsoft sırası kümeleme algoritması bulur kümeleri talepleri içeren benzer yolda bir sıra.

Örnek

The Adventure Works Cycles Web site collects information about what pages site users visit, and about the order in which the pages are visited.Çevrimiçi sipariş şirketin sağladığı için müşteriler sitesine oturum açmalısınız.Bu şirket ile bilgi için her bir müşteri profili tıklatın sağlar.Kullanarak Microsoft sırası kümeleme algoritması bu veriler üzerinde şirket bulabilirsiniz gruplar veya kümeler, müşterilerin kim sahip benzer desenler veya kısımlarının tıklatma.Şirket bu kümeler, hangi sayfaların belirli bir ürünün satışı için en yakın ilişkili tanımlamak ve hangi sayfaları ziyaret sonraki en yüksek tahmin etmek kullanıcıların Web sitesi aracılığıyla nasıl hareket çözümlemek için daha sonra kullanabilirsiniz.

Algoritma nasıl çalışır?

The Microsoft Sequence Clustering algorithm is a hybrid algorithm that combines clustering techniques with Markov chain analysis to identify clusters and their sequences. One of the hallmarks of the Microsoft Sequence Clustering algorithm is that it uses sequence data.Bu veriler bir dizi ürün satın veya belirli bir kullanıcı için Web tıklatır gibi bir dizi olaylar ya da bir DataSet'teki durumları arasında geçişler genellikle temsil eder.Algoritma tüm geçiş olasılıklar inceler ve farklar ölçer veya dataset hangi sıralarını belirlemek için tüm olası sıraları arasındaki uzaklıkları kümeleme için giriş olarak kullanmak için en iyi değil.Algoritma serileri aday listesini oluşturduktan sonra Kümeleme em yöntem için bir girdi olarak sıra bilgileri kullanır.

Uygulama ayrıntılı bir açıklaması için bkz: Microsoft Teknik Başvurusu algoritması kümeleme sırası.

Modelleri kümeleme sırası için gerekli veriler

Modeli kümeleme bir sıra eğitim kullanmak için veri hazırladığınızda ne kadar veri gerekli ve verileri nasıl kullanıldığı gibi belirli algoritması gereksinimleri anlamanız gerekir.

Modeli kümeleme bir sıra için gereksinimleri aşağıdaki gibidir:

  • Tek bir key sütun modeli kümeleme bir sıra kayıtları tanımlayan bir anahtar gerektirir.

  • Bir sıra sütuniçin verilerin sırasını, sıra Kimliğini içeren bir iç içe tablo modeli olmalıdır sütun.Sıra kimliği herhangi sıralanabilir veri türleri olabilir.Örneğin, bir Web sayfa tanımlayıcı, bir tamsayı ya da bir metin kullanabilirsiniz dize, olayları bir sıra sütunu tanımlar sürece.Her sıra için yalnızca bir sıra tanıtıcısı verilir ve her modelinde yalnızca bir tür sırası izin verilir.

  • İsteğe bağlı olmayan sýra özniteliklerive buna ek olarak sıralaması için ilgili diğer öznitelikleri algoritmasını destekler.Bu öznitelikler, iç içe sütunlar içerebilirsiniz.

Örneğin, örneğin, daha önce bildirilmiş Adventure Works Cycles Web sitesi, modeli kümeleme sırası demografisi hakkında belirli bir müşteri için sıra dışı öznitelikleri olarak her sipariş ve iç içe geçmiş tablo içeren sıra müşteri sitesine gözatarsa veya yerleştirme maddeler halinde bir alışveriş arabası olarak durum tablo olarak sipariş bilgileri içerebilirsıralama bilgileri.

İçerik türleri ve modelleri kümeleme sırası için desteklenen veri türleri hakkında daha ayrıntılı bilgi için gereksinimleri bölümüne bakın Microsoft Teknik Başvurusu algoritması kümeleme sırası.

Modeli kümeleme bir sıra görüntüleme

Bu algoritma oluşturur araştırma modeli en yaygın veri serilerini içerir.Model keşfetmek için kullanabileceğiniz Microsoft sıra küme Görüntüleyici.Modeli kümeleme bir sıra görüntülediğinizde, Analysis Services gösterir, kümeleri içeren birden fazla geçişler.Ayrıca, ilgili istatistikleri görüntüleyebilirsiniz.Daha fazla bilgi için bkz: Microsoft sıra küme Görüntüleyici ile bir araştırma modeli görüntüleme.

Daha fazla ayrıntı öğrenmek isterseniz, modelinde göz Microsoft Genel içerik ağacı Görüntüleyici.Model için saklanan içerik dağıtımı için her düğümde bulunan tüm değerleri, olasılık ve her küme geçişleri hakkında ayrıntılı bilgi içerir.Daha fazla bilgi için bkz: Sıra modeller kümeleme için içerik modeli mining (Analysis Services - veri madenciliği).

Öngörüler oluşturma

Modeli eğitim almış sonra sonuçlar olarak saklanan bir küme desenlerin.Yeni bir sıra, büyük olasılıkla bir sonraki adıma tahmin etmek, en yaygın sıralarını açıklamalarını verileri kullanabilirsiniz.Ancak, diğer sütunları algoritma içerdiğinden dolayı sıralı veri, sıralı olmayan girişleri arasındaki ilişkileri belirlemek için ortaya çıkan modelini kullanabilirsiniz.Örneğin, demografik veri modeline eklerseniz, müşterilerin belirli gruplar için Öngörüler yapabilirsiniz.Tahmin sorgular Öngörüler değişken sayıda geri dönmek için veya tanımlayıcı istatistik dönmek için özelleştirilebilir.

Bir veri sorgular oluşturma hakkında bilgi için araştırma modeli, bkz: Veri madenciliği modelleri sorgulama (- Analysis Services veri madenciliği).Modeli kümeleme bir sıra ile sorgular kullanma örnekleri için bkz: Modeli kümeleme bir sıra sorgulama (- Analysis Services veri madenciliği).

Açıklamalar

  • In öngörü modeli İşaretleme Dili (veri madenciliği modelleri oluşturmak için pmml) kullanımını desteklemez.

  • detaylandırma destekler.

  • olap veri madenciliği modelleri kullanımını ve veri madenciliği boyutları oluşturulmasını destekler.