Aracılığıyla paylaş


Microsoft ilişkilendirmesi algoritması

The Microsoft Association algorithm is an association algorithm provided by Analysis Services that is useful for recommendation engines.Bir öneri motoru ürünleri önerir müşterilere maddelerine göre zaten satın ya da, bunlar belirtilen bir vade farkı.The Microsoft Association algorithm is also useful for market basket analysis.Örnek bir pazar sepeti analizi için bkz:Ders 3: Bir (ara) veri madenciliği Öğreticisi) Pazar Basket senaryo oluşturmaveri madenciliği öğretici.

İlişki modelleri tek tek servis taleplerini ve servis taleplerini içeren maddeler için tanımlayıcıları içeren veri üzerinde oluşturulmuştur.Bir durumda maddelerden oluşan bir grubun adı verilen biritemset.Bir ilişki modeli, bir dizi itemsets ve içinde servis maddelerini nasıl gruplanmış tanımlayan kurallar içerir.Algoritma belirleyen kurallar, müşterinin alışveriş arabası var maddelere göre bir müşteri büyük olasılıkla gelecekte satınalma, tahmin etmek için kullanılır.Aşağıdaki şemada bir dizi kural bir itemset gösterir.

A set of rules for an association model

Diyagramda gösterildiği gibiMicrosoftİlişki algoritması olabilecek birçok kuralları içinde bulma bir veri kümesi.Algoritma, iki parametre, destek ve olasılık, itemsets ve kurallar, oluşturduğu tanımlamak için kullanır.X ve Y bir alışveriş sepeti olabilecek iki öğeyi temsil eder, örneğin, destek parametre öğeleri, X ve Y birleşimini içeren durumlarda veri kümesi sayısıdır.Kullanıcı tanımlı parametreleri ile birlikte destek parametresini kullanarakMINIMUM_SUPPORTveMAXIMUM_SUPPORT,algoritması oluşturulan itemsets denetler.Olasılık parametresi, adı dagüven, veri kümesi içeren X ve y de içeren durumlarda bölümü temsil eder Olasılık parametresi ile birlikte kullanarakMINIMUM_PROBABILITYparametresi, algoritma oluşturulan kural sayısını denetler.

Örnek

The Adventure Works Cycle company is redesigning the functionality of its Web site.Satış-ile ürünlerin artırmak için tasarım amacı olur.İşlem bir veritabanında her satış şirketi kayıtları için kullanabilecekleriMicrosoftBirlikte satın eğilimindedir ürünler kümesini tanımlamakta ilişkisi algoritması.Bunlar, daha sonra bir müşteri, müşteri sepet alışveriş zaten maddelerin bağlı, ilgili ek öğeler tahmin edebilir.

Algoritma nasıl çalışır?

The Microsoft Association algorithm traverses a dataset to find items that appear together in a case.Algoritması sonra içine itemsets, en azından tarafından belirtilen bir servis talebi sayısı, görüntülenen öğelerin fırsatla ilişkili gruplarMINIMUM_SUPPORTparametre.Örneğin, bir itemset olabilir "Dağ 200 varolan, spor 100 = varolan =" ve 710, bir destek olabilir.Algoritma, daha sonra itemsets kurallar oluşturur.Bu kurallar, öğe varlığı, karma algoritması olarak önemli diğer özel öğeleri, temel veritabanında olup olmadığını tahmin etmek için kullanılır.Örneğin, bir kural olabilir "= 1000 yarış değilse var ve yol şişe kafesi varolan = ve şişe su var =" ve 0.812 bir olasılık olabilir.Örneğin, 1000 yarış lastiği ve su şişe kafesi sepetindeki varlığı su şişe sepet büyük olasılıkla da olurdu, tahmin algoritmayı tanımlar.

Algoritma algoritma davranışını özelleştirme ve sonuçlar çıkarma modelinde, denetlemeye parametrelerinin bir listesi ile birlikte, daha ayrıntılı bir açıklaması için bkz:Microsoft ilişkilendirmesi algoritması teknik başvurusu.

İlişki modelleri için gerekli verileri

Bir ilişki kurallar modeli kullanmak için verileri hazırlamak, ne kadar verinin gereklidir ve verilerin nasıl kullanıldığını da dahil olmak üzere belirli algoritma gereksinimleri anlamanız gerekir.

Bir ilişki kurallar modeli gereksinimleri aşağıdaki gibidir:

  • Tek bir key column   Each model must contain one numeric or text column that uniquely identifies each record.compound keys not permitted.

  • Tek bir tahmin edilebilir sütunBir ilişki modeli olabilir yalnızca bir sütun öngörülebilir.Genelde satın alınan ürünler listeler iç içe tablosunun, dosyalanmış gibi anahtar sütun bulunur.Değerlerden ayrı veya discretized olmalıdır.

  • Giriş sütunlar.Giriş sütunlar farklı olmalıdır.Verilerin sık sık bir ilişki modeli için iki tabloda yer alıyor.Örneğin, başka bir tablo, müşteri satınalma içerir ancak bir müşteri bilgileri içerebilir.İç içe geçmiş bir tablo kullanarak bu veri modeli giriş.İç içe geçmiş tablolar hakkında daha fazla bilgi için bkz:Tabloları iç içe geçmiş (Analysis Services - veri madenciliği).

İçerik türleri ve ilişki modeli için desteklenen veri türleri hakkında daha ayrıntılı bilgi için gereksinimleri bölümüne bakınMicrosoft ilişkilendirmesi algoritması teknik başvurusu.

Bir ilişki modeli görüntüleme

Model keşfetmek içinMicrosoft Office 2010 Suite Birliği Görüntüleyicisi.Bir ilişki modeli görüntülediğinizdeAnalysis Servicesböylece, daha iyi anlamak kurallar veri. bulundu ve ilişkileri farklı açılar arasında korelasyon sunarThe Itemset pane in the viewer provides a detailed breakdown of the most common combinations, or itemsets.The Rules pane presents a list of rules that have been generalized from the data, adds calculations of probability, and ranks the rules by relative importance.the dependency network viewer lets you visually explore how individual different items are connected.Daha fazla bilgi için bkz:Görüntüleme bir araştırma modeli Microsoft Cluster Görüntüleyici ile.

İtemsets ve kurallar hakkında daha fazla ayrıntı öğrenmek istiyorsanız, modelde gözMicrosoft Office 2010 Suite genel içerik ağacı Görüntüleyicisi.Model için depolanan içeriğin her itemset için destek, diğer İstatistikler ve her kural için bir puan içerir.Daha fazla bilgi için bkz:araştırma modeli Ilişkilendirmesi modeller için içerik (Analysis Services - veri madenciliği).

Öngörüler oluşturma

Model işlendikten sonra kurallar ve itemsets Öngörüler yapmak için kullanabilirsiniz.Bir ilişki modeli bir tahmin, hangi öğe belirtilen maddenin varlığını verilen olasılığı yüksektir bildirir ve tahmin, olasılık, destek ve önemi gibi bilgileri içerebilir.Örnek olarak nasıl bir ilişki modeli sorguları oluşturmak için bkz:Bir ilişkilendirme modeli sorgulama (Analysis Services - veri madenciliği).

Bir veri araştırma modeli yönelik bir sorgu oluşturma hakkında genel bilgi için bkz:Veri madenciliği modelleri sorgulama (Analysis Services - veri madenciliği).

Performans

İtemsets oluşturma ve korelasyon sayım işlemi olabilir saat - alabilir.DeMicrosoftİlişki kurallar algoritması kazanmak ve daha hızlı işlem yapmak için en iyi duruma getirme teknikler kullanır ve performans sorunları aşağıdaki gibi durumlarda ortaya çıkabilir, bilmeniz gereken:

  • Veri kümesi ile çok sayıda tek tek öğeler daha büyüktür.

  • En az itemset boyutu çok küçük olarak küme.

İşlem süresini en aza indirmek ve itemsets karmaşıklığını azaltmak için çalışmadan önce analiz kategorilere göre ilgili öğeleri gruplandırma verileri.

Açıklamalar

  • Öngörü modeli biçimlendirme dili (madenciliği modelleri oluşturmak için PMML) kullanımını desteklemez.

  • detaylandırma destekler.

  • OLAP madenciliği modellerini destekler.

  • Veri madenciliği boyutlarının oluşturulmasını destekler.