Microsoft ilişkilendirme algoritması

The Microsoft Association algorithm is an association algorithm provided by Analysis Services that is useful for recommendation engines.Bir öneri motorunun ürünler önerir müşterilere maddeler temel alınarak Bunlar zaten satın aldığınız veya içinde bunlar gösterdiği ilgi.The Microsoft Association algorithm is also useful for market basket analysis.Bir örnek için bir pazar sepeti çözümlemesi, bkz: Ders 3: Pazar sepeti senaryo (Ara veri madenciliği Öğreticisi) oluşturma veri Mining öğretici.

İlişki modelleri tek tek durumlarda ve servis taleplerini içeren maddeler için tanımlayıcıları içeren DataSet yerleşik olarak bulunur.Bir grup içindeki öğeler bir durum adı verilen bir itemset.Bir ilişkilendirme modelini itemsets ve öğelerle birlikte zaman içinde gruplandırılma biçimini tanımlayan bir kurallar bir dizi oluşur.Algoritma tanımlayan kurallar, müşterinin alışveriş sepeti içinde zaten varolan maddeleri temel alan bir müşteri büyük olasılıkla gelecek alımlar, tahmin etmek için kullanılabilir.Aşağıdaki diyagramda bir itemset kurallar bir dizi gösterir.

İlişkilendirme modeli için kurallar kümesi

Şekilde gösterildiği gibi Microsoft ilişkilendirme algoritması olabilecek pek çok kural içinde Buldataset. İtemsets ve kurallar, oluşturduğu açıklamak için iki parametre, destek ve olasılık, algoritması kullanır.x ve y alışveriş arabasına olabilir iki öğeyi temsil ediyorsa, örneğin, destek parametresi birleşimi maddelere, x ve y içeren dataset durumlarda sayısıdır.Kullanıcı tanımlı parametreleri ile birlikte destek parametresini kullanarak MINIMUM_SUPPORT ve MAXIMUM_SUPPORT, algoritması oluşturulan itemsets sayısını denetler.Adı da olasılık parametresi, güven, DataSet nesnesini içeren x ve y de içeren durumlarda kesri temsil eder.Olasılık parametresi ile birlikte kullanarak MINIMUM_PROBABILITY parametresi, algoritma, oluşturulan kural sayısını denetler.

Örnek

The Adventure Works Cycle company is redesigning the functionality of its Web site.Satış-aracılığıyla ürünlerinin artırmak için tasarlanması, amaç sağlamaktır.Şirketin her satışın bir işlem veritabanı kayıtları için kullanabilecekleri Microsoft birlikte satın eğilimindedir ürünleri kümesi tanımlamak için ilişkilendirme algoritması.Daha sonra bir müşteri zaten müşterinin sepet alışveriş yapıyorsunuz maddeler temel alınarak, ilgilenebileceğiniz ek öğeleri tahmin edebilir.

Algoritma nasıl çalışır?

The Microsoft Association algorithm traverses a dataset to find items that appear together in a case.Algoritma itemsets fırsatla ilişkili, en azından, tarafından belirtilen durumlarda sayısı görüntülenen öğeleri içine sonra gruplar MINIMUM_SUPPORT parametresi.Örneğin, bir itemset olabilir "dağ 200 varolan, spor 100 = varolan =" ve 710 destek olabilir.Algoritma kuralları itemsets sonra oluşturur.Bu kuralları algoritması önemli olarak tanımlayan diğer özel öğeleri varlığını temel veritabanı içindeki öğe varlığını tahmin etmek için kullanılır.Örneğin, bir kural olabilir "= 1000 yarış, var olan ve Road şişe kafesi = var olan ve su şişe varolan =" ve 0.812 bir olasılık olabilir.Bu örnekte, sepet 1000 yarış lastiği ve su Şişesi kafesi bulunması sepetine bir su Şişesi de büyük bir olasılıkla olacaktır öngörür algoritmasını tanımlar.

Algoritma algoritma davranışını özelleştirmek ve araştırma modeli sonuçlar denetleme parametrelerinin bir listesi ile birlikte, daha ayrıntılı bir açıklama için bkz: Microsoft ilişkilendirme algoritması Teknik Başvurusu.

Birliği modeller için gerekli veri

Bir ilişkilendirme kuralları modeli kullanmak için veri hazırladığınızda ne kadar veri gerekli ve verileri nasıl kullanıldığı gibi belirli algoritması gereksinimleri anlamanız gerekir.

Bir ilişkilendirme kuralları modeli gereksinimleri aşağıdaki gibidir:

  • A single key column   Each model must contain one numeric or text column that uniquely identifies each record.compound keys not permitted.

  • Tek bir tahmin edilebilir sütunilişkilendirme modelini yalnızca bir tahmin edilebilir sütun içerebilir.Genellikle bunu anahtar sütun dosyalanmış satın alınan ürünlerin listelendiği gibi iç içe geçmiş tablo.Kesikli veya discretized değerleri olmalıdır.

  • Giriş sütunları.Giriş sütunları ayrı olması gerekir.Genellikle bir ilişkilendirme modelini girilen verilerin iki tabloda yer alıyor.Örneğin, başka bir tablo müşteri Satınalmalar taşıdığı sürece bir tablo müşteri bilgilerini içerebilir.Bu veri modeli, iç içe geçmiş bir tablo kullanarak giriş.İç içe geçmiş tablolar hakkında daha fazla bilgi için bkz: İç içe tablolar (Analysis Services - veri madenciliği).

İçerik türleri ve ilişkiyi modeller için desteklenen veri türleri hakkında daha ayrıntılı bilgi için gereksinimleri bölümüne bakın Microsoft ilişkilendirme algoritması Teknik Başvurusu.

Bir ilişki modeli görüntüleme

Model keşfetmek için kullanabileceğiniz Microsoft ilişkilendirme Görüntüleyicisi.Bir ilişkilendirme modelini görüntülediğinizde, Analysis Services daha iyi anlamaya ilişkileri ve kurallar veri. bulundu böylece bağıntıları farklı açılardan sunarThe Itemset pane in the viewer provides a detailed breakdown of the most common combinations, or itemsets.The Rules pane presents a list of rules that have been generalized from the data, adds calculations of probability, and ranks the rules by relative importance.the dependency network viewer lets you visually explore how individual different items are connected.Daha fazla bilgi için bkz: Microsoft Küme Görüntüleyici ile bir araştırma modeli görüntüleme.

İtemsets ve kuralları hakkında daha ayrıntılı bilgi edinmek istiyorsanız, modelinde göz Microsoft Genel içerik ağacı Görüntüleyici.Model için depolanan içeriğin her itemset için destek, bir puan her kural ve diğer istatistik içerir.Daha fazla bilgi için bkz: Birliği modeller için içerik modeli mining (Analysis Services - veri madenciliği).

Öngörüler oluşturma

Model işlendikten sonra kurallar ve itemsets Öngörüler yapmak için kullanabilirsiniz.Bir ilişkilendirme modelini bir öngörü hangi öğe belirtilen maddenin varlığını verilen yüksektir söyler ve tahmin olasılık, destek veya önemi gibi bilgileri içerebilir.Bir ilişki modeli karşı sorguları oluşturmak nasıl örnekler için bkz: Bir ilişki modeli sorgulama (- Analysis Services veri madenciliği).

Bir veri karşı bir sorgu oluşturma hakkında genel bilgi için araştırma modeli, bkz: Veri madenciliği modelleri sorgulama (- Analysis Services veri madenciliği).

Performans

İtemsets oluşturma ve bağıntıları sayım işlemi olabilir saat-tüketen.Ancak Microsoft ilişkilendirme kuralları algoritması kullanır iyileştirme teknikleri kazanmak ve daha hızlı işlem yapmak için aşağıdaki gibi koşullar altında performans sorunları ortaya çıkabilir, bilmeniz gereken:

  • Veri küme ile çok sayıda tek tek öğeleri büyük.

  • Minimum itemset boyutu çok düşük küme.

İşleme en aza indirmek için saat ve itemsets karmaşıklığını azaltmak, verileri çözümlemek için önce ilgili öğeleri kategorilere göre gruplandırma deneyebilirsiniz.

Açıklamalar

  • In öngörü modeli İşaretleme Dili (veri madenciliği modelleri oluşturmak için pmml) kullanımını desteklemez.

  • detaylandırma destekler.

  • olap veri madenciliği modelleri destekler.

  • Veri madenciliği boyutları oluşturulmasını destekler.