Microsoft Kümeleme algoritması

The Microsoft Clustering algorithm is a segmentation algorithm provided by Analysis Services.Algoritma Grup durumlar için yinelemeli teknikleri benzer özellikler içeren kümeler halinde bir dataset içinde kullanır.Bu gruplandırmalar verileri exploring bozukluklar veri tanımlama ve Öngörüler oluşturma için yararlıdır.

Kümeleme modelleri, mantıksal olarak sıradan Gözlem elde değil bir dataset içindeki ilişkiler tanımlayabilirsiniz.Örneğin, mantıksal olarak kişilerin kendi işlerini bisiklet tarafından iletişim genellikle çalıştıkları yere gelen şehirlerarası Canlı değil, keşfedilir.Algoritma, ancak belirgin olarak bisiklet yolcuyu hakkında diğer özelliklerini bulabilirsiniz.Aşağıdaki çizimde, bir temsil verileri küme b çalışmak için bisiklet Sürün eğilimindedir kişiler hakkındaki verileri temsil eden, çalışmaya sürücü eğilimindedir kişiler hakkında küme.

Ev-iş arası yolculuk edenlerin eğilimlerine ilişkin küme deseni

Kümeleme algoritması gibi diğer veri madenciliği algoritmaları farklı Microsoft karar ağaçlar algoritması belirtmek zorunda değilsiniz, bir tahmin edilebilir sütun kümeleme bir modeli. oluşturabilmesi içinKümeleme algoritması kesinlikle veri mevcut ilişkileri ve algoritmayı tanımlar kümeleri modeli eğitir.

Örnek

Bir grup kişiye benzer demografik bilgileri paylaşmak ve benzer ürünlerinden satın düşünün Adventure Works şirketi.Bu gruba bir veri kümesini temsil eder.Bu tür kümeler bir veritabanında varolmayabilir.Bir küme sütunların izlenerek, daha net bir dataset nesnesindeki kayıtları bir başkasına nasıl ilişkilendirildiğini görebilirsiniz.

Algoritma nasıl çalışır?

The Microsoft Clustering algorithm first identifies relationships in a dataset and generates a series of clusters based on those relationships.Dağılım çizim görsel olarak nasıl algoritması, veri grupları aşağıdaki çizimde gösterildiği gibi göstermek için kullanışlı bir yoldur.Dağılım çizim tüm gösteren durums dataset ve her durum bir grafikte noktasıdır.Kümeleri noktalar grafikte gruplandırabilir ve algoritma tanımlayan ilişkiler görülmektedir.

Veri kümesindeki durumların dağılımı

İlk kümeleri tanımlama sonra algoritma ne kadar iyi puan gruplandırmalar kümeleri temsil eden hesaplar ve verileri daha iyi temsil eden kümeleri oluşturmak için gruplandırmalar yeniden tanımlamak çalışır.Bunun sonuçlar daha kümeleri tanımlayarak geliştiremiyor kadar algoritması bu işlem sırayla dolaşır.

Algoritmayı belirten bir bir tekniği Kümeleme, küme sayısı üst sınırı sınırlayarak veya bir küme oluşturmak için gereken destek miktarını değiştirmenin seçerek çalışma biçimini özelleştirebilirsiniz.Daha fazla bilgi için bkz: Microsoft Kümeleme algoritması Teknik Başvurusu.

Kümeleme modeller için gerekli veri

Bir kümeleme modeli eğitim kullanmak için veri hazırladığınızda ne kadar veri gerekli ve verileri nasıl kullanıldığı gibi belirli algoritması gereksinimleri anlamanız gerekir.

Bir kümeleme modeli gereksinimleri aşağıdaki gibidir:

  • Tek bir key sütunher model, her kaydı benzersiz olarak tanımlayan bir sayı veya metin sütun içermelidir.Bileşik anahtarları izin verilmez.

  • Giriş sütunlarıher modeli kümeleri oluşturmak için kullanılan değerleri içeren en az bir giriş sütun içermelidir.Çoğu sütunları istediğiniz, ancak her sütundaki değerlerin sayısına bağlı olarak, ek sütunlar ve buna ek olarak artırabilirsiniz giriş olabilir saat modeli eğitmek için alır.

  • İsteğe bağlı olarak tahmin edilebilir sütunalgoritması modelini oluşturmak için öngörülebilir bir sütun olması gerekmez, ancak hemen hemen her veri türünün öngörülebilir bir sütun ekleyebilirsiniz.Değerleri tahmin edilebilir sütun küme modeli için giriş olarak kabul veya yalnızca tahmin kullanılmasını belirtebilirsiniz.Örneğin müşteri gelir olarak tahmin etmek isterseniz kümeleme bölge veya yaş gibi nüfus üzerinde gelir olarak belirtirsiniz PredictOnly ve tüm diğer sütunları, bölge veya girdileri olarak yaş gibi ekleyin

İçerik türleri ve modelleri kümeleme için desteklenen veri türleri hakkında daha ayrıntılı bilgi için gereksinimleri bölümüne bakın Microsoft Kümeleme algoritması Teknik Başvurusu.

Bir küme modeli görüntüleme

Model keşfetmek için kullanabileceğiniz Microsoft Küme Görüntüleyici.Bir kümeleme modeli görüntülediğinizde, Analysis Services kümelemeleri arasındaki ilişkileri gösterir ve ayrıca her kümelemenin her kümeleme diğerlerinin ayırt özniteliklerin listesini ve tüm özelliklerini ayrıntılı bir profil sağlayan bir diyagram kümelemeleri gösterir eğitim verileri kümelemesi.Daha fazla bilgi için bkz: Microsoft Küme Görüntüleyici ile bir araştırma modeli görüntüleme.

Daha fazla ayrıntı öğrenmek isterseniz, modelinde göz Microsoft Genel içerik ağacı Görüntüleyici.Model için saklanan içerik dağıtımı için her düğümde bulunan tüm değerleri, her küme ve diğer bilgileri olasılığını içerir.Daha fazla bilgi için bkz: Modelleri kümeleme için içerik modeli mining (Analysis Services - veri madenciliği).

Öngörüler oluşturma

Modeli eğitim almış sonra sonuçlar olarak saklanan bir küme keşfedin ya da Öngörüler yapmak için kullanmak desenler.

Yeni veri keşfedilen kümeler halinde mi yeri hakkında Öngörüler geri dönmek için veya kümeleri hakkında açıklayıcı İstatistikler elde etmek için sorgular oluşturabilirsiniz.

Bir veri sorgular oluşturma hakkında bilgi için araştırma modeli, bkz: Veri madenciliği modelleri sorgulama (- Analysis Services veri madenciliği).Bir kümeleme modeli ile sorgular kullanma örnekleri için bkz: Bir küme modeli sorgulama (- Analysis Services veri madenciliği).

Açıklamalar

  • In öngörü modeli İşaretleme Dili (veri madenciliği modelleri oluşturmak için pmml) destekler.

  • detaylandırma destekler.

  • olap veri madenciliği modelleri kullanımını ve veri madenciliği boyutları oluşturulmasını destekler.