Microsoft Naive Bayes algoritması Teknik Başvurusu
The Microsoft Naive Bayes algorithm is a classification algorithm provided by Microsoft SQL Server Analysis Services for use in predictive modeling.Algoritma, koşullu olasılık giriş ve öngörülebilir sütunlar arasındaki hesaplar ve sütunları bağımsız olduğunu varsayar.Cumhuriyet, bu varsayımı ad önbelleğin Bayes yol açar.
Microsoft Naive Bayes algoritma uygulaması
Bu algoritma diğerinden daha az hesaplama yoğun Microsoft algoritmalar ve bu nedenle, giriş sütunlar ve tahmin edilebilir sütun. arasındaki ilişkileri keşfetmek için veri madenciliği modelleri hızla oluşturmak için kullanılabilirAlgoritma her çifti giriş öznitelik değerleri ve çıkış öznitelik değerleri dikkate alır.
Bu belge kapsam dışındadır Bayes teoremi matematiksel özelliklerini açıklamasıdır; daha fazla bilgi için bkz: Microsoft Research başlıklı kağıt öğrenme Bayesian ağlar: Bilgi ve istatistiksel veri birleşimi.
Tüm modellerinde olasılıklar için olası değerleri eksik hesabına nasıl düzeltilir bir açıklama için bkz: Değerleri eksik (Analysis Services - veri madenciliği).
Özellik seçimi
The Microsoft Naive Bayes algorithm performs automatic feature selection to limit the number of values that are considered when building the model.Daha fazla bilgi için bkz: Özellik seçimi'veri madenciliği.
Algoritma |
Analiz yöntemi |
Açıklamalar |
---|---|---|
Önbelleğin Bayes |
Shannon'ın entropi k2 önceki ile Bayesian (Varsayılan) Tekdüzen önceki ile Bayesian Dirichlet |
Önbelleğin Bayes yalnızca kesikli veya discretized öznitelikleri kabul eder; Bu nedenle, interestingness puanı kullanamazsınız. |
Algoritması işlemini en aza indirmek için tasarlanmış saat ve verimli bir şekilde; en büyük önem düzeyindedir özniteliklerini seçin Bununla birlikte, aşağıdaki gibi parametreleri ayarlayarak algoritması tarafından kullanılan veri denetleyebilirsiniz:
Girdi kullanılan değerleri sınırlamak için MAXIMUM_INPUT_ATTRIBUTES değerini azaltın.
Modeli tarafından çözümlenebilir özniteliklerini sınırlamak için MAXIMUM_OUTPUT_ATTRIBUTES değerini azaltın.
Herhangi bir öznitelik için kabul değerleri sınırlamak için MINIMUM_STATES değerini azaltın.
Önbelleğin Bayes algoritma özelleştirme
The Microsoft Naive Bayes algorithm supports several parameters that affect the behavior, performance, and accuracy of the resulting mining model.Verileri nasıl işleneceğini denetlemek için bayrakları modelleme modeli sütunlar üzerinde de ayarlayabilir veya küme flags üzerinde araştırma yapısı belirtmek için eksik değerleri veya nasıl nulls ele alınmalıdır.
Algoritma parametreleri ayarlama
The Microsoft Naive Bayes algorithm supports several parameters that affect the performance and accuracy of the resulting mining model.Aşağıdaki tablo her parametre açıklar.
MAXIMUM_INPUT_ATTRIBUTES
Maksimum Giriş sayısı öznitelikleri belirtir önce özellik seçimi çağırır algoritma işleyebilir.Bu değeri 0 olarak ayarlandığında özellik seçimi giriş öznitelikleri için devre dışı bırakır.Varsayılan değer 255'dir.
MAXIMUM_OUTPUT_ATTRIBUTES
Önce özellik seçimi çağırır algoritma işleyebilir çıkış sayısı özniteliklerini belirtir.Bu değeri 0 olarak ayarlandığında özellik seçimi çıktı öznitelikler için devre dışı bırakır.Varsayılan değer 255'dir.
MINIMUM_DEPENDENCY_PROBABILITY
Giriş ve çıkış öznitelikleri arasında en az bağımlılık olasılığını belirtir.Bu değer algoritması tarafından oluşturulan içerik boyutunu sınırlamak için kullanılır.Bu özellik olabilir küme 0-1.Daha büyük değerler içerik modelinin öznitelik sayısını azaltın.Varsayılan değer 0,5'dir.
MAXIMUM_STATES
Algoritmasını destekler öznitelik durumları sayısı üst sınırını belirtir.öznitelik olan durumları sayısı üst sınırını durumları büyükse, algoritma özniteliğin en popüler durumlarını kullanır ve geri kalan Devletler eksik olarak değerlendirir.Varsayılan değer 100'dir.
Bayrakları modelleme
The Microsoft Decision Trees algorithm supports the following modeling flags.Araştırma yapısı veya araştırma modeli oluşturduğunuzda belirtmek için modelleme bayrakları tanımlamak nasıl değerleri her sütun çözümleme sırasında işlenir.Daha fazla bilgi için bkz: Modelleme bayrakları (veri madenciliği).
Bayrak modelleme |
Açıklama |
---|---|
MODEL_EXISTENCE_ONLY |
Sütun iki olası durumlar sahip olarak kabul edilir gelir: Eksik ve mevcut.Null değeri eksik bir değerdir. Araştırma modeli sütun uygulanır. |
BOŞ DEĞİL |
Sütun null değeri içeremez gösterir.Analysis Services null değer modeli eğitim sırasında karşılaşırsa bir hata neden olur. Araştırma yapısı sütun uygulanır. |
Gereksinimler
Önbelleğin Bayes ağacı modeli anahtar içermelidir sütun, en az bir tahmin edilebilir öznitelik ve en az bir giriş öznitelik.Sürekli öznitelik olabilir; Verileriniz sürekli sayısal veriler içeriyorsa, onu göz ardı discretized veya.
Giriş ve öngörülebilir sütunları
The Microsoft Naive Bayes algorithm supports the specific input columns and predictable columns that are listed in the following table.İçerik türleri kullanıldığında anlamları hakkında daha fazla bilgi için bir araştırma modeli, bkz: İçerik türleri (veri madenciliği).
Column |
İçerik türleri |
---|---|
Giriş öznitelik |
Döngüsel, kesikli, Discretized, anahtar, tablo ve sipariş |
Öngörülebilir öznitelik |
Döngüsel, kesikli, tablo, Discretized ve sipariş |
Not
Cyclical ve Sipariş edilmiş içerik türleri desteklenir, ancak bunları olarak ayrık değerler değerlendirir ve özel işlem gerçekleştirmek.