Microsoft Naive Bayes algoritması Teknik Başvurusu

The Microsoft Naive Bayes algorithm is a classification algorithm provided by Microsoft SQL Server Analysis Services for use in predictive modeling.Algoritma, koşullu olasılık giriş ve öngörülebilir sütunlar arasındaki hesaplar ve sütunları bağımsız olduğunu varsayar.Cumhuriyet, bu varsayımı ad önbelleğin Bayes yol açar.

Microsoft Naive Bayes algoritma uygulaması

Bu algoritma diğerinden daha az hesaplama yoğun Microsoft algoritmalar ve bu nedenle, giriş sütunlar ve tahmin edilebilir sütun. arasındaki ilişkileri keşfetmek için veri madenciliği modelleri hızla oluşturmak için kullanılabilirAlgoritma her çifti giriş öznitelik değerleri ve çıkış öznitelik değerleri dikkate alır.

Bu belge kapsam dışındadır Bayes teoremi matematiksel özelliklerini açıklamasıdır; daha fazla bilgi için bkz: Microsoft Research başlıklı kağıt öğrenme Bayesian ağlar: Bilgi ve istatistiksel veri birleşimi.

Tüm modellerinde olasılıklar için olası değerleri eksik hesabına nasıl düzeltilir bir açıklama için bkz: Değerleri eksik (Analysis Services - veri madenciliği).

Özellik seçimi

The Microsoft Naive Bayes algorithm performs automatic feature selection to limit the number of values that are considered when building the model.Daha fazla bilgi için bkz: Özellik seçimi'veri madenciliği.

Algoritma

Analiz yöntemi

Açıklamalar

Önbelleğin Bayes

Shannon'ın entropi

k2 önceki ile Bayesian

(Varsayılan) Tekdüzen önceki ile Bayesian Dirichlet

Önbelleğin Bayes yalnızca kesikli veya discretized öznitelikleri kabul eder; Bu nedenle, interestingness puanı kullanamazsınız.

Algoritması işlemini en aza indirmek için tasarlanmış saat ve verimli bir şekilde; en büyük önem düzeyindedir özniteliklerini seçin Bununla birlikte, aşağıdaki gibi parametreleri ayarlayarak algoritması tarafından kullanılan veri denetleyebilirsiniz:

  • Girdi kullanılan değerleri sınırlamak için MAXIMUM_INPUT_ATTRIBUTES değerini azaltın.

  • Modeli tarafından çözümlenebilir özniteliklerini sınırlamak için MAXIMUM_OUTPUT_ATTRIBUTES değerini azaltın.

  • Herhangi bir öznitelik için kabul değerleri sınırlamak için MINIMUM_STATES değerini azaltın.

Önbelleğin Bayes algoritma özelleştirme

The Microsoft Naive Bayes algorithm supports several parameters that affect the behavior, performance, and accuracy of the resulting mining model.Verileri nasıl işleneceğini denetlemek için bayrakları modelleme modeli sütunlar üzerinde de ayarlayabilir veya küme flags üzerinde araştırma yapısı belirtmek için eksik değerleri veya nasıl nulls ele alınmalıdır.

Algoritma parametreleri ayarlama

The Microsoft Naive Bayes algorithm supports several parameters that affect the performance and accuracy of the resulting mining model.Aşağıdaki tablo her parametre açıklar.

  • MAXIMUM_INPUT_ATTRIBUTES
    Maksimum Giriş sayısı öznitelikleri belirtir önce özellik seçimi çağırır algoritma işleyebilir.Bu değeri 0 olarak ayarlandığında özellik seçimi giriş öznitelikleri için devre dışı bırakır.

    Varsayılan değer 255'dir.

  • MAXIMUM_OUTPUT_ATTRIBUTES
    Önce özellik seçimi çağırır algoritma işleyebilir çıkış sayısı özniteliklerini belirtir.Bu değeri 0 olarak ayarlandığında özellik seçimi çıktı öznitelikler için devre dışı bırakır.

    Varsayılan değer 255'dir.

  • MINIMUM_DEPENDENCY_PROBABILITY
    Giriş ve çıkış öznitelikleri arasında en az bağımlılık olasılığını belirtir.Bu değer algoritması tarafından oluşturulan içerik boyutunu sınırlamak için kullanılır.Bu özellik olabilir küme 0-1.Daha büyük değerler içerik modelinin öznitelik sayısını azaltın.

    Varsayılan değer 0,5'dir.

  • MAXIMUM_STATES
    Algoritmasını destekler öznitelik durumları sayısı üst sınırını belirtir.öznitelik olan durumları sayısı üst sınırını durumları büyükse, algoritma özniteliğin en popüler durumlarını kullanır ve geri kalan Devletler eksik olarak değerlendirir.

    Varsayılan değer 100'dir.

Bayrakları modelleme

The Microsoft Decision Trees algorithm supports the following modeling flags.Araştırma yapısı veya araştırma modeli oluşturduğunuzda belirtmek için modelleme bayrakları tanımlamak nasıl değerleri her sütun çözümleme sırasında işlenir.Daha fazla bilgi için bkz: Modelleme bayrakları (veri madenciliği).

Bayrak modelleme

Açıklama

MODEL_EXISTENCE_ONLY

Sütun iki olası durumlar sahip olarak kabul edilir gelir: Eksik ve mevcut.Null değeri eksik bir değerdir.

Araştırma modeli sütun uygulanır.

BOŞ DEĞİL

Sütun null değeri içeremez gösterir.Analysis Services null değer modeli eğitim sırasında karşılaşırsa bir hata neden olur.

Araştırma yapısı sütun uygulanır.

Gereksinimler

Önbelleğin Bayes ağacı modeli anahtar içermelidir sütun, en az bir tahmin edilebilir öznitelik ve en az bir giriş öznitelik.Sürekli öznitelik olabilir; Verileriniz sürekli sayısal veriler içeriyorsa, onu göz ardı discretized veya.

Giriş ve öngörülebilir sütunları

The Microsoft Naive Bayes algorithm supports the specific input columns and predictable columns that are listed in the following table.İçerik türleri kullanıldığında anlamları hakkında daha fazla bilgi için bir araştırma modeli, bkz: İçerik türleri (veri madenciliği).

Column

İçerik türleri

Giriş öznitelik

Döngüsel, kesikli, Discretized, anahtar, tablo ve sipariş

Öngörülebilir öznitelik

Döngüsel, kesikli, tablo, Discretized ve sipariş

Not

Cyclical ve Sipariş edilmiş içerik türleri desteklenir, ancak bunları olarak ayrık değerler değerlendirir ve özel işlem gerçekleştirmek.