Aracılığıyla paylaş


Karşılıklı doğrulama sekmesi (madenciliği doğruluğu Grafiği görünümü)

Çapraz doğrulama cross-sections bir araştırma yapısı bölümlemek ve inventory eğitmek ve modelleri her Kesiti karşı test sağlar.You specify a number of folds to divide the data into, and each fold is used in turn as the test data, whereas the remaining data is used to train a new model.Analysis Services then generates a set of standard accuracy metrics for each model.Her Kesiti için oluşturulan modelleri için ölçümleri karşılaştırarak, nasıl güvenilir araştırma modeli tam veri küme için iyi bir fikir edinebilirsiniz.

Daha fazla bilgi için bkz: Karşılıklı doğrulama (- Analysis Services veri madenciliği).

Not

Çapraz doğrulama kullanılarak oluşturulan modelleri ile kullanılamaz Microsoft zaman Series algoritması veya Microsoft sırası kümeleme algoritması.Bu tür modelleri içeren bir araştırma yapısı raporu çalıştırırsanız, modelleri rapora dahil edilmez.

  • Hatları sayısını belirtin.

  • Durumlarda çapraz doğrulama için kullanılacak maksimum sayısını belirtin.

  • Belirtmek tahmin edilebilir sütun.

  • İsteğe bağlı olarak tahmin edilebilir durumu belirtin.

  • İsteğe bağlı olarak, küme nasıl öngörü doğruluğunu kısmını kontrol parametreleri.

  • ' I sonuçlar almak çapraz doğrulama sonuçlarını görüntülemek için.

  • Count Katlama
    Hatları veya oluşturmak için bölümler sayısını belirtin.En düşük değer 2 ' dir yani yarım veri küme sınama ve yarısı eğitim için kullanılır.

    10 Oturum araştırma yapıları için en büyük değerdir.

    Araştırma yapısı depolanıyorsa en fazla 256 değerdir bir örnek , Analysis Services.

    Not

    Hatları, sayısı arttıkça saat yani gereken benzer şekilde çapraz doğrulama gerçekleştirmek için n ile artar.Servis talebi sayısı büyükse, performans sorunları ve değerinin karşılaşabilirsiniz Count Katlama de büyük.

  • Max durumlar
    Durumlarda çapraz doğrulama için kullanılacak maksimum sayısını belirtin.Herhangi belirli Katlanmış durumda sayısı eşittir Max durumlarda değeri bölünmüş olarak Count Katlama değer.

    Kullanırsanız, 0, kaynak verilerin tüm durumlarda çapraz doğrulama için kullanılır.

    Varsayılan değer yoktur.

    Not

    Servis talebi sayısı arttıkça, işlem saat de artar.

  • Hedef öznitelik
    Seçin bir sütun listesinden öngörülebilir sütuns tüm modellerinde buldu.Yalnızca birini seçebileceğiniz tahmin edilebilir sütun çapraz doğrulama gerçekleştirmek her saat.

    Modelleri kümeleme yalnızca sınamak için seçin Küme.

  • Hedef durumu
    Bir değer yazın veya bir hedef değer değerleri kapalı açılan listeden seçin.

    Varsayılan değer null, test edilecek olan tüm durumlarını gösteren.

    Modelleri kümeleme için devre dışı.

  • Hedef eşiği
    0 Ve üzerinde öngörülen durumu doğru olarak kabul edilen tahmin olasılık gösterir 1 arasında bir değer belirleyin.Değeri olabilir küme 0,1 halinde.

    Varsayılan değer null, en olası tahmin doğru olarak sayılır gösteren.

    Not

    Değeri 0.0 için ayarlayabilirsiniz, ancak bu değeri kullanarak işleme artacağı saat ve anlamlı sonuçlar elde edebilecekleri.

  • Sonuçları Al
    Çapraz doğrulama modelinin belirlenen parametreleri kullanarak başlatmak için tıklatın.

    Model Katlama belirtilen sayıya bölümlendirilir ve her kat için ayrı bir modeli sınanır.Bu nedenle, bu sonuçlar döndürmek çapraz doğrulama için biraz saat alabilir.

Çapraz doğrulama raporu sonuçlar yorumlama hakkında daha fazla bilgi için bkz: Karşılıklı doğrulama raporu (Analysis Services - veri madenciliği).

Doğruluk eşik ayarlama

Ölçmek için standart kontrol edebilirsiniz tahmin için bir değer ayarlayarak doğruluğu hedef eşiği.Bir eşik doğruluğu çubuğu türünü temsil eder.Her tahmini olasılık Tahmin edilebileceği doğru değer atanır.Bu nedenle, varsa, küme hedef eşiği yakın değer 1, size, gerek olasılık için iyi bir öngörü sayılması için oldukça yüksek olması belirli bir öngörü.Bunun tersi olarak, varsa, küme hedef eşiği ile daha düşük bir olasılık değerleri 0, hatta Öngörüler yakın "iyi" sayılan Öngörüler.

Çünkü önerilen eşik değer yoktur herhangi bir olasılık tahmin veri miktarına ve türüne bağlıdır tahmin yapmakta olan.Farklı olasılık düzeylerinde bir verileriniz için uygun doğruluğu çubuğu belirlemek için bazı Öngörüler gözden geçirmelidir.Çünkü bunu yapmak önemlidir değeri, sizin küme için hedef eşiği ölçülen modeli doğruluğunu etkiler.

Örneğin, üç varsayalım tahmins yapılan belirli hedef durumu ve her bir olasılıklar tahmin 0,05 0,15 ve 0,8 olduğunu.Varsa, küme 0,5, yalnızca bir tahmin için Eşik doğru olacak şekilde hesaplanır.Varsa, küme hedef eşiği 0,10 için iki Öngörüler doğru olacak şekilde sayılır.

Zaman hedef eşiği olan küme için null, varsayılan değer olduğu, her durum için en olası tahmin doğru olarak sayılan.Örnekte, yalnızca bildirilmiş 0,05 0,15 ve 0,8 üç farklı durumlarda Öngörüler için olasılıklar var.Olasılıklar çok farklı olsa da, her tahmin doğru olarak nedeni sayılması her durum yalnızca bir öngörü ve bunlar en iyi Öngörüler bunlar için oluşturduğu durums.