Share via


Modelleme bayrakları (veri madenciliği)

You can use modeling flags in SQL Server Analysis Services to provide additional information to a data mining algorithm about the data that is defined in a case table.Algoritma daha doğru verileri oluşturmak için bu bilgileri kullanabilirsiniz araştırma modeli.

Modelleme bayrakları programlı olarak tanımlamak için veri Mining Extensions (dmx) kullanabilir veya bunları veri Mining tasarımcısında tanımlayabilirsiniz Business Intelligence Development Studio. Bu bayraklar tanımlanması hakkında daha fazla bilgi için bkz: Mining modeli sütunlar.

Bazı modelleme bayrakları düzeyinde tanımlanan araştırma yapısı, oysa diğerleri araştırma modeli sütun düzeyinde tanımlanır.Örneğin, NOT NULL modelleme bayrağı birlikte kullanılırsa araştırma yapısı sütunlar.Ek modelleme bayrakları üzerinde araştırma modeli sütun tanımlayabilirsiniz.

Aşağıdaki listede desteklenen modelleme bayrakları açıklar Analysis Services.Belirli algoritmaları tarafından desteklenen bayrakları modelleme hakkında daha fazla bilgi için teknik başvurusu algoritması için konusuna bakın.

  • NOT NULL
    Öznitelik sütun değerleri hiçbir zaman null bir değer içermesi gerektiğini gösterir.Bir hata, neden Analysis Services karşılaştığı bir null değer için bu öznitelik sütun sırasında modeli eğitim süreci.

  • MODEL_EXISTENCE_ONLY
    Sütun iki durumu sahip olarak kabul edilir gösterir: Missingand Existing.Değer ise NULL, kabul olarak eksik.

    Not

    Eksik algoritması tarafından kullanılan özel bir durumudur ve metinden farklı değer "Eksik" bir sütun.Daha fazla bilgi için bkz: Değerleri eksik (Analysis Services - veri madenciliği).

    Bayrak olduğunu belirtmek için bu model oluşturma için tipik bir kullanım yeri öznitelikleri NULL durumunda örtülü bir anlamı ve değeri açık NOT NULL durumu olarak önemli olmayabilir olgu sütun hiçbir değer. olduğunuÖrneğin, [DateContractSigned] sütun olabilir NULL , bir anlaşma hiçbir zaman imzalandı ve NOT NULL anlaşma İmzalandı,.Bu nedenle, amacı modeli, bir anlaşma imzalanmış olup olmadığını tahmin etmek için tam tarih değeri yoksaymak için MODEL_EXISTENCE_ONLY bayrağını kullanabilirsiniz NOT NULL durumlarda ve yalnızca değeri olan durumlar arasında ayrım Missing veya Existing.

  • REGRESSOR
    Sütun özniteliği için öznitelik varlığını daha az önemli değerlerdir.Bu bayrak, bir araştırma modeli sütun üzerinde tanımlanır.

Not

Üçüncü taraf eklentiler tarafından tanımlanmış ek olarak diğer modelleme bayrakları olabileceğinden Analysis Services.

Görüntüleme ve değiştirme bayrakları modelleme

Veri madenciliği tasarımcısında görüntüleyin ve bir araştırma yapısı veya araştırma sütun yapısı veya modelini özelliklerini görüntüleyerek ilişkili modelleme Bayrakları değiştirin.

Yapısı sütun veya modeli sütun için modelleme bayrağı değiştirmek veya görüntülemek için

  1. De BI Development Studio, Solution Explorer'da araştırma yapısı. çift

  2. İçin küme not null modelleme bayrak'ı Mining yapısı sekmesi.

    İçin küme regressor veya MODEL_EXISTENCE_ONLY bayrak'ı Mining modeli sekmesi.

  3. Sağ sütun görüntülemek veya değiştirmek ve seçmek istediğiniz Özellikler.

  4. Yeni bir modelleme bayrak eklemek için metin kutusunun yanındaki tıklatın ModelingFlags özellik ve Seç onay kutusu veya kullanmak istediğiniz modelleme bayrakları için kutuları işaretleyin.

    Modelleme bayrakları, yalnızca sütun veri türü için uygun olmaları durumunda görüntülenir.

    Not

    Modelleme bayrağı değiştirdikten sonra modeli yeniden işleme gerekir.

dmx kullanarak bir varolan araştırma modeli ve yapısını kullanılan modelleme bayrakları değiştiremezsiniz.Araştırma STRUCTURE….ADD araştırma modeli alter sözdizimini kullanarak, yeni bir araştırma modeli oluşturmanız gerekir.

Hangi modelleme bayrakları geçerli yapısında kullanılır emin değilseniz, aşağıdaki sözdizimini kullanarak modelleme bayrakları döndüren bir sorgu oluşturabilirsiniz:

SELECT COLUMN_NAME, MODELING_FLAG
FROM $system.DMSCHEMA_MINING_STRUCTURE_COLUMNS
WHERE STRUCTURE_NAME = '<structure name>'

Bayrak modelleme regressor kullanma

Zaman, küme bir sütun üzerinde bayrak modelleme regressor, algoritma için sütun olası regressors içerdiğini belirten.Modelde kullanılan gerçek regressors algoritması tarafından belirlenir.Öngörülebilir öznitelik model, olası bir regresör atılmak.

Veri Mining Sihirbazı'nı kullanarak bir model oluştururken, tüm sürekli giriş sütunları olası regressors işaretlenir.Bu nedenle, açıkça yapmak bile küme bir sütun, sütun regresör bayrağını son modelinde bir regresör olarak kullanılabilir.

Aslında son modelinde araştırma modeli için şema satır kümesi karşı bir sorgu gerçekleştirerek aşağıdaki örnekte gösterildiği gibi kullanılan regressors belirleyebilirsiniz:

SELECT COLUMN_NAME, MODELING_FLAG
FROM $system.DMSCHEMA_MINING_columnS
WHERE MODEL_NAME = '<model name>'

Not bir araştırma modeli değiştirmek ve bir sütun içerik türü sürekli için ayrı değiştirirseniz, bayrak madenciliği sütun üzerinde el ile değiştirmek ve gerekir modeli yeniden işleme.

Regressors içindeki doğrusal regresyon modeller

Doğrusal regresyon modeller esas alan Microsoft karar ağaçlar algoritması.Kullansanız bile Microsoft doğrusal regresyon algoritması karar ağacı modeli herhangi bir ağaç veya içerebilir düğümleri temsil eden bir gerileme sürekli öznitelik.

Sürekli bir sütun bir regresör temsil ettiğini belirtmek gerekmez.The Microsoft Decision Trees algorithm will partition the dataset into regions with meaningful patterns even if you do not set the REGRESSOR flag on the column.Fark olan zaman, küme modelleme bayrak, algoritma formun regresyon denklemi bulmaya çalışır bir * C1 + b * C2 +... desenleri düğümler ağacı sığdırmak için.Kalanlar toplamı hesaplanır ve sapma çok fazlaysa, bölünmüş ağaç zorlanır.

Örneğin müşteri satın alma davranışı kullanarak tahmin etmek, gelir bir öznitelik ve sütun regressor modelleme bayrak küme, algoritma önce deneyeceği uyma gelir standart regresyon formül kullanarak değerleri.Sapma çok güzel, regresyon formül terk ve bazı diğer ağaç ayrılır öznitelik.Karar ağacı algoritma sonra deneyin uyma bir regresör gelir her bölme sonra dalları için.

Belirli bir regresör algoritma kullanacağı güvence altına almak için forced_regressor parametresini kullanabilirsiniz.Bu parametre karar ağaçlar algoritma ve doğrusal regresyon algoritması kullanılır.