ARAŞTIRMA YAPISI (DMX) OLUŞTURMA

Bir veritabanında yeni bir araştırma yapısı oluşturur ve isteğe bağlı olarak eğitim ve test bölümleri tanımlar.Araştırma yapısında oluşturduktan sonra kullandığınız ALTER ARAŞTIRMA YAPISI (DMX) deyim ekleme modelleri için araştırma yapısı.

Sözdizimi

CREATE [SESSION] MINING STRUCTURE <structure>
(
    [(<column definition list>)]
)
[WITH HOLDOUT (<holdout-specifier> [OR <holdout-specifier>])]
[REPEATABLE(<holdout seed>)]
<holdout-specifier>::=  <holdout-maxpercent> PERCENT | <holdout-maxcases> CASES

Bağımsız değişkenler

  • structure
    Yapı için benzersiz bir ad.

  • column definition list
    Sütun tanımları virgülle ayrılmış listesi.

  • holdout-maxpercent
    1 İle veri yüzdesini gösteren 100 arasında bir tamsayı küme sınamak için ayırabilirsiniz.

  • holdout-maxcases
    Sınama için kullanmanız taleplerinin en fazla sayısını gösteren bir tamsayı.

    Max durumlar için belirtilen değer giriş durumlarda sayısından büyükse, tüm giriş durumlarda sınamak için kullanılan ve bir uyarı yükseltilecektir.

    Not

    Yüzde hem de en fazla sayıda servis talebi belirtilirse, daha küçük iki sınırlarının kullanılır.

  • holdout seed
    Tohum veri bölümleme başlatmak için kullanılan bir tamsayı.

    küme 0, Tohum karma madenciliği Yapı kimliği kullanılır.

    Not

    Bir bölümü yeniden sağlamak gerekirse bir tohum belirtmeniz gerekir.

    Varsayılan: REPEATABLE(0)

Açıklamalar

Sütunların listesi belirterek, isteğe bağlı olarak sütunlar arasındaki hiyerarşik ilişkileri belirleme ve sonra isteğe bağlı olarak araştırma yapısı eğitim ve veri kümeleri sınama içine bölümleme madenciliği yapısını tanımlayın.

İsteğe bağlı oturum anahtar yapısını, yalnızca geçerli oturum süresi için kullanabileceğiniz geçici bir yapı olduğunu gösterir.Oturum sonlandırılmadan, yapısı ve tüm modeller, yapısında silinir.Geçici araştırma yapıları ve modelleri oluşturmak için gerekir küme veritabanı özelliğini AllowSessionMiningModels.Daha fazla bilgi için bkz: Veri madenciliği özellikleri.

Sütun tanım listesi

Tanımladığınız bir araştırma yapısı tarafından sütun tanım listesi her sütun için aşağıdaki bilgileri de dahil olmak üzere:

  • Adı (zorunlu)

  • Veri türü (zorunlu)

  • Dağıtım

  • Modelleme bayrakları listesi

  • İçerik türü (zorunlu)

  • (Yalnızca uygulanıyorsa, zorunlu), öznitelik sütun ilişkisi için ilgili yan tümce tümce tümce tarafından belirtilen

Tek bir sütun tanımlamak için sütun tanım listesi için aşağıdaki sözdizimini kullanın:

<column name>    <data type>    [<Distribution>]    [<Modeling Flags>]    <Content Type>    [<column relationship>]

Bir iç içe geçmiş tablo sütun tanımlamak için sütun tanım listesi için aşağıdaki sözdizimini kullanın:

<column name>    TABLE    ( <column definition list> )

Veri türleri, içerik türleri, sütun dağıtımları ve yapısı sütun tanımlamak için kullanabileceğiniz modelleme bayrakları listesi için aşağıdaki konulara bakın:

Birden çok tanımlayabilirsiniz modelleme bayrakları için bir sütun değerleri.Ancak, tek bir içerik türü ve bir sütun için bir veri türü olabilir.

Sütun ilişkiler

You can add a clause to any column definition statement to describe the relationship between two columns.Analysis Services supports the use of the following <column relationship> clause.

  • RELATED TO
    Değer hiyerarşisini gösterir.Bir anahtar sütununa bir iç içe tablo, durum satırdaki ayrı ayrı değerli bir sütun veya başka bir sütun ile daha derin bir hiyerarşi gösteren bir için ilgili yan tümce tümce, bir İLİŞKİLİ sütun hedef olabilir.

Holdout Parametreler

gizleme parametreleri belirtirken, bir bölüm veri yapısı oluşturmak.gizleme için belirlediğiniz tutar test etmek için ayrılmış ve kalan verileri eğitim için kullanılır.Varsayılan olarak, bir araştırma yapısı kullanarak oluşturursanız, Business Intelligence Development Studio, gizleme bölüm yüzde 30'u test verileri ve içerir için oluşturuluryüzde 70'inin eğitim veri. Daha fazla bilgi için bkz: Veri eğitimi ve kümeleri sınama içine bölümleme (Analysis Services - veri madenciliği).

Veri madenciliği Extensions (dmx) kullanarak bir araştırma yapısı oluşturursanız, gizleme bölüm oluşturulması el ile belirtmeniz gerekir.

Not

The ALTER MINING STRUCTURE statement does not support holdout.

En çok üç gizleme parametreleri belirtebilirsiniz.gizleme taleplerinin en büyük bir rakam ve gizleme yüzde belirtirseniz, maksimum servis taleplerini sınıra ulaşılana kadar servis taleplerinin yüzdesini ayrılmıştır.Arkasından bir tamsayı olarak gizleme yüzdesini belirtmek PERCENT , anahtar sözcük ve arkasından bir tamsayı olarak durumlarda maksimum sayısını belirtin CASES anahtar sözcüğü.Aşağıdaki örneklerde gösterildiği gibi koşullardan herhangi bir sırada birleştirebilirsiniz:

WITH HOLDOUT (20 PERCENT) 
WITH HOLDOUT (2000 CASES) 
WITH HOLDOUT (20 PERCENT OR 2000 CASES) 
WITH HOLDOUT (2000 CASES OR 20 PERCENT)

gizleme tohum rasgele durumlarda ya da eğitim veya sınama veri kümesi atar sürecinin başlangıç noktasını denetler.gizleme tohum ayarlayarak, bölüm yinelenen emin olabilirsiniz.Bir gizleme tohum belirtmezseniz, Analysis Services Araştırma yapısı oluşturma adını kullanır.tohum. Yapısını yeniden adlandırırsanız, tohum değerini değiştirir.gizleme tohum parametresi biri veya ikisi birden gizleme parametreler kullanılabilir.

Not

Bölüm bilgileri ile eğitim verileri önbelleğe kaydedildiğinden, gizleme kullanmak emin olmanız gerekir CacheMode madenciliği yapısının özellik küme için KeepTrainingData.Bu varsayılan ayarı, Analysis Services için yeni araştırma yapıları.Değiştirme CacheMode özellik için ClearTrainingCases bir gizleme içeren varolan bir araştırma yapısı işlenen herhangi bir veri madenciliği modelleri bölüm etkilemez.Ancak, MiningStructureCacheMode küme KeepTrainingData, gizleme parametreleri vardır hiçbir etkisi.Başka bir deyişle, tüm kaynak verilerini eğitim için kullanılacak ve hiçbir sınama küme kullanılabilir olur.Bölüm tanımını yapısıyla önbelleğe alınır; Eğitim servis taleplerini Önbelleği temizlemek istiyorsanız, de test veri önbelleğini ve gizleme tanımı temizlemeniz küme.

Örnekler

Aşağıdaki örnekler bir araştırma yapısı ile gizleme dmx kullanarak nasıl oluturulduunu gösterir.

Örnek 1: Bir yapı ile hiçbir Eğitim kümesi ekleme

Aşağıdaki örnek olarak adlandırılan yeni bir araştırma yapısı oluşturur New Mailing tüm ilişkili veri madenciliği modelleri oluşturmadan ve kullanmadan gizleme.Bir araştırma modeli yapısına ekleme hakkında bilgi için bkz: ALTER ARAŞTIRMA YAPISI (DMX).

CREATE MINING STRUCTURE [New Mailing]
(
    CustomerKey LONG KEY, 
    Gender TEXT DISCRETE,
    [Number Cars Owned] LONG DISCRETE,
    [Bike Buyer] LONG DISCRETE 
)

Örnek 2: Holdout yüzde ve tohum belirtme

Aşağıdaki yan tümce tümce tümce, bir araştırma yapısı ile ilişkili tüm veri madenciliği modelleri sınamak için kullanılan veri küme tanımlamak için sütun tanım listesi sonra eklenebilir.deyim olan en fazla sayıda servis talebi bir sınırı olmadan toplam giriş durumlarda yüzde 25'i sınama küme oluşturur.5000 tohum bölüm oluşturmak için kullanılır.Aynı durumlar için test seçilir bir tohum belirttiğinizde, küme her saat temel veri değişmez sürece araştırma yapısı işlemek.

CREATE MINING STRUCTURE [New Mailing]
(
    CustomerKey LONG KEY, 
    Gender TEXT DISCRETE,
    [Number Cars Owned] LONG DISCRETE,
    [Bike Buyer] LONG DISCRETE 
) 
WITH HOLDOUT(25 PERCENT) REPEATABLE(5000)

Örnek 3: Holdout yüzde ve Max durumlar belirtme

Toplam giriş durumlarda yüzde 25'i ya da 2000 servis taleplerini içeren bir sınama küme aşağıdaki yan tümce tümce tümce oluşturur, hangisi az ise.0 Tohum belirtildiğinden, araştırma yapısı adını giriş durumlarda örnekleme başlatmak için kullanılan çekirdek oluşturmak için kullanılır.

CREATE MINING STRUCTURE [New Mailing]
(
    CustomerKey LONG KEY, 
    Gender TEXT DISCRETE,
    [Number Cars Owned] LONG DISCRETE,
    [Bike Buyer] LONG DISCRETE 
) 
WITH HOLDOUT(25 PERCENT OR 2000 CASES) REPEATABLE(0)