Ders 1: Bisiklet alıcı araştırma yapısı oluşturma

Bu derste, tahmin izin veren bir araştırma yapısı oluşturacak bir potansiyel müşteri olup olmadığını Adventure Works Cycles satın bisiklet.Araştırma yapıları ve bunların veri madenciliği rolünde alışkın değilseniz, bkz: Yapıları mining (Analysis Services - veri madenciliği).

Bisiklet alıcı araştırma yapısı Bu derste oluşturacak temel ekleme veri madenciliği modelleri destekler Microsoft Kümeleme algoritmasıMicrosoft karar ağaçlar algoritması.Sonraki derslerde hangi müşterilerin gruplandırılabilir ve karar ağacı veri madenciliği modelleri potansiyel bir müşteri, bir bisiklet satın olup olmadığını tahmin etmek için kullanacağınız farklı yolları keşfetmek için kümeleme veri madenciliği modelleri kullanır.

Araştırma YAPISI deyimi oluşturma

Bir araştırma yapısı oluşturmak için kullandığınız ARAŞTIRMA YAPISI (DMX) OLUŞTURMA deyim.Kod deyim, aşağıdaki bölüm ve birimlere bölünmez:

  • Adlandırma yapısı.

  • Anahtar tanımlama sütun.

  • Araştırma sütunları tanımlama.

  • İsteğe bağlı bir sınama veri küme tanımlama.

MINING YAPISI oluşturma deyim genel bir örneği aşağıda verilmiştir:

CREATE MINING STRUCTURE [<mining structure name>]
(
    <key column>,
    <mining structure columns>
) 
WITH HOLDOUT (<holdout specifier>)

Kodun ilk satırı yapısı adını tanımlar:

CREATE MINING STRUCTURE [<mining structure name>]

Bir nesnenin içinde veri Mining Extensions (dmx) adlandırma hakkında daha fazla bilgi için bkz: Tanımlayıcılar (dmx).

Sonraki satıra kodunun anahtar tanımlar sütun araştırma yapısı için benzersiz olarak tanımladığı kaynak verileri içindeki bir varlık:

<key column>,

De araştırma yapısı , müşteri tanımlayıcısı oluşturacağınız CustomerKey, tanımlayan bir varlık, kaynak verileri.

Sonraki satıra kodunun araştırma yapısı ile ilişkili veri madenciliği modelleri tarafından kullanılan madenciliği sütunlarını tanımlamak için kullanılır:

<mining structure columns>

ayırmak işlev içinde kullanabileceğiniz <Araştırma yapısı sütunları> aşağıdaki sözdizimini kullanarak sürekli sütunları ayırmak için:

DISCRETIZE(<method>,<number of buckets>)

Discretizing sütunları hakkında daha fazla bilgi için bkz: Discretization yöntemleri (veri madenciliği).Türleri hakkında daha fazla bilgi için araştırma yapısı tanımlayabilirsiniz, sütunları görmek Araştırma yapısı sütunlar.

Kodun son satırı tanımlayan isteğe bağlı bir bölümü de araştırma yapısı:

WITH HOLDOUT (<holdout specifier>)

Veri yapısı için ilgili veri madenciliği modelleri sınamak için kullanmak üzere bir bölümünün belirtin ve kalan verileri eğitim modelleri için kullanılır.Varsayılan olarak, Analysis Services , yüzde 30'u içeren test veri küme oluşturur.tüm durum verilerini. Test veri küme durumlarda en fazla 1000 taleplerinin yüzde 30'u içermelidir belirtimi ekleyeceksiniz.Test veri küme taleplerinin yüzde 30'u 1000'den küçük ise, daha küçük tutar yer alır.

Ders görevleri

Bu derste aşağıdaki görevleri gerçekleştirecek:

  • Yeni boş bir sorgu oluşturun.

  • Araştırma yapısı oluşturmak için sorguyu değiştirebilirsiniz.

  • Sorguyu çalıştırın.

Sorgu oluşturma

Bağlanmak için ilk adımı olup bir örnek , Analysis Services ve yeni bir dmx sorgu oluşturmak SQL Server Management Studio.

sql Server Management Studio'da dmx yeni bir sorgu oluşturmak için

  1. Open SQL Server Management Studio.

  2. De sunucusuna bağlan iletişim kutusu için sunucu türü, select Analysis Services.De sunucu adı, türü LocalHost, adını yazın veya örnek , Analysis Services , istediğiniz bağlanmak için bu Ders.' I bağlanmak.

  3. De Object Explorer, sağ örnek , 'ınAnalysis Servicesüzerine gelin Yeni bir sorguve i dmx açmak için Query Editor ve yeni, boş bir sorgu.

Sorguyu değiştirme

create değiştirmek için sonraki adım olacaktır araştırma yapısı deyim yukarıda bisiklet alıcı oluşturmak için araştırma yapısı.

MINING YAPISI oluşturma deyim özelleştirmek için

  1. Sorgu Düzenleyicisi'nde, MINING YAPISI oluşturma deyim genel örneği boş sorgu kopyalayın.

  2. Aşağıdaki değiştirin:

    [<mining structure>] 
    

    ile:

    [Bike Buyer]
    
  3. Aşağıdaki değiştirin:

    <key column> 
    

    ile:

    CustomerKey LONG KEY
    
  4. Aşağıdaki değiştirin:

    <mining structure columns> 
    

    ile:

       [Age] LONG DISCRETIZED(Automatic,10),
       [Bike Buyer] LONG DISCRETE,
       [Commute Distance] TEXT DISCRETE,
       [Education] TEXT DISCRETE,
       [Gender] TEXT DISCRETE,
       [House Owner Flag] TEXT DISCRETE,
       [Marital Status] TEXT DISCRETE,
       [Number Cars Owned] LONG DISCRETE,
       [Number Children At Home] LONG DISCRETE,
       [Occupation] TEXT DISCRETE,
       [Region] TEXT DISCRETE,
       [Total Children]LONG DISCRETE,
       [Yearly Income] DOUBLE CONTINUOUS
    
  5. Aşağıdaki değiştirin:

    WITH HOLDOUT (holdout specifier>)
    

    ile:

    WITH HOLDOUT (30 PERCENT or 1000 CASES)
    

    Şimdi tam bir araştırma yapısı deyim aşağıdaki gibi olmalıdır:

    CREATE MINING STRUCTURE [Bike Buyer]
    (
       [Customer Key] LONG KEY,
       [Age]LONG DISCRETIZED(Automatic,10),
       [Bike Buyer] LONG DISCRETE,
       [Commute Distance] TEXT DISCRETE,
       [Education] TEXT DISCRETE,
       [Gender] TEXT DISCRETE,
       [House Owner Flag] TEXT DISCRETE,
       [Marital Status] TEXT DISCRETE,
       [Number Cars Owned]LONG DISCRETE,
       [Number Children At Home]LONG DISCRETE,
       [Occupation] TEXT DISCRETE,
       [Region] TEXT DISCRETE,
       [Total Children]LONG DISCRETE,
       [Yearly Income] DOUBLE CONTINUOUS
    )
    WITH HOLDOUT (30 PERCENT or 1000 CASES)
    
  6. Üzerinde Dosya menüsünde'i tıklatın DMXQuery1.dmx Farklı Kaydet.

  7. De Farklı Kaydet iletişim kutusunda uygun klasöre göz atın ve dosyayı adlandırın Bisiklet alıcı Structure.dmx.

Sorgu yürütme

Sorguyu yürütmek için son adım olacaktır.Bir sorgu oluşturup kaydettiğiniz sonra yürütülecek gerekiyor.Diğer bir deyişle, deyim sunucu üzerinde araştırma yapısı oluşturmak için çalıştırılması gerekiyor.Sorgu Düzenleyicisi'nde sorguları yürütme hakkında daha fazla bilgi için bkz: SQL Server Management Studio Veritabanı Altyapısı Sorgu Düzenleyicisi Penceresi.

Sorguyu yürütmek için

  • Sorgu Düzenleyicisi'nde araç çubuğundaki'ı Execute.

    Sorgunun durumunu görüntülenir iletileri sorgu deyim yürütme sona erdikten sonra Düzenleyicisi'nin alt sekmesi.İleti görüntülenmelidir:

    Executing the query 
    Execution complete
    

    Adlı yeni bir yapısını Bisiklet alıcı şimdi sunucu üzerinde bulunmaktadır.

Sonraki dersine yeni oluşturduğunuz yapısı için veri madenciliği modelleri ekleyeceksiniz.